Regressão Linear.

Regressão Linear

Introdução Objectivos da regressão linear:
Mostrar de que forma as variáveis independentes explicam as variáveis dependentes. Fazer previsões sobre as variáveis dependentes a partir dos valores das independentes. A relação linear entre duas variáveis contínuas pode ser aferida através do coeficiente de correlação ou do modelo de regressão linear.

Procedimentos Deve construir-se um quadro – diagrama de dispersão – a partir dos pares de valores (X,Y) de variáveis independente e dependente. Funções do diagrama de dispersão: Ajudar a determinar se existe relação entre as variáveis. Permitir identificar a equação matemática mais apropriada para descrever essa relação (linear, exponencial, logarítmica, potência, etc.).

Relação linear A relação linear entre duas variáveis pode ser descrita através da equação: Em que: Y = variável dependente X = variável independente  = variável residual (inclui factores exteriores ao modelo e erros de medição)  = parâmetro ordenada na origem  = parâmetro declive

Relação linear Cada valor observado para a variável dependente pode ser decomposto numa soma de três factores:  = um valor constante. X = o efeito da variável independente.  = o efeito de uma variável residual, que impede uma relação linear perfeita entre X e Y.

Recta de regressão O método dos mínimos quadrados permite o ajustamento de uma linha recta aos dados observados, de modo a minimizar os efeitos da variável residual. A recta ajustada a um conjunto de valores amostrais terá a forma: Onde os efeitos da variável residual foram anulados.

Parâmetros são os estimadores dos parâmetros  e .
Calculam-se do seguinte modo:

Parâmetros pode também calcular-se como: Onde:

Exemplo Pretende ajustar-se um modelo de regressão linear simples aos dados observados para 10 consumidores do sexo masculino da cidade de Lisboa, referentes aos seus rendimentos médios mensais (variável independente) e às despesas mensais em bebidas alcoólicas (variável dependente). Consulte esta tabela

Exemplo Efectua-se o cálculo dos parâmetros:

Interpretação dos resultados
A estimativa encontrada para o parâmetro  significa que, independentemente do rendimento mensal auferido, os consumidores masculinos da cidade de Lisboa gastam 6,16 € em bebidas alcoólicas mensalmente. A estimativa de 0,093 para o parâmetro  indica que, por cada 100€ de variação no rendimento dos consumidores, as despesas em bebidas alcoólicas variam 9,3€, estando as duas variáveis associadas positivamente, ou seja, um aumento no rendimento implica um aumento no consumo de bebidas alcoólicas.

Coeficiente de correlação
O coeficiente de correlação é uma medida do grau de associação linear entre as duas variáveis (dependente e independente). É obtido a partir da relação entre o desvio explicado e o desvio total.

Coeficiente de determinação
A relação directa entre o desvio explicado e o desvio total é o coeficiente de determinação, que indica o grau de aderência do ajustamento feito através do método de mínimos quadrados. Varia entre 0% (mínimo) e 100% (máximo).

Coeficiente de correlação de Pearson
O coeficiente de correlação linear r (raiz quadrada positiva do coeficiente de determinação) é uma medida do grau de associação linear entre variáveis. Toma valores entre –1 e +1.

SPSS No SPSS, os dados deverão ser introduzidos da seguintes forma:
Consulte esta tabela Depois, seleccionar nos menus: Analyze  Regression  Linear

SPSS Seleccionar as variáveis dependente e independente:

SPSS Obtém-se o seguinte quadro de respostas:
Ordenada na origem Declive Consulte esta tabela De onde se extraem os valores de 6,163 e 0,093 para  e , respectivamente.

SPSS - Gráfico · Na barra de menus escolher: Graphs  Scatter…
Graphs  Scatter… · Seleccionar Simple e premir Define. · Seleccionar a variável dependente para o eixo Y. · Seleccionar a variável independente para o eixo X. · Em Label Cases by colocar o nome da variável que vai identificar os pontos nos gráficos.

SPSS - Gráfico A janela deverá ser preenchida da seguinte forma:

SPSS - Gráfico Para identificar os pontos, editar o gráfico e usar a opção Point ID. O resultado é o seguinte:

SPSS – Regra de regressão
Para visualizar a recta de regressão, escolher na barra de menus: Chart  Options… · Em Fit Line escolher Total. Em Fit Options escolher Linear regression. Para visualizar o erro quadrático, escolher na barra de menus: · Em Fit Options escolher Display R-square in legend.

SPSS – Escala Para alterar a gama de valores representados, escolher na barra de menus: Chart  Axis… Para a gama do eixo X, escolher X scale. Modificar, então, os valores mínimo e máximo de Range. Para a gama do eixo Y, proceder do mesmo modo.

SPSS – Gráfico Ordenada na origem

SPSS – Valores previstos e valores residuais
Os valores previstos pela recta são diferentes dos valores reais para cada caso. A diferença entre os dois constitui o valor residual. O SPSS calcula os valores previstos pelo modelo linear, assim como os valores residuais. · Na caixa de diálogo Linear Regression escolher a opção Save. · Em Predicted Values e Residuals seleccionar as opções Unstandardized.

Premir, depois, o botão Continue.

São geradas as variáveis pre_1 e res_1, respectivamente, com os valores previstos e residuais para cada caso. É possível visualizar os valores previstos junto dos valores reais. · Na barra de menus escolher: Analyze  Reports  Case Summaries… · Seleccionar as variáveis a analisar e movê-las para a lista de variáveis.

Valores previstos pelo modelo Valores residuais

Neste caso, o modelo afirma que: alcool =  0,0930  rendim + 6,163 expressão a partir da qual se podem calcular os valores previstos pelo modelo e respectivos valores residuais.

SPSS – Coeficiente de correlação
A tabela seguinte, apresentada como um dos resultados do cálculo de regressão linear, dá-nos o valor do coeficiente de correlação (R), assim como o seu quadrado (R Square). Coeficiente de correlação Proporção de variação explicada pelo modelo Dois gráficos, para duas situações distintas, podem ter os mesmos valores de declive e ordenada na origem. No entanto, aquele que apresentar o maior coeficiente de correlação é o que melhor se adapta à realidade modelada.

Regressão linear múltipla
Tem como objectivo desenvolver um modelo de relações entre uma variável dependente e um conjunto de variáveis independentes, de tal modo que os valores da primeira possam ser explicados – e que previsões possam ser feitas – com base nos valores do segundo conjunto de variáveis.

Cálculo dos coeficientes de regressão
Para simplicidade de exposição, considere-se que Y depende apenas dos valores assumidos por duas variáveis X1 e X2. Que dá origem a:

Método dos mínimos quadrados
O método dos mínimos quadrados permite-nos encontrar os estimadores pretendidos. A aplicação deste método fornece-nos três equações para a determinação de (1) (2) (3)

Resolução A primeira destas equações pode ser escrita como: (4) ou (5)

Resolução Substituindo (5) em (2), obtém-se: (6)

Resolução Torna-se necessário definir seis somas de quadrados (SS):

Resolução Usando a notação de soma de quadrados é possível rescrever as equações (6) e (3): (7) (8) A resolução deste sistema de equações permite obter Depois, estima-se o valor de  a partir da equação (5).

Resumo da resolução Os passos necessários para encontrar os estimadores de mínimos quadrados, num modelo de regressão linear com duas variáveis independentes, podem ser resumidos do seguinte modo:

Regressão Linear.

Apresentações semelhantes

Apresentação em tema: "Regressão Linear."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Regressão Linear.

Apresentações semelhantes

Apresentação em tema: "Regressão Linear."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback