A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Regressão Linear Simples

Apresentações semelhantes


Apresentação em tema: "Regressão Linear Simples"— Transcrição da apresentação:

1 Estatística Econômica II: Regressão Linear e Análise de Variância ANO 2015

2 Regressão Linear Simples
Análise de Regressão “método estatístico que utiliza a relação entre duas ou mais variáveis de modo que uma variável pode ser estimada (ou predita) a partir da outra ou das outras” relação Neter, J. et al. Applied Linear Statistical Models. McGraw Hill, 1996

3 Relação funcional x Relação estatística
As variáveis podem possuir dois tipos de relações: Funcional: a relação é expressa por uma fórmula matemática: Y = f(X) Ex: relação entre o perímetro (P) e o lado de um quadrado (L) P = 4 L Todos os pontos caem na curva da relação funcional

4 Relação funcional x Relação estatística
Estatística: não há uma relação perfeita como no caso da relação funcional. As observações em geral não caem exatamente na curva da relação. Ex: relação entre o peso (P) e a altura (A) de uma pessoa A existência de uma relação estatística entre a variável dependente Y e a variável independente X não implica que Y dependa de X, ou que exista uma relação de causa-efeito entre X e Y.

5 Medida de Associação r = 0,9 r = 0,3 r = 0
X Y X Y X Y r = 0,9 r = 0,3 r = 0 Coeficiente de Correlação (de Pearson) mede o grau de relação linear entre X e Y X Y r = - 0,9

6 Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação Um alto coeficiente de correlação nem sempre indica que a equação de regressão estimada está bem ajustada aos dados. ? X Y X Y X Y X Y ? Y X

7 Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação Um coeficiente de correlação próximo de zero nem sempre indica que X e Y não são relacionadas. X Y A X Y X Y X Y B

8 Regressão Linear Simples
Análise de Regressão Determinar como duas ou mais variáveis se relacionam. Estimar a função que determina a relação entre as variáveis. Usar a equação ajustada para prever valores da variável dependente. Regressão Linear Simples Yi = 0 + 1Xi + i

9 Modelo de Regressão Linear Simples
Y i E(Y) = 0 + 1 X 1 Coeficiente angular b0 Inclinação populacional Intercepto populacional X Erro Aleatório Variável Dependente Variável Independente

10 Estimação dos parâmetros
Em geral não se conhece os valores de 0, 1 e 2 Eles podem ser estimados através de dados obtidos por amostras. O método utilizado na estimação dos parâmetros é o método dos mínimos quadrados, o qual considera os desvios dos Yi de seu valor esperado: i = Yi – (0 + 1 Xi) Em particular, o método dos mínimos quadrados requer que consideremos a soma dos n desvios quadrados, denotado por Q:

11 Estimação dos parâmetros
De acordo com o método dos mínimos quadrados, os estimadores de 0 e 1 são aqueles, denotados por b0 e b1, que tornam mínimo o valor de Q. Derivando Igualando-se essas equações a zero obtém-se os valores b0 e b1 que minimizam Q: (resíduo)

12 Propriedades da equação de regressão
1) 2) é mínima 3) 4) A reta de regressão passa sempre pelo ponto X Y

13 Estimação da Variância do Erro (2)
A variância dos erros i,, denotada por 2, é um parâmetro do modelo de regressão, e necessita ser estimada. A variância de uma v.a. qualquer é calculada pela soma dos desvios quadráticos dividido pelo no de graus de liberdade. O cálculo da variância 2 é feito da mesma maneira. É importante notar que a variância dos Yi é também 2. Entretanto, cada Yi vêm de distribuições de probabilidade diferentes, com diferentes médias dependendo do nível de Xi. Assim, os desvios de Yi devem ser calculados em torno de sua própria média estimada , e a soma dos quadrados, denominada soma de quadrados dos resíduos será:

14 Estimação da Variância do Erro (2)
Soma de quadrados dos resíduos (SQRes): A soma dos quadrados dos resíduos tem n – 2 graus de liberdade, pois 2 graus de liberdade foram perdidos por estimar b0 e b1. Portanto, o estimador de 2, denominado de Quadrado Médio do Resíduo (QMRes), é dado pela razão entre a soma dos quadrados dos resíduos e (n – 2): Pode ser demonstrado que:

15 Inferência em Análise de Regressão
Considere o modelo: Yi = 0 + 1 Xi + i  ~ N(0; 2) e COV (i,j)= 0 IC para 0 e 1 IC para Ynovo 0 = 0 ? 1 = 0 ? (teste de hipótese) X Y ? se H0 verdadeira E(t) = 0 se H0 falso E(t) <<<< 0

16 Abordagem da Análise de Variância na Análise de Regressão
Y Yi SQTo = SQReg SQRes Coeficiente de determinação 0  R2  1 Interpretação: R2 mede a fração da variação total de Y explicada pela regressão. X

17 Abordagem da Análise de Variância na Análise de Regressão
se H0 verdadeiro E(F) = 1 se H0 falso E(F) >>>> 1

18 Análise de Regressão no EXCEL
Y 1 1.1 2 1.9 3 2.5 4 4.3 5 6.1 6 6.3 7 7.8 8 7.0 9 9.1 s valor-P s2 OBS: Para regressão linear simples: teste F = teste t bilateral F = t2

19 Modelos Linearizáveis
Modelo Padrão: Yi = 0 + 1Xi + i exponencial potencial logaritmo potência inverso

20 Análise de Resíduos Resíduo =

21 Análise de Resíduos Resíduo Padronizado =

22 Análise de Resíduos “ideal” 2 não constante não linearidade “outlier”
não independência tempo

23 Regressão passando pela origem (0 = 0)
(R2 pode ser negativo!)


Carregar ppt "Regressão Linear Simples"

Apresentações semelhantes


Anúncios Google