A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula 9. Regressão Linear Simples. Qualidade de modelo

Apresentações semelhantes


Apresentação em tema: "Aula 9. Regressão Linear Simples. Qualidade de modelo "— Transcrição da apresentação:

1 Aula 9. Regressão Linear Simples. Qualidade de modelo 𝑅 2
1. C.Dougherty “Introduction to Econometrics” 2. Capítulo 16. Bussab&Morettin “Estatística Básica” 7ª Edição

2 amostra Modelo – relação entre variável x e y y = F(x) ? população termo de perturbação – parte aleatória do modelo Modelo: F(x) é simples linear parte não aleatória termo de perturbação – omissão de variável explicative – agregação de variáveis – espicificação incorreta do modelo – espicificação incorreta de dependência funcional – erros de medição

3 Estimação de parâmetros. Método de mínimos quadrados
x y observações objeto de estudo, por exemplo x é renda familiar y é gasto em alimentos x y ? ? mas parâmetros são desconhecidos

4 Estimação de parâmetros. Método de mínimos quadrados
verdadeiro como? estimação x y desvio (erro) ideia – minimirar soma total dos erros realizamos – minimizar soma total de quadrados dos erros

5 Estimação de parâmetros. Método de mínimos quadrados
achar a e b tais que SS(a, b) possue o valor minimo possível

6 Estimação de parâmetros. Método de mínimos quadrados

7 Estimação de parâmetros. Método de mínimos quadrados
Media de x e a média de y estão na reta de regressão: x y

8 Interpretação de equação de regressão
verdadeiro estimação FOOD = DPI FOODnew = (DPI+1) = FOOD literalmente, o coeficiente de Inclinação significa que se x aumenta em uma unidade então y aumenta em 0.097 As duas variável são em $billion, por isso se a renda aumenta em 1$billion então gasto em alimentos aumenta em média em 97$milhões. Em outras palavras, para cada aumento da renda em 1$ o gasto em alimentos aumenta em 9.7 cents. Constante? Literalmente, ela mostra o valor do y quando x = 0. As vezes isso pode levar a alguma interpretação adequada, mas não nesse caso.

9 Modelo estatístico parte aleatória do modelo Gauss-Markov conditions 1. 𝐸[𝜀𝑖] = 0 para todos os 𝑖=1,…,𝑛 2. 𝐷[𝜀𝑖 ] = 𝜎2 para todos os 𝑖=1,…,𝑛 (homoscedasticidade) 3. 𝜀𝑖 são independentes 𝑐𝑜𝑣(𝜀𝑖, 𝜀𝑗) = 0 para todos os 𝑖≠𝑗 4. 𝜀𝑖 não depende do 𝑥𝑖 são independentes – termo de perturbação não depende de variáveis explicativas OBS: em curso vamos considerar 𝑥 como constante 5. 𝜀𝑖 tem distribuição normal 𝜀𝑖 são i.i.d. 𝜀𝑖≈𝑁(0, 𝜎2) 𝜀 e 𝑥 são independentes

10 Propriedades estatísticas de coeficientes
𝑎 e 𝑏 são não viesados: EX.DOMÉSTICO: provar que a não viesado

11 Propriedades estatísticas de coeficientes
como estimar a variância de termo de perturbação? um candidato para estimar e é Mas Var(e) é viesado: sub-estima a variação verdareira não viesado

12 Propriedades estatísticas de coeficientes
menor σ → menor variação de b maior Var(x) → menor variação de b

13 Propriedades estatísticas de coeficientes

14 Teste de hipótese FOOD = DPI (s.e.) (3.48) (0.0043) 𝑎 e 𝑏 são estatisticamente significados? estatística do teste é graus de liberdade 𝑛 – 2 = 25 – 2 = 23 valor critico de 5% bilateral é 2.069

15 Teste de hipótese saida do programa R Call: lm(formula = x$FOOD ~ x$DPI) Residuals: Min Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) e-13 *** x$DPI < 2e-16 *** --- Signif. codes: 0 ‘***’ ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: on 23 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 23 DF, p-value: < 2.2e-16

16 Teste de hipótese Supomos que taxa percentual da inflação de preços depende da taxa percentual da inflação salarial de accordo com o modelo linear: Nos podemos supor tambem que na realidade a taxa pecentual da inflação de preços é igual à taxa percentual da inflação salarial. Em estudo longo de 20 anos (20 observações) o modelo de regressão obtida é estatística do teste correspondente nesse caso é graus de liberade n – 2 = 20 – 2 = 18 e o valor crítico é 2.101

17 população qualidade de modelo é a significância de coeficientes a e b qualidade de modelo “inteiro” em “total” ? podemos analizar variação de dados – se o modelo explica bem a variação total de dados ANOVA e qualidade de ajuste (goodness of fit) R2

18 ? ANOVA, e qualidade de ajuste (goodness of fit) R2 variação total:
variação de dados ajustados: ? variação “não explicada”, erro:

19 ANOVA, e qualidade de ajuste (goodness of fit) R2
ou

20 ANOVA, e qualidade de ajuste (goodness of fit) R2
n número de observações k numero de parâmtros Tabela ANOVA para modelo de regressão causas de variação graus de liberades soma quadrados quadrados médios nível descritivo F-estatística MSSReg MSSErro Regressão k -1 SSReg MSSReg=SSReg/(k-1) p Resíduo n - k SSErro MSSErro=SSErro/(n - k) Total n -1 SSTotal Tabela ANOVA para modelo de regressão caso k=2 causas de variação graus de liberades soma quadrados quadrados médios nível descritivo F-estatística SSReg s2e Regressão 1 SSReg MSSReg=SSReg p Resíduo n - 2 SSErro SSErro/(n - 2)=s2e Total n -1 SSTotal

21 ANOVA, e qualidade de ajuste (goodness of fit) R2
Tambem podemos medir o lucro relativo que se ganha ao introduzir o modelo, usando a estatística que chama se coeficiente de determinação (coefficient of determination) F estatistica de análise de variância pode ser representada em modo alternativo em caso k = 2

22 ANOVA, e qualidade de ajuste (goodness of fit) R2
saida do programa R Call: lm(formula = x$FOOD ~ x$DPI) Residuals: Min Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) e-13 *** x$DPI < 2e-16 *** --- Signif. codes: 0 ‘***’ ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: on 23 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 23 DF, p-value: < 2.2e-16 F=23*R2/(1-R2)=23*0.9553/( )= R-squared: F=23*R2/(1-R2)=23* /( )=

23 F-estatística (ANOVA)? t-estatística?
Teste de hipóteses Qual hipótese testa F-estatística (ANOVA)? t-estatística? testes tem que ser equivalentes Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) e-13 *** x$DPI < 2e-16 *** --- Signif. codes: 0 ‘***’ ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: on 23 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 23 DF, p-value: < 2.2e-16 22.162=491.1

24 Modelos não lineares que podem ser estimados atraves de regressão linear
Transformação básica: consumo anual de bananas (y) salario anual (x) foram oservadas 10 familias y = x R2 = 0.64 (s.e.) (1.23) (0.20) coeficiente estao significantes construimos gráfico:

25 Modelos não lineares que podem ser estimados atraves de regressão linear
z = 1 / x y = x R2 = 0.64 (s.e.) (1.23) (0.20) y = z R2 = (s.e.) (0.04) (0.12)

26 Modelos não lineares que podem ser estimados atraves de regressão linear
Transformação logaritmica. se a elasticidade de y ao respeito de x é constante, entao usaremos a função potência. Elasticidade de y ao respeito da variável x é, pela definição, incremento proporcional de y pelo dado incremento proporcional de x

27 Modelos não lineares que podem ser estimados atraves de regressão linear
Transformação logaritmica. para o periodo in EU a curva de Engel foi aplicada para gastos em alimentos (y) em relação ao salario (x). A regressão realizada é ln y = ln x transformando pela função potência temos y = e1.20 x0.55 = 3.32 x0.55 esse resultado sugere que elasticidade de demanda de alimentos em relacão ao salario é 0.55, o que significa que aumento em 1% de salario leva ao aumento de demanda de alimentos em 0.55%. Fator multiplicativo 3.32 não tem a interpretação direta. Esse valor ajuda prever o valor de y quando valor do x é dado

28 Modelos não lineares que podem ser estimados atraves de regressão linear
Trend exponencial. Incremento absoluto em y pela unidade de tempo é dada por Incremento proporcional em y pela unidade de tempo é dada por Incremento proporcional em y pela unidade de tempo (taxa) é constante

29 Modelos não lineares que podem ser estimados atraves de regressão linear
Trend exponencial. para o periodo in EU a curva de trendo exponencial foi aplicada para gastos em alimentos (y). A regressão realizada é ln y = T transformando pela função potência temos y = e4.58 e0.02 T = 97.5 e0.02 T esse resultado sugere que os gastos em alimentos cresce com a taxa de 2% ao ano desta vez constante pode ter interpretação: ela mostra quanto foi gasto em alimentos em ano calendario 1958 (o que corresponde T = 0) que deu $97.5 bilhões.

30 Referencias: C.Dougherty’s course internet access:


Carregar ppt "Aula 9. Regressão Linear Simples. Qualidade de modelo "

Apresentações semelhantes


Anúncios Google