Análise de regressão múltipla

Slides:



Advertisements
Apresentações semelhantes
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Advertisements

6. Andando na Superfície de Resposta Técnica de otimização baseada em planejamentos fatoriais Etapas distintas: Modelagem e deslocamento Modelagem: ajuste.
O Processo de Poisson Série: Processos Estocásticos Disciplina: Métodos Matemáticos 1C Dennis S. Poisson, Sceaux, France.
1 PROCESSO DE MODELAGEM Modelo Mental: para a solução de problemas simples Reconhecimento do Problema Criação de Alternativas Avaliação de Alternativas.
Prof. Thiago Costa ADMINISTRAÇÃO DA PRODUÇÃO II TEORIA DA PREVISÃO DOS ESTOQUES.
Introdução e Conceitos.
Introdução à prática da
Medições – parte I: Precisão.
ESTATÍSTICA AULA 15 Testes de hipóteses – Unidade 10
Testes de Hipóteses.
ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7
Probabilidade e Estatística Aplicadas à Contabilidade II
Análise Discriminante
Estatística Bivariada
Estatística para Cursos de Engenharia e Informática
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Teste de Hipótese Camilo Daleles Rennó
RODOLFO SOARES TEIXEIRA OBMEP NA ESCOLA
Estimação de Parâmetros – Unidade 9 Professor Marcelo Menezes Reis
Regressão com uma variável dependente Binária
ADSD Introdução.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis.
Epidemiologia Analítica
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
Modelos de Equações simultâneas
Sistemas Prof. Luis S. B. Marques MINISTÉRIO DA EDUCAÇÃO
Estimação de Máxima Verossimilhança
Modelos de variáveis qualitativas dependentes
Regressão Linear Múltipla
Pesquisa em Psicologia
Objetividade É um acordo entre juízes especialistas relativo ao que é observado, ou o que deve ser ou o que foi feito em pesquisa Quanto maior a objetividade.
Curso de Medicina/Nutrição Ms.Rosebel Trindade Cunha Prates
C C C Cliente PREVISÃO DE DEMANDA
Oferta de Trabalho Aula 1
Variáveis instrumentais
Multicolinearidade Referências: capítulo 10 (Gujarati)
Profa. Dra. Geciane Silveira Porto
Análise de Regressão Ajuste de Parâmetros.
Análise de regressão múltipla
Econometria Heterocedasticidade Consequências da violação
Metodologia Científica
Probabilidade e Estatística Aplicadas à Contabilidade II
Cap 28 – O oligopólio Parte I 9ª edição.
DISTRIBUIÇÕES AMOSTRAIS
7 Resultados de Medições Indiretas
Física Experimental IV – aula 5
Enfoque sistêmico na agricultura Fundamentos Estatísticos
ANOVA.
Amostragem e estimadores
FUNDAMENTOS DA ESTATÍSTICA
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Revisão de inferência.
ANÁLISE DE VARIÂNCIA (ANOVA)
Controlando por covariadas
Unidade 6 – Desenho da amostra Aspectos técnicos
Mestrado Profissional em Física Médica
INTEGRAÇÃO POR SUBSTITUIÇÃO
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Aplicação do Modelo de Regressão no Processo de Produção de Gasolina
Prof. Antonio Lopo Martinez
A física é uma ciência experimental
Projecto Teórico Científico
...semana que vem: laboratório!
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Intervalo de Confiança Camilo Daleles Rennó
Aula 13 Goodies* * Goodies related to animals, plants and numbers…
Probabilidade e Estatística Aplicadas à Contabilidade II
Técnicas de análise da conjuntura
SER 301 – Análise Espacial de Dados Geográficos
Análise ESTÁTICA COMPARATIVA
Cap 28 – O oligopólio Parte I 9ª edição.
Transcrição da apresentação:

Análise de regressão múltipla y = b0 + b1x1 + b2x2 + . . . bkxk + u Problemas de especificação (capitulo 9 – Wooldridge)

Correlação entre o termo de erro e uma ou mais variáveis explicativas Variável endógena e exógena Má especificação da forma funcional: variável omitida é função de uma variável explicativa do modelo. Erro de Medida

Má especificação da Forma funcional Modelo sofre de má especificação da forma funcional quando não explica de maneira apropriada a relação entres as variáveis explicativas e a dependente. Viés se forem importantes

Má especificação da Forma funcional Omissão de funções de variáveis independentes: como existência de relações não lineares: formas quadráticas dos x’s Logs interações dos x’s Temos dados de todas as variáveis necessárias para obter uma relação funcional que se ajuste bem aos dados. Como sabemos se temos a forma funcional apropriada para o nosso modelo?

Forma funcional Guia – teoria econômica Interpretação Faz mais sentido que x afete y em % (usar logs) ou em termos absolutos? Faz sentido que a derivada de x1 varie com seu nivel (termo quadrático) ou com x2 (interação) ou seja fixa?

Cada um dos termos quadráticos é significativo e juntos são muito significates (F=31,37, p-valor próximo de zero)

Forma funcional Teste de significância conjunta das interações e dos termos quadráticos. Um teste de especificação conhecido é o teste RESET (teste de especificação de Ramsey) – teste de erro de especificação da regressão.

RESET RESET Ao invés de adicionarmos termos dos x’s diretamente, adicionamos e testamos funções do ŷ Estimamos y = b0 + b1x1 + … + bkxk + d1ŷ2 + d1ŷ3 +erro e testamos: H0: d1 = 0, d2 = 0 F~F2,n-k-3 or LM~χ22 O modelo anterior está corretamente especificado.

RESET Equação estranha: mas o interesse não é nos parâmetros estimados, apenas a usamos para testar se há não linearidades importantes ausentes. Se rejeito a hipótese nula, ou seja, encontro uma estatística F significante, existe algum problema de forma funcional.

Exemplo Modelo para preço dos imóveis: Em nível Em log Teste reset Banco hprice.gdt

Nivel

Log

Teste RESET Modelo 1 Modelo 2

Teste RESET Desvantagem: não fornece uma orientação prática de como proceder se o modelo for rejeitado. É somente teste da forma funcional!!

Testes contra alternativas não aninhadas Como são modelos não aninhados, não conseguimos usar um teste F padrão.

Testes contra alternativas não aninhadas Teste Mizon e Richard (1986): construir um modelo abrangente: Testar se:

Testes contra alternativas não aninhadas Teste de Davidson-MacKinnon: se o primeiro modelo for verdadeiro, então os valores estimados do 2º. Modelo devem ser não significantes no 1º. Modelo. E vice-versa.

Teste de Davidson - MacKinnon Estima o modelo abaixo por MQO e acha o valor predito: Inclui este valor predito abaixo e testa sua significância: Se theta1 for significativo, rejeito o primeiro modelo.

Teste de Davidson - MacKinnon Da mesma forma, estimo a equação abaixo e calculo os valores preditos: Inclui este valor predito abaixo e testa sua significância: Se theta2 for significativo, rejeito o segundo modelo.

Problemas com testes não aninhados Dificuldade de escolher o modelo: ambos ou nenhum pode ser rejeitado. A rejeição de um modelo não significa que o outro seja o correto. Se nenhum for rejeitado, pode usar o R2 ajustado para decidir. Se ambos forem rejeitados, mas difícil.... Problemas quando as variáveis são diferentes.

Variáveis proxy Problema mais grave: o modelo exclui uma variável importante por falta de dados. A variável aptidão pode ser importante para explicar as diferenças salariais e queremos identificar o retorno à educação controlando para as diferenças em termos de aptidão.

Variáveis proxy Viés de variável omitida: não temos a variável aptidão. Como podemos aliviar o problema de variável omitida? Obter uma proxy para a variável omitida.: algo que está relacionado a variável não observada. QI: não precisa medir aptidão, apenas ser correlacionada com a variável aptidão.

Variáveis proxy Solução plugada do problema de variáveis omitidas. variável não observada x3 é a variável proxy Solução plugada do problema de variáveis omitidas.

Solução plugada do problema de variáveis omitidas Se a variável é uma boa proxy para a variável omitida, produziremos estimadores consistentes. O erro u é não correlacionado com todas as variáveis. O erro v3 é não correlacionado com x1, x2 e x3. x*3 tem correlação zero com x1 e x2 quando x3 é controlado.

Solução plugada do problema de variáveis omitidas No exemplo: Aptidão muda com o QI e não com educ e exper. Será que a hipótese é razoável?

Erros de mensuração Considere o modelo de regressão simples: onde cov(x*,u) = E(x*u) = 0. Nesse modelo, a estimação por MQO deveria gerar estimadores consistentes dos parâmetros. onde E(e) = 0 cov(x*,e) = E(x*e) = 0 cov(e,u) = E(eu) = 0

Erros de mensuração Supõe-se, porém, que a variável x* seja observada com erro Isto é, o que observamos na prática é onde E(e) = 0 cov(x*,e) = E(x*e) = 0 cov(e,u) = E(eu) = 0

Erros de mensuração Exemplo: Para explicar o CR de um aluno, podemos estar interessados em usar como variáveis explicativas (dentre outras): renda familiar, número de horas dedicadas ao estudo, tempo necessário para o trajeto casa-escola etc. Todas essas variáveis estão sujeitas a erros de mensuração, pois os alunos podem errar (deliberadamente ou não) ao responder à pesquisa Se os erros forem puramente aleatórios, isto é, não estiverem correlacionados com outras variáveis relevantes, as hipóteses do modelo acima serão satisfeitas.

Erros de mensuração Reescrevendo o modelo em função da variável observada x:

Erros de mensuração Agora, a estimação por MQO não gera estimadores consistentes dos parâmetros, pois: