Econometria Modelos discretos
Modelos não lineares Em muitas aplicações que nos interessam, as variáveis econômicas são discretas e tomam um pequeno conjunto de valores. Decisões A , B ou C Queremos saber se o agente vai ou não participar do mercado de trabalho , se irá ou não comprar um determinado bem, etc.
Modelos de resposta binária Temos uma variável dependente y que pode tomar os valores 0 ou 1. A probabilidade condicional será escrita da seguinte forma: Partindo da teoria econômica poderíamos usar um modelo de variáveis latentes:
Modelos para variáveis binárias Probit e logit: distribuições simétricas em torno de zero. Modelo Clog-log: distribuição do y é assimétrica, há uma grande proporção de zero ou um no banco de dados.
Modelo de probabilidade linear Assumimos que F é uma função linear: Interpretação do coeficiente: A variação na probabilidade de y ser igual a 1 dado um aumento de 1 unidade em x1.
Ha três possíveis problemas com este método: i) Heterocedasticidade ii) Valores preditos fora do intervalo [0,1] iii) Aumento de xk sempre gera variacões constantes em y, pode prever muito mal nos valores extremos
Modelos de resposta binária não lineares Estimação por máxima verossimilhança. Não há solução explícita. Temos que estimar usando um procedimento numérico interativo (Probit, Logit, clog-log). Em outros modelos, às vezes precisamos de algoritmos de maximização mais complicados.
Modelos de resposta binária A função densidade de uma variável aleatória yi que toma valores (0,1) pode ser escrita como uma binomial: O log da densidade e da verossimilhança são:
Comandos no stata logit depvar [indepvars] [if] [in] [weight] [, options] probit depvar [indepvars] [if] [in] [weight] [, options] cloglog depvar [indepvars] [if] [in] [weight] [, options]
Logit Odds Ratio: razão de chances O efeito exp(βj) mede o efeito multiplicativo da mudança em uma unidade do regressor xj na razão de chances.
Exemplo HRS – Health and Retirement Study (2002): beneficiários do Medicare. Análise da contratação de serviço privado de saúde (ins) Variáveis explicativas: Hstatusg – dummy sobre avaliação do estado de saúde. Adl – número de limitações das atividades diárias Chronic – número de doenças crônicas Age, gender, race, ethnicity, marital status, educ, retirement status, hhincome, linc, sretire (cônjuge é aposentada) Banco: mus14data.dta
Exemplo logit ins retire $xlist
Comparações Modelos probit e logit
Testes
Teste Wald test $intlist ( 1) [ins]age2 = 0 ( 2) [ins]agefem = 0 ( 3) [ins]agechr = 0 ( 4) [ins]agewhi = 0 chi2( 4) = 7.45 Prob > chi2 = 0.1141