Aula 6 - Método não-experimental ou de seleção não-aleatória

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

Escola Politécnica de Pernambuco Departamento de Ensino Básico
Estatística amintas paiva afonso.
Prof. Darlan Marcelo Delgado
ANÁLISES DE REGRESSÃO.
Analise de Regressão Parte 2.
AJUSTE DE CURVAS 6.1 Introdução 6.2 Método dos quadrados mínimos
CAPÍTULO 7 TESTE DE HIPÓTESE
Controle de Processos por Computador
MÉTODOS QUANTITATIVOS
ANÁLISE DISCRIMINANTE
ESTIMAÇÃO.
REGRESSÃO LINEAR. O coeficiente de correlação não mede a relação causa-efeito entre duas variáveis, apesar de que essa relação possa estar presente. Por.
Alexandre Suaide Ed. Oscar Sala sala 246 ramal 7072
MB751 – Modelos de previsão
ANÁLISE DE SÉRIES DE TEMPO
ANÁLISE DE REGRESSÃO UM GUIA PRÁTICO.
Rejane Sobrino Pinheiro Tania Guillén de Torres
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
PREVISÃO DE CUSTOS Prof Samir Silveira.
Diagramas de dispersão
Mensuração de Poder de Mercado
Profª. Sheila Regina Oro
Análise Exploratória de Dados R – LIG/08 – maio de 2008.
Laís Araújo Lopes de Souza
1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Simples.
Aula 10. Regressão Linear Múltipla.
Estatística e Probabilidade
Aula 5 – Diferenças em Diferenças
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
PLANEJAMENTO DO EXPERIMENTO
Aula 5 - Método experimental ou de seleção aleatória
Aula 8 – Diferenças em Diferenças
Professor Antonio Carlos Coelho
Estatística e Probabilidade
Regressão Linear.
2.3 Experimentos Fatoriais 22 Efeitos das Interações
Múltipla Variáveis Binárias Relações Não-Lineares
Modelagem Estatística
Professor Antonio Carlos Coelho
Regressão e Previsão Numérica.
Revisão Premissa: seja y e x duas variáveis representando alguma população, deseja-se explicar y em termos de x. Ex: y=salário hora e x=anos de escolaridade.
análise dos estimadores
7 Ajuste de Curvas UFSC.PósMCI.FME.Ajuste de curvas. (11.1)
Aula 6 Propagação de erros
Regressão.
Estatística para Cursos de Engenharia e Informática
Regressão Linear Múltipla
Disciplina Engenharia da Qualidade II
Aula 4 – Estatística- Conceitos básicos
INFERÊNCIA ESTATÍSTICA PROPORÇÃO POPULACIONAL p
Metodologia da Pesquisa em Ensino de Ciências I
ME623A Planejamento e Pesquisa
Estatística e Probabilidade
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Métodos Estatísticos Aplicados às Ciências Biológicas
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Regressão Linear Simples
Correlação e regressão
AULA 3 – O Modelo de Regressão Simples
Regressão linear simples
Regressão linear simples
Correlação Análise do grau de relacionamento entre duas variáveis quantitativas.
Experimentação e Instrumentação Regressão Linear e Múltipla
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
AULA 11 – REGRESSÃO Parte I
LINEARIDADE Kamila Dias Nayara Rayanne Pereira Renata Fernandes Solange Araújo.
Regressão Linear (aula 14 – Parte 2).
Variância/ Covariância, Correlação Regressão. Variância.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

Aula 6 - Método não-experimental ou de seleção não-aleatória Material Elaborado por Betânia Peixoto

Método não-experimental ou de seleção não-aleatória Uma das metodologia para realizar a avaliação de impacto quando a seleção entre tratados e controle é não-aleatória.

Plano de Aula Um pouco de econometria. Regressão Linear: intuição e procedimentos. Relação entre outras variáveis que afetam o indicador de interesse e que são diferentes entre os grupos. Viés de variável omitida. Discussão do problema existente para a avaliação quando a seleção entre tratados e não-tratados não foi aleatória.

Método não-experimental ou de seleção não-aleatória Nos projetos sociais, em geral, a seleção dos participantes do programa não é feita de forma aleatória: ou porque dentro dos elegíveis, selecionamos, por exemplo, os mais vulneráveis. Quando a seleção não é aleatória não temos mais um grupo de controle automático. ou porque todas as pessoas elegíveis para participar do programa efetivamente participam do programa,

Regressão Idéia: esse instrumental permite verificar a relação entre as características que afetam o indicador de impacto, inclusive o programa, independente uma das outras. A regressão linear permite ver a relação entre múltiplas variáveis com o indicador de impacto.

Objetivo O objetivo da análise de regressão é encontrar uma função linear que permita: Descrever e compreender a relação entre uma variável dependente e uma ou mais variáveis independentes. 6

Modelo de Regressão Linear Simples- Exemplo 1 Suponha que o objetivo é verificar a relação entre o número de efetivo policial alocado nos municípios e o número de homicídios nestes município, para realizar projeções de alocação policial. A tabela seguinte registra uma amostra representativa extraída dos registros dos municípios, com número de efetivo policial e número de crime. Analisar a possibilidade de definir um modelo que represente a relação entre as duas variáveis ou amostras.

Solução Para analisar a relação entre as duas variáveis no Exemplo 1, foi construído o gráfico de dispersão dos crimes em função do efetivo policial. Nesse gráfico pode-se ver que os municípios com mais policiais têm mais crimes.

O gráfico de dispersão mostra que os crimes e o efetivo estão correlacionados de forma positiva. A linha tracejada foi ajustada tentando equilibrar os pontos acima da reta com os pontos abaixo dela. Essa reta é uma das muitas possíveis retas que poderiam ser ajustadas.

Modelo do Ajuste de uma Reta O ajuste de uma reta é um modelo de regressão linear que relaciona a variável dependente y e a variável independente x por meio da equação de uma reta do tipo: É importante observar que, da mesma forma como a média resume uma variável aleatória, a reta de regressão resume a relação linear entre duas variáveis aleatórias e, conseqüentemente, da forma como a média varia entre amostras do mesmo tamanho extraídas da mesma população, as retas também variarão entre amostras da mesma população. 10

Exemplo: Relação quadrática entre y e x Observação A linearedade contida na função da regressão linear é referente apenas aos parâmetros, não nas variáveis. Assim o método permite construir funções lineares nos parâmetros, mas que expressão relação não linear entre as variáveis y e x. Exemplo: Relação quadrática entre y e x 11

Voltando ao Exemplo 1 O objetivo do Exemplo 1 é ajustar uma reta a partir dos valores das amostras retiradas da população, considerando que a alocação de efetivo é a variável independente x, e os crimes, a variável dependente y. Uma primeira forma de fazer isso é ajustar manualmente essa reta tentando equilibrar os pontos acima e abaixo dessa reta, como foi feito no gráfico do Exemplo 1. Como esse procedimento permite o ajuste de diversas retas, é necessário estabelecer um objetivo de eficiência de ajuste possível de medir, como é mostrado a seguir.

Critério de ajuste 1: Uma primeira forma é ajustar uma reta horizontal de valor igual à média dos valores da variável dependente y, que é uma reta de regressão com b=0. Esse critério não necessita de regressão.

Critério de ajuste 2: Outra forma é ajustar uma reta que divida os pontos observados de forma que a soma dos desvios seja nula. Entretanto, como há muitas retas que cumprem com essa condição, esse critério não poderá ser utilizado.

Critério de ajuste da regressão Outra forma é ajustar uma reta de forma que minimize a soma dos quadrados dos desvios, (lembre a definição de variância). O objetivo da regressão é encontrar os coeficientes a e b da reta de regressão que minimizam a soma dos quadrados dos desvios dos valores da amostra y com relação aos correspondentes valores da reta de regressão. Lembrando que: A variância faz o somatório dos quadrados dos desvios no numerador

Interpretando: O coeficiente “b” é a declividade da reta e define o aumento ou diminuição da variável y por unidade de variação da variável x. A constante “a” é o valor de y quando x=0

Estimação No modelo estimado para o ajuste da reta se verifica que: Para um único valor de xi pode haver um ou mais valores de yi. Por exemplo, no gráfico de dispersão do exemplo 1 para x=35 há dois valores das variáveis dependentes y=400 e y=520. Mas há apenas um único estimado para cada valor de xi. Para cada valor de xi há uma diferença entre o valor observado yi e o valor estimado . Essa diferença é denominada desvio (di).

Y=117,07+9,73X Lembrar que como estamos trabalhando com amostra temos que ter um teste para ver se na população este resultado é válido. O teste agora, em vez de usar a distribuição Z usa a distribuição t. H0: se b = 0 e H1: b ≠ 0. Usa-se o teste da distribuição t de Student porque ela é mais adequada para pequenas amostras. Quando o número de observações aumenta a distribuição t tende a Normal. Assim para garantir as análise se regressão utilizam apenas o teste t. O calculo do coeficiente t é similar ao do teste Z aprendido anteriormente, mas não entraremos nos detalhes nesta aula. Podemos olhar na tabela t assim como fizemos na tabela Z O resultado da regressão já traz calculado o Pvalue ou Valor-P que é a probabilidade de erro em rejeitarmos H0.

Variável Omitida Será que não existe mais dada que afeta o crime além do efetivo policial? Quando omitimos variáveis que deveriam estar presentes em uma equação de regressão o efeito omitido estará contido no termo do erro, fazendo com que a reta não seja bem ajustada. Veremos a frente o que acontece no exemplo anterior quando incluimos a variável populaçao na regressão.

Regressão Linear Múltipla O modelo de regressão linear que foi apresentado é o mais simples deles e nem sempre atende à modelagem mais complexa, como a de avaliação de impacto. Por exemplo, como vimos no Exemplo 1, o número de crimes não dependem somente do efetivo, pois há uma parte da variação dos crimes que não é explicada pelo efetivo policial.

O desenvolvimento da equação de regressão linear múltipla é similar ao da equação de regressão linear simples incluindo a dependência de duas ou mais variáveis independentes. A ferramenta de análise Regressão realizam análises de regressão múltipla.

Regressão Linear Multipla Dispondo de um grupo de amostras do mesmo tamanho, sendo uma variável dependente y e n variáveis independentes xi, o objetivo é determinar os coeficientes da equação da reta: cujos coeficientes minimizam a soma dos quadrados dos desvios da variável com relação a y.

Exemplo 2 Neste exemplo, queremos relacionar a quantidade de crime y com o número de efetivo x1 e o tamanho da população (x2 em milhares). Para encontrar essa relação linear foi extraída a amostra de valores de municípios.

O coeficiente do efetivo passa a ser negativo.

Observações Importantíssimas Os coeficientes estimados medem a relação da variável x com y livre do efeito das demais variáveis incluídas no modelo. Como a distância de yi a , (ou desvio) não é zero para todas as observações, existe um erro de estimação quando falamos em regressão linear. Y^ e o y estimado 28

Problema da avaliação Relembrando: Impacto = ATT = E[Yp, P=1] - E[Ysp, P=1] Não observamos Ysp quando P=1. Se E[Ysp, P=1] ≠ E[Yc, P=0] Erro: ε= E[Ysp, P=1] - E[Yc, P=0] (1) O ATT é dado por: ATT = E[Yp, P=1] - E[Yc, P=0] + ε (2) Substituindo (1) em (2) ATT = E[Yp, P=1] - E[Yc, P=0] + {E[Ysp, P=1] - E[Yc, P=0] } Viés ou erro Yc = indicador de impacto dos nao participantes do grupo controle 29

O Erro ou Viés O Erro é causado pelas características diferentes entre tratado e controle que levam à que o indicador de impacto seja diferente entre os grupos. 30

Como fazer então... ...quando temos um grupo de controle com características diferentes do grupo de tratamento, características essas que afetam o indicador de interesse? Aplicamos a regressão para controlarmos o impacto do programa do efeito das variáveis que tornam os grupos tratado e controle diferentes.

Regressão Aplicada à Avaliação de Impacto Procedimentos: Quais são as características que tornam os grupos diferentes e que afetam o indicador de impacto individual? Em um programa para melhorar o desempenho escolar das crianças poderia ser: educação dos pais, renda familiar, região onde moram, saneamento básico, se participam de outro programa social, ...

Procedimentos ‘Estimar a regressão em que o indicador de impacto é a variável dependente. As variáveis independentes são uma dummy para a participação do programa e as demais variáveis que tornam os grupos diferentes e que afetam o indicador de impacto. Ou seja, queremos olhar o efeito da participação no programa (dummy de participação) livre do efeito das demais características que tornam os grupos diferentes e afetam esse indicador.

Modelo de Regressão Linear Para isso vamos escrever a seguinte equação: Indicador de impacto =  + *programa + *x2 + *x3 +*x4+...+ Programa = 1 se o indivíduo participa do programa. Programa = 0 se o indivíduo não participa do programa.

Interpretação   identifica o indicador de impacto de quem recebe zero em todas as variáveis. , , ,...  indicam a relação/associação de cada variável com o indicador de impacto, livre do efeito das demais variáveis incluídas no modelo.   é o erro que existe por não conseguirmos determinar perfeitamente o indicador de impacto

Impacto “” mede o impacto de participar do programa sobre o indicador de impacto, livre do efeito das outras variáveis incluídas. Mas não esqueçam, temos que fazer o teste t de hipótese para ver se o resultado se mantém na população. H0:  = 0 H1:  ≠ 0

Ou seja: A regressão linear nos dará uma medida de  (e dos demais coeficientes), bem como o teste t e o p-valor dos coeficientes. Vários programas estatísticos podem ser usados para ‘estimar’ essa equação...

Limitações do método em avaliação Se tratado e controle forem muito diferentes teremos viés no impacto estimado decorrentes de: Variáveis Omitidas (observáveis e não observáveis) Ausência de suporte comum 38

Na prática Obter observações de Y para participantes e para não participantes [Y é o indicador para o qual queremos avaliar se houve impacto]. Criar a variável programa (1 para quem participou e zero para quem não participou). Obter observações das variáveis que afetam o indicador de interesse e que são diferentes entre os participantes e os não participantes.

Y =  + *programa + *X1 + *X2 + ; Estimar a equação: Y =  + *programa + *X1 + *X2 + ; Y = indicador de resultado de interesse. programa = variável de interesse (igual a 1 caso o indivíduo tenha participado do programa). X1, X2 = variáveis que são correlacionadas com o Y e que são diferentes entre os grupos de tratamento e de controle.

Comentários Finais Aula de hoje: aprendemos a realizar a avaliação de impacto quando a seleção de tratados e não-tratados não foi aleatória. Na próxima aula: aprenderemos um método para aperfeiçoar a seleção dos controles de forma que a aplicação do método aprendido hoje será mais confiável.