A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Prof. Carlos H. C. Ribeiro (012) 3947 5895 106 IEC MB751– Modelos de.

Apresentações semelhantes


Apresentação em tema: "Prof. Carlos H. C. Ribeiro (012) 3947 5895 106 IEC MB751– Modelos de."— Transcrição da apresentação:

1 Prof. Carlos H. C. Ribeiro (012) IEC MB751– Modelos de Previsão

2 Aula 2 Introdução a modelos de regressão Estimadores e suas propriedades Modelos de regressão a duas variáveis (cont.) Teorema Gauss-Markov 2

3 Regressão linear a duas variáveis Duas variáveis: Uma variável independente X Uma variável dependente Y Uma relação (desconhecida, mas assumida linear) entre as variáveis (Y depende de X) Um conjunto de observações de valores de X e respectivos valores de Y (amostras). Objetivo: achar uma função linear que melhor se ajuste aos dados X, Y disponíveis 3

4 Revisitando o exemplo 1 Y (nota média do vestibular) X (salário mensal dos pais em R$1.000,00)

5 Revisitando o exemplo 1: possíveis ajustes (1) Possibilidade 1: unir o ponto de menor valor de X ao ponto de maior valor de X Qual é o problema com este método? 5

6 Revisitando o exemplo 1: possíveis ajustes (2) Possibilidade 2: achar uma boa reta no olhômetro Qual é o problema com este método? 6

7 Revisitando o exemplo 1: possíveis ajustes (3) Possibilidade 3: achar uma reta que zera a soma dos erros Qual é o problema com este método?

8 Revisitando o exemplo 1: possíveis ajustes (4) Possibilidade 4: Achar a reta que fornece o menor erro quadrático (erro 2 ) em relação aos dados. Vantagens: Penaliza de modo igual erros para menos e erros para mais Penaliza mais erros grandes do que erros pequenos Existe um procedimento computacional para achar esta reta: o método dos mínimos quadrados 8

9 Regressão linear: mínimos quadrados Objetivo: achar a relação linear de dependência de Y em relação a X através da equação da reta tal que a soma: no. de dados dadoponto da reta é mínima. 9

10 Regressão linear: mínimos quadrados 10

11 Exemplo 2: revisitando o exemplo 1 11 Exemplo 2

12 Exercício 1 a) Represente os pontos em um diagrama de dispersão. b) Estime e plote a regressão linear. c) Se você tivesse controle sobre a quant. de dinheiro disponível e desejasse uma renda nacional de US$ ,00 em 2003, em que nível você posicionaria a quant. de dinheiro? Explique. AnoQtde dinheiroRenda nacional 19932,05, ,55, ,26, ,67, ,37, ,07, ,28, ,69, ,89, ,010,0 Você é um secretário do BC de um certo país. Seu assessor lhe passa os seguintes dados históricos, relativos à quantidade de dinheiro disponível e renda nacional, em milhões de US$: 12 Exercício 1

13 Conceitos básicos de Estatística Já vistos em outro curso. Recomenda-se revisar os conceitos de: Variável aleatória Valor esperado e variância Distribuições conjuntas de probabilidade Covariância Independência Distribuições de probabilidade mais importantes: Normal, 2, t, F 13

14 Estimadores Estimação = definir valor de uma grandeza com base em N amostras desta. Exemplo 1a: Qual é a idade média dos alunos de MB751? Grandeza a estimar: idade média da turma. Um estimador deve prover um valor aproximado com base em um conjunto restrito de amostras. Para o valor médio de uma distribuição, um estimador razoável deve ser a média da amostra. Exemplo 1b: Qual é a variância das idades dos alunos de MB751? Grandeza a estimar: variância 2 das idades da turma. Um estimador deve prover um valor aproximado com base em um conjunto restrito de amostras. Para a variância de uma distribuição, um estimador razoável deveria ser a variância da amostra. 14 Exemplo 3

15 Características desejáveis dos estimadores (1) Note que o próprio valor retornado por um estimador depende da amostra, ou seja: é uma variável aleatória! Preciso então definir algumas características desejáveis do estimador: 1. Não-tendenciosidade: O valor esperado do estimador deve ser igual ao valor da grandeza: A média da amostra é estimador não-tendencioso da média da população: A variância da amostra não é estimador não-tendencioso da variância da população: Mas: 15

16 Características desejáveis dos estimadores (2) 2. Eficiência: Um estimador não-tendencioso é dito absolutamente eficiente se, para um dado tamanho da amostra, sua variância for menor que a de qualquer outro estimador não-tendencioso: Normalmente, um estimador pode ou não ser absolutamente eficiente, dependendo da distribuição. O que usamos mais é o conceito de eficiência relativa: um estimador não- tendencioso é dito relativamente mais eficiente do que outro se sua variância for menor. 16

17 Exemplo Seja o estimador para a média de uma distribuição: ou seja, ou seja, M 1 sorteia dois elementos da amostra (X 1 e X 2 ) e calcula uma média ponderada destes. M 1 é não-tendencioso? Seja o estimador para a média de uma distribuição: ou seja, M 2 é um professor rigoroso: soma N notas e divide por N+1 para calcular uma nota final... M 2 é não-tendencioso? 17

18 Características desejáveis dos estimadores (3) 3. Erro quadrático médio mínimo (MMSE): Um bom compromisso entre não- tendenciosidade e eficiência! 18

19 Exemplo 4 Sejam os estimadores para a média de uma distribuição: Qual dos dois é melhor, pelo critério MMSE? 19 Exemplo 4

20 Características desejáveis dos estimadores (4) 4. Consistência: Um estimador é consistente se, a medida que a amostra cresce, o valor estimado vai convergindo para o valor verdadeiro. 20

21 Voltando ao nosso modelo... Para um dado valor de X, é possível que exista mais de um valor de Y. Exemplo: Padrão de consumo de um indivíduo que recebe R$ ,00/ano. Possíveis causas de variação da parcela associada a alimentação: Mudanças de hábito espontâneas (e.g. dieta) Mudanças de hábito forçada (e.g. menos tempo para almoço devido à demanda profissional) Sazonalidade (chocolates na Páscoa, panetone no Natal, etc.) 21

22 O modelo Uma reta no plano X-Y: Modelando a variação: Y: variável aleatória X: fixa ou não-estocástica (conhecida) : erro aleatório (baseado em uma distribuição de probabilidade) 22

23 O modelo: por que um erro aleatório? Em modelos matemáticos, o erro aleatório é sempre usado para modelar a ignorância. Em Econometria, a ignorância relaciona-se com: Simplificação excessiva, e.g. considerar preço como único determinante de uma demanda, ignorando causas secundárias (gostos, renda da população, etc.). Erros não-modelados na obtenção e medida dos dados Para cada valor de X, uma distribuição de probabilidade para. Logo: uma distribuição de probabilidade para Y. 23

24 Para cada valor de X, uma distribuição de probabilidade para. Logo: uma distribuição de probabilidade para Y. 24 X Y X1X1 X2X2 X3X3 Y1Y1 Y2Y2 Y3Y3... Probabilidade Modelo estocástico: representação gráfica

25 Y: variável aleatória X: fixa ou não-estocástica (conhecida) : erro aleatório (baseado em uma distribuição de probabilidade) com: Valor esperado nulo e variância constante, independentemente das observações: E[ i ] = 0, Var[ i ] = 2 Erros de observações sucessivas não são correlacionados: E[ i j ] = 0 Distribuição normal 25 Formulação homoscedástica do modelo de regressão linear a duas variáveis

26 Heteroscedasticidade: erro com variância variável, dependente das observações: E[ i ] = 0, Var[ i ] = i 2 Autocorrelação: erros de observações sucessivas correlacionadas: E[ i j ] 0 Ilustração de alguns exemplos 26 Heteroscedasticidade e autocorrelação do erro

27 O modelo estocástico e a regressão linear Vimos um procedimento para achar a melhor reta que modela uma relação linear entre variáveis X e Y: Mínimos Quadrados. Mas agora, a relação é probabilística: para um dado X, posso ter mais de um Y. A reta agora pode variar. O que fazer? 27 Exemplo 5

28 O ^ sobre a e b indica que estes agora devem ser estimadores de a e b. E o que quero, como sempre são bons estimadores: não-tendenciosos e eficientes. A boa notícia é o TEOREMA GAUSS-MARKOV: o método dos mínimos quadrados produz estimadores de a e b que são BLUE: best linear unbiased estimator. 28 Teorema Gauss-Markov

29 29 BLUE O mais eficiente (menor variância) Linear na variável independente (X) Não-tendencioso Estimador

30 Atividade 1 (Manhã) Um estudo sobre empresas objetiva determinar a variação dos custos operacionais em função do tamanho destas. Três análise foram conduzidas independentemente, sendo produzidos os resultados ilustrados nas tabelas abaixo: Estudo 1 a) Estudo 2 Estudo 3 Empresa 1Empresa 2Empresa 3Empresa 4Empresa 5 Custos (em US$1000,00) 3,04,57,011,015,0 30 Empresa 1Empresa 2Empresa 3Empresa 4Empresa 5 Custos (em US$1000,00) 3,24,09,014,020,0 Empresa 1Empresa 2Empresa 3Empresa 4Empresa 5 Custos (em US$1000,00) 2,95,05,58,026,0 a)Represente os pontos em um diagrama de dispersão. Existe heteroscedasticidade? Justifique. b)Estime e plote a regressão linear para cada análise realizada. c)Calcule a média e variância das estimativas para os coeficientes a e b da regressão.


Carregar ppt "Prof. Carlos H. C. Ribeiro (012) 3947 5895 106 IEC MB751– Modelos de."

Apresentações semelhantes


Anúncios Google