A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Prof. Carlos H. C. Ribeiro MB751 – Modelos de previsão.

Apresentações semelhantes


Apresentação em tema: "Prof. Carlos H. C. Ribeiro MB751 – Modelos de previsão."— Transcrição da apresentação:

1 Prof. Carlos H. C. Ribeiro MB751 – Modelos de previsão

2 Aula 3 Análise de variância e correlação Testes de hipótese Intervalos de confiança Regressão e correlação 2

3 3 Simplificação das expressões para regressão linear MQ Exemplo 6

4 Regressão linear MQ: propriedades adicionais Estimativa do coeficiente b: Estimativa do coeficiente a: Covariância do par a,b: 4 Variância do erro

5 Decomposição da soma dos quadrados Objetivo: estudar a variação da variável dependente Y. Que parcela da variação é causada pela variação de X? Que parcela da variação não é explicada pela variação de X? 5 X Y

6 Decomposição da soma dos quadrados 6 Variação total de Y Parcela devida à X Parcela residual

7 Análise de variância (ANOVA) 7 Fonte de variação de Y Variação ou soma de quadrados Soma de quadrados média Variável X resíduo Variável X + resíduo Estatística F = (VE/k)/(VR/N-k-1): testa a significância do efeito das variáveis independentes sobre Y Estatística t: testa significância dos parâmetros estimados. Variância residual s 2: mede grau de dispersão entre valores observados e estimados Coeficiente de determinação R 2 = VE/VT = 1-VR/VT: indica a parcela da variação de Y explicada pela variação de X Observação: k é o número de variáveis independentes Exemplo 7

8 Intervalos de confiança e testes de hipóteses Podemos agora tentar definir intervalos de confiança e testes de hipóteses envolvendo a e b: Intervalos de confiança: que faixa de valores tem probabilidade alta (ou nível de significância baixo) de conter os valores verdadeiros dos parâmetros (a ou b) Testes de hipóteses: qual a probabilidade de que um modelo obtido por regressão linear tenha seus parâmetros estimados próximos aos valores reais? Probabilidade = 1- Nível de significância 8

9 Exemplo Uma tentativa de explicar o consumo C em função da renda R: Hipótese: b deve ser positivo, pois se a renda aumenta, o consumo deve aumentar. Teste sobre hipótese nula (b=0). O objetivo é tentar rejeitar esta hipótese. Como? 1.Tento achar uma estimativa de b suficientemente > 0, para causar dúvida sobre a validade da hipótese nula. Suponha que a estimativa indique b = Suponha que para o valor estimado, o intervalo de confiança para um nível de significância de 10% seja: 0,6 < b < 1,2. Isto quer dizer que P(0,6 < b < 1,2) = 100% - nível de significância = 90%. Ou seja, rejeitamos a hipótese nula com nível de confiança de 90%. 9

10 Teste de hipótese em Econometria Teste sempre para um dado modelo: aceitação ou rejeição deste modelo. Normalmente nível de significância 5%, mas dependendo dos dados disponíveis posso ser mais ou menos preciso. Rejeitar a hipótese nula significará aceitar o modelo, a menos que novos dados contrariem esta conclusão. Teste usual: t. Adequado para variâncias desconhecidas. 10

11 Teste de hipótese usando teste F Teste F: testa a significância das variáveis independentes (no caso, X) sobre Y: Hipótese nula H 0 : X não afeta Y (b=0). Hipótese não-nula H 1 : X afeta Y (b 0). 1.Calculo o número de graus de liberdade no numerados (k=1) e no denominador (N-k-1 = N-2). 2.Defino o nível de significância. 3.Obtenho o valor crítico de teste F c (tabelado). 4.Calculo F F > F c ? Rejeito a hipótese b=0 no nível de significância. F < F c ? Aceito a hipótese b=0 no nível de significância. 11

12 Teste de hipótese usando teste t Teste t: Testa significância dos parâmetros a e b: Três conjuntos de hipóteses a testar para v = a ou b: v = 0 ou v 0: efeito positivo ou negativo (teste bilateral) v = 0 ou v > 0: efeito positivo (teste unilateral positivo) v = 0 ou v < 0: efeito negativo (teste unilateral negativo) As hipóteses a testar dependem do interesse para o problema. 1.Defino o teste (unilateral ou bilateral). 2.Calculo o número de graus de liberdade N-k-1 = N-2. 3.Defino o nível de significância. 4.Obtenho o valor crítico de teste t c (tabelado). 5.Calculo t |t| > |t c | ? Rejeito ausência de efeito no nível de significância. |t| < |t c | ? Aceito ausência de efeito no nível de significância. 12

13 Exemplo 8 13 Exemplo 8

14 Exercício 2 Dia Notas na prova Horas de sono na véspera Exercício 2 a) Elaborar a tabela ANOVA b) Calcular R 2 e a estatística F c) As notas do aluno foram afetadas pelas horas de sono na véspera? Verifique de acordo com o modelo de regressão linear e nivel de significância 0,01

15 Observações para a lista 1 SQE = VE (soma dos quadrados explicados) SQT = VT (soma dos quadrados dos totais) SQR = VR (soma dos quadrados dos resíduos) fazer o teste F significa fazer teste F com nível de significância 0,05 fazer o teste t significa fazer teste t com nível de significância 0,05 para cada um dos coeficientes da reta. 15

16 O que vimos até agora O modelo de regressão linear a duas variáveis Para tentar explicar a relação entre duas variáveis (X e Y) a partir de um conjunto de dados Método dos mínimos quadrados Para achar os coeficientes da reta de regressão linear Análise de variância (ANOVA) Para avaliar a reta de regressão e determinar quão bem ela aproxima os dados Testes de hipótese: F e t No caso geral: para avaliar estatisticamente a validade de uma hipótese No caso específico de regressão linear, é parte do kitANOVA 16

17 Intervalos de confiança Define o intervalo dentro do qual o valor verdadeiro do parâmetro estará, com uma dada probabilidade. Teste usual: t O procedimento a seguir pode ser usado para determinar intervalos de confiança para qualquer parâmetro estimado. 17

18 Intervalo para b (unilateral +) Defino: NC (nível de confiança) = 1 – NS (nível de significância) Portanto (aula passada): P(t c > t b ) = 1 – P(t c t b ) = 1 – NS = NC Mas e portanto... 18

19 Intervalo para b (unilateral -) 19 Intervalo para b (bilateral) Exemplo 9

20 Regressão e correlação 20 X Y X _ y=Y-Y _ x=X-X _ I: xy>0 III: xy > 0 II: xy < 0 IV: xy < 0 Y _

21 Correlação: ideia intuitiva Muitos pontos no Quadrante I: –xy > 0 para muitos pontos –some dos xy tende a ser positivo alto (soma de números positivos) Muitos pontos no Quadrante II: –xy < 0 para muitos pontos –some dos xy tende a ser negativo com módulo alto (soma de números negativos) Muitos pontos no Quadrante III: –xy > 0 para muitos pontos –some dos xy tende a ser positivo com alto (soma de números positivos) Muitos pontos no Quadrante IV: –xy < 0 para muitos pontos –some dos xy tende a ser negativo com módulo alto (soma de números negativos) Pontos distribuídos em vários quadrantes: –xy > 0 para alguns pontos e xy < 0 para outros –soma dos xy tende a ser positivo baixo ou negativo com módulo baixo. 21 Correlação - Correlação + Correlação - Baixa Correlação

22 Correlação: definição formal Coeficiente de correlação: Pode-se mostrar que: 22 Um teste para b também é um teste para r

23 Exemplo 23 Exemplo 10

24 Diferença entre regressão e correlação Regressão relaciona a variável independente à variável dependente, ou seja, procura gerar uma explicação (reta de regressão, no caso da regressão linear) para a variação em Y causada por variações em X. Meço a regressão através do coeficiente de determinação R 2. Correlação mede a associação entre X e Y, sem considerar que variável é dependente ou independente. Meço a correlação através do coeficiente de correlação r. 24

25 Atividade 1 (tarde) MunicípioABCDEFGHIJ Produção agrícola (Y) Índice pluviométrico (X) Atividade 1T a) Plotar os pontos no sistema x-y. b) Calcular a correlação entre a produção agrícola e o índice pluviométrico. O que pode ser concluído?


Carregar ppt "Prof. Carlos H. C. Ribeiro MB751 – Modelos de previsão."

Apresentações semelhantes


Anúncios Google