A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

MB751 – Modelos de previsão

Apresentações semelhantes


Apresentação em tema: "MB751 – Modelos de previsão"— Transcrição da apresentação:

1 MB751 – Modelos de previsão
Prof. Carlos H. C. Ribeiro

2 Aula 3 Análise de variância e correlação Testes de hipótese
Intervalos de confiança Regressão e correlação

3 Simplificação das expressões para regressão linear MQ
Exemplo 6

4 Regressão linear MQ: propriedades adicionais
Variância do erro Estimativa do coeficiente b: Estimativa do coeficiente a: Covariância do par a,b:

5 Decomposição da soma dos quadrados
Objetivo: estudar a variação da variável dependente Y. Que parcela da variação é causada pela variação de X? Que parcela da variação não é “explicada” pela variação de X? X Y

6 Decomposição da soma dos quadrados
Variação total de Y Parcela devida à X Parcela residual

7 Análise de variância (ANOVA)
Fonte de variação de Y Variação ou soma de quadrados Soma de quadrados média Variável X resíduo Variável X + resíduo Estatística F = (VE/k)/(VR/N-k-1): testa a significância do efeito das variáveis independentes sobre Y Estatística t: testa significância dos parâmetros estimados. Variância residual s2: mede grau de dispersão entre valores observados e estimados Coeficiente de determinação R2 = VE/VT = 1-VR/VT: indica a parcela da variação de Y explicada pela variação de X Exemplo 7 Observação: k é o número de variáveis independentes

8 Intervalos de confiança e testes de hipóteses
Podemos agora tentar definir intervalos de confiança e testes de hipóteses envolvendo a e b: Intervalos de confiança: que faixa de valores tem probabilidade alta (ou nível de significância baixo) de conter os valores verdadeiros dos parâmetros (a ou b) Testes de hipóteses: qual a probabilidade de que um modelo obtido por regressão linear tenha seus parâmetros estimados próximos aos valores reais? Probabilidade = 1- Nível de significância

9 Exemplo Uma tentativa de explicar o consumo C em função da renda R:
Hipótese: b deve ser positivo, pois se a renda aumenta, o consumo deve aumentar. Teste sobre hipótese nula (b=0). O objetivo é tentar rejeitar esta hipótese. Como? Tento achar uma estimativa de b suficientemente > 0, para causar dúvida sobre a validade da hipótese nula. Suponha que a estimativa indique b = 0.9. Suponha que para o valor estimado, o intervalo de confiança para um nível de significância de 10% seja: 0,6 < b < 1,2. Isto quer dizer que P(0,6 < b < 1,2) = 100% - nível de significância = 90%. Ou seja, rejeitamos a hipótese nula com nível de confiança de 90%.

10 Teste de hipótese em Econometria
Teste sempre para um dado modelo: aceitação ou rejeição deste modelo. Normalmente nível de significância 5%, mas dependendo dos dados disponíveis posso ser mais ou menos preciso. Rejeitar a hipótese nula significará aceitar o modelo, a menos que novos dados contrariem esta conclusão. Teste usual: t. Adequado para variâncias desconhecidas.

11 Teste de hipótese usando teste F
Teste F: testa a significância das variáveis independentes (no caso, X) sobre Y: Hipótese nula H0: X não afeta Y (b=0). Hipótese não-nula H1: X afeta Y (b0). Calculo o número de graus de liberdade no numerados (k=1) e no denominador (N-k-1 = N-2). Defino o nível de significância. Obtenho o valor crítico de teste Fc (tabelado). Calculo F F > Fc ? Rejeito a hipótese b=0 no nível de significância. F < Fc ? Aceito a hipótese b=0 no nível de significância.

12 Teste de hipótese usando teste t
Teste t: Testa significância dos parâmetros a e b: Três conjuntos de hipóteses a testar para v = a ou b: v = 0 ou v  0: efeito positivo ou negativo (teste bilateral) v = 0 ou v > 0: efeito positivo (teste unilateral positivo) v = 0 ou v < 0: efeito negativo (teste unilateral negativo) As hipóteses a testar dependem do interesse para o problema. Defino o teste (unilateral ou bilateral). Calculo o número de graus de liberdade N-k-1 = N-2. Defino o nível de significância. Obtenho o valor crítico de teste tc (tabelado). Calculo t |t| > |tc| ? Rejeito ausência de efeito no nível de significância. |t| < |tc| ? Aceito ausência de efeito no nível de significância.

13 Exemplo 8 Exemplo 8

14 Exercício 2 Dia 1 2 3 4 5 6 7 8 9 10 Notas na prova
Horas de sono na véspera a) Elaborar a tabela ANOVA b) Calcular R2 e a estatística F c) As notas do aluno foram afetadas pelas horas de sono na véspera? Verifique de acordo com o modelo de regressão linear e nivel de significância 0,01 Exercício 2

15 Observações para a lista 1
SQE = VE (soma dos quadrados explicados) SQT = VT (soma dos quadrados dos totais) SQR = VR (soma dos quadrados dos resíduos) “fazer o teste F” significa fazer teste F com nível de significância 0,05 “fazer o teste t” significa fazer teste t com nível de significância 0,05 para cada um dos coeficientes da reta.

16 O que vimos até agora O modelo de regressão linear a duas variáveis
Para tentar explicar a relação entre duas variáveis (X e Y) a partir de um conjunto de dados Método dos mínimos quadrados Para achar os coeficientes da reta de regressão linear Análise de variância (ANOVA) Para avaliar a reta de regressão e determinar quão bem ela aproxima os dados Testes de hipótese: F e t No caso geral: para avaliar estatisticamente a validade de uma hipótese No caso específico de regressão linear, é parte do “kit”ANOVA

17 Intervalos de confiança
Define o intervalo dentro do qual o valor verdadeiro do parâmetro estará, com uma dada probabilidade. Teste usual: t O procedimento a seguir pode ser usado para determinar intervalos de confiança para qualquer parâmetro estimado.

18 Intervalo para b (unilateral +)
Defino: NC (nível de confiança) = 1 – NS (nível de significância) Portanto (aula passada): P(tc > tb) = 1 – P(tc  tb) = 1 – NS = NC Mas e portanto...

19 Intervalo para b (unilateral -)
Intervalo para b (bilateral) Exemplo 9

20 Regressão e correlação
X Y . _ y=Y-Y x=X-X I: xy>0 III: xy > 0 II: xy < 0 IV: xy < 0

21 Correlação: ideia intuitiva
Muitos pontos no Quadrante I: xy > 0 para muitos pontos some dos xy tende a ser positivo alto (soma de números positivos) Muitos pontos no Quadrante II: xy < 0 para muitos pontos some dos xy tende a ser negativo com módulo alto (soma de números negativos) Muitos pontos no Quadrante III: some dos xy tende a ser positivo com alto (soma de números positivos) Muitos pontos no Quadrante IV: Pontos distribuídos em vários quadrantes: xy > 0 para alguns pontos e xy < 0 para outros soma dos xy tende a ser positivo baixo ou negativo com módulo baixo. Correlação + Correlação - Correlação + Correlação - Baixa Correlação

22 Correlação: definição formal
Coeficiente de correlação: Pode-se mostrar que: Um teste para b também é um teste para r

23 Exemplo Exemplo 10

24 Diferença entre regressão e correlação
Regressão relaciona a variável independente à variável dependente, ou seja, procura gerar uma explicação (reta de regressão, no caso da regressão linear) para a variação em Y causada por variações em X. Meço a regressão através do coeficiente de determinação R2. Correlação mede a associação entre X e Y, sem considerar que variável é dependente ou independente. Meço a correlação através do coeficiente de correlação r.

25 Atividade 1 (tarde) Município A B C D E F G H I J
Produção agrícola (Y) 20 60 110 140 130 100 90 Índice pluviométrico (X) 30 120 150 180 70 40 a) Plotar os pontos no sistema x-y. b) Calcular a correlação entre a produção agrícola e o índice pluviométrico. O que pode ser concluído? Atividade 1T


Carregar ppt "MB751 – Modelos de previsão"

Apresentações semelhantes


Anúncios Google