MB751 – Modelos de previsão

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

Estatística amintas paiva afonso.
Prof. Darlan Marcelo Delgado
Analise de Regressão Parte 2.
CAPÍTULO 7 TESTE DE HIPÓTESE
Análise de Variância da Regressão
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
CAPÍTULO 7 TESTE DE HIPÓTESE
Análise de regressão linear simples: abordagem matricial
Regressão Linear Aula 09 Prof. Christopher Freire Souza
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 8 Inferências com Base em Duas Amostras
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Polinômios Prof. Marlon.
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Testes de Hipóteses Forma mais clássica de inferência estatística
Inferências para uma amostra
Estatística Aplicada (Aula 5)
1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)
ESTATÍSTICA.
ESTATÍSTICA.
Análise de Variância (ANOVA)
BIO Métodos Quantitativos Aplicados à Ecologia
Métodos Numéricos Computacionais
Análise da Regressão múltipla: Inferência Revisão da graduação
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Laís Araújo Lopes de Souza
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Simples.
ESTATÍSTICA.
Estatística e Probabilidade
Estatística e Probabilidade
Funções e suas propriedades
Modelagem Estatística
ESTATÍSTICA.
Econometria Aula 3 – 27/9/2013.
Amostragem Pontos mais importantes:
MBA em Gestão de Empreendimentos Turísticos
Regressão Pontos mais importantes: -objectivo -regressão linear
Aula 6 - Método não-experimental ou de seleção não-aleatória
Campus de Caraguatatuba Aula 2: Somatório e Produtório
Aula 10 Medidas de dispersão Prof. Diovani Milhorim
Professor Antonio Carlos Coelho
Aula 11 - Teste de hipóteses, teste de uma proporção
COMPARAÇÃO DE DUAS POPULAÇÕES
Estatística e Probabilidade
Modelagem Estatística
Professor Antonio Carlos Coelho
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Regressão e Previsão Numérica.
análise dos estimadores
Regressão.
Ajuste do Modelo Avaliação dos Coeficientes
Metodologia da Pesquisa em Ensino de Ciências I
ANOVA.
Probabilidade Teste de hipóteses para uma média populacional:
Aula 12 - Relaxando as hipóteses do MCRL
Métodos Estatísticos Aplicados às Ciências Biológicas
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Regressão Linear Simples
GESTÃO E GARANTIA DA QUALIDADE
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Regressão linear simples
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
AULA 11 – REGRESSÃO Parte I
Regressão Linear (aula 14 – Parte 2).
Variância/ Covariância, Correlação Regressão. Variância.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

MB751 – Modelos de previsão Prof. Carlos H. C. Ribeiro carlos@ita.br

Aula 3 Análise de variância e correlação Testes de hipótese Intervalos de confiança Regressão e correlação

Simplificação das expressões para regressão linear MQ Exemplo 6

Regressão linear MQ: propriedades adicionais Variância do erro Estimativa do coeficiente b: Estimativa do coeficiente a: Covariância do par a,b:

Decomposição da soma dos quadrados Objetivo: estudar a variação da variável dependente Y. Que parcela da variação é causada pela variação de X? Que parcela da variação não é “explicada” pela variação de X? X Y

Decomposição da soma dos quadrados Variação total de Y Parcela devida à X Parcela residual

Análise de variância (ANOVA) Fonte de variação de Y Variação ou soma de quadrados Soma de quadrados média Variável X resíduo Variável X + resíduo Estatística F = (VE/k)/(VR/N-k-1): testa a significância do efeito das variáveis independentes sobre Y Estatística t: testa significância dos parâmetros estimados. Variância residual s2: mede grau de dispersão entre valores observados e estimados Coeficiente de determinação R2 = VE/VT = 1-VR/VT: indica a parcela da variação de Y explicada pela variação de X Exemplo 7 Observação: k é o número de variáveis independentes

Intervalos de confiança e testes de hipóteses Podemos agora tentar definir intervalos de confiança e testes de hipóteses envolvendo a e b: Intervalos de confiança: que faixa de valores tem probabilidade alta (ou nível de significância baixo) de conter os valores verdadeiros dos parâmetros (a ou b) Testes de hipóteses: qual a probabilidade de que um modelo obtido por regressão linear tenha seus parâmetros estimados próximos aos valores reais? Probabilidade = 1- Nível de significância

Exemplo Uma tentativa de explicar o consumo C em função da renda R: Hipótese: b deve ser positivo, pois se a renda aumenta, o consumo deve aumentar. Teste sobre hipótese nula (b=0). O objetivo é tentar rejeitar esta hipótese. Como? Tento achar uma estimativa de b suficientemente > 0, para causar dúvida sobre a validade da hipótese nula. Suponha que a estimativa indique b = 0.9. Suponha que para o valor estimado, o intervalo de confiança para um nível de significância de 10% seja: 0,6 < b < 1,2. Isto quer dizer que P(0,6 < b < 1,2) = 100% - nível de significância = 90%. Ou seja, rejeitamos a hipótese nula com nível de confiança de 90%.

Teste de hipótese em Econometria Teste sempre para um dado modelo: aceitação ou rejeição deste modelo. Normalmente nível de significância 5%, mas dependendo dos dados disponíveis posso ser mais ou menos preciso. Rejeitar a hipótese nula significará aceitar o modelo, a menos que novos dados contrariem esta conclusão. Teste usual: t. Adequado para variâncias desconhecidas.

Teste de hipótese usando teste F Teste F: testa a significância das variáveis independentes (no caso, X) sobre Y: Hipótese nula H0: X não afeta Y (b=0). Hipótese não-nula H1: X afeta Y (b0). Calculo o número de graus de liberdade no numerados (k=1) e no denominador (N-k-1 = N-2). Defino o nível de significância. Obtenho o valor crítico de teste Fc (tabelado). Calculo F F > Fc ? Rejeito a hipótese b=0 no nível de significância. F < Fc ? Aceito a hipótese b=0 no nível de significância.

Teste de hipótese usando teste t Teste t: Testa significância dos parâmetros a e b: Três conjuntos de hipóteses a testar para v = a ou b: v = 0 ou v  0: efeito positivo ou negativo (teste bilateral) v = 0 ou v > 0: efeito positivo (teste unilateral positivo) v = 0 ou v < 0: efeito negativo (teste unilateral negativo) As hipóteses a testar dependem do interesse para o problema. Defino o teste (unilateral ou bilateral). Calculo o número de graus de liberdade N-k-1 = N-2. Defino o nível de significância. Obtenho o valor crítico de teste tc (tabelado). Calculo t |t| > |tc| ? Rejeito ausência de efeito no nível de significância. |t| < |tc| ? Aceito ausência de efeito no nível de significância.

Exemplo 8 Exemplo 8

Exercício 2 Dia 1 2 3 4 5 6 7 8 9 10 Notas na prova Horas de sono na véspera a) Elaborar a tabela ANOVA b) Calcular R2 e a estatística F c) As notas do aluno foram afetadas pelas horas de sono na véspera? Verifique de acordo com o modelo de regressão linear e nivel de significância 0,01 Exercício 2

Observações para a lista 1 SQE = VE (soma dos quadrados explicados) SQT = VT (soma dos quadrados dos totais) SQR = VR (soma dos quadrados dos resíduos) “fazer o teste F” significa fazer teste F com nível de significância 0,05 “fazer o teste t” significa fazer teste t com nível de significância 0,05 para cada um dos coeficientes da reta.

O que vimos até agora O modelo de regressão linear a duas variáveis Para tentar explicar a relação entre duas variáveis (X e Y) a partir de um conjunto de dados Método dos mínimos quadrados Para achar os coeficientes da reta de regressão linear Análise de variância (ANOVA) Para avaliar a reta de regressão e determinar quão bem ela aproxima os dados Testes de hipótese: F e t No caso geral: para avaliar estatisticamente a validade de uma hipótese No caso específico de regressão linear, é parte do “kit”ANOVA

Intervalos de confiança Define o intervalo dentro do qual o valor verdadeiro do parâmetro estará, com uma dada probabilidade. Teste usual: t O procedimento a seguir pode ser usado para determinar intervalos de confiança para qualquer parâmetro estimado.

Intervalo para b (unilateral +) Defino: NC (nível de confiança) = 1 – NS (nível de significância) Portanto (aula passada): P(tc > tb) = 1 – P(tc  tb) = 1 – NS = NC Mas e portanto...

Intervalo para b (unilateral -) Intervalo para b (bilateral) Exemplo 9

Regressão e correlação X Y . _ y=Y-Y x=X-X I: xy>0 III: xy > 0 II: xy < 0 IV: xy < 0

Correlação: ideia intuitiva Muitos pontos no Quadrante I: xy > 0 para muitos pontos some dos xy tende a ser positivo alto (soma de números positivos) Muitos pontos no Quadrante II: xy < 0 para muitos pontos some dos xy tende a ser negativo com módulo alto (soma de números negativos) Muitos pontos no Quadrante III: some dos xy tende a ser positivo com alto (soma de números positivos) Muitos pontos no Quadrante IV: Pontos distribuídos em vários quadrantes: xy > 0 para alguns pontos e xy < 0 para outros soma dos xy tende a ser positivo baixo ou negativo com módulo baixo. Correlação + Correlação - Correlação + Correlação - Baixa Correlação

Correlação: definição formal Coeficiente de correlação: Pode-se mostrar que: Um teste para b também é um teste para r

Exemplo Exemplo 10

Diferença entre regressão e correlação Regressão relaciona a variável independente à variável dependente, ou seja, procura gerar uma explicação (reta de regressão, no caso da regressão linear) para a variação em Y causada por variações em X. Meço a regressão através do coeficiente de determinação R2. Correlação mede a associação entre X e Y, sem considerar que variável é dependente ou independente. Meço a correlação através do coeficiente de correlação r.

Atividade 1 (tarde) Município A B C D E F G H I J Produção agrícola (Y) 20 60 110 140 130 100 90 Índice pluviométrico (X) 30 120 150 180 70 40 a) Plotar os pontos no sistema x-y. b) Calcular a correlação entre a produção agrícola e o índice pluviométrico. O que pode ser concluído? Atividade 1T