A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Análise da Regressão múltipla: Inferência Revisão da graduação.

Apresentações semelhantes


Apresentação em tema: "Análise da Regressão múltipla: Inferência Revisão da graduação."— Transcrição da apresentação:

1 Análise da Regressão múltipla: Inferência Revisão da graduação

2 Hipóteses do modelo linear clássico (CLM) Sabemos que, dadas as hipóteses de Gauss- Markov, MQO é BLUE. Para realizarmos os testes de hipóteses clássicos, precisamos acrescentar mais uma hipótese. Vamos supor que u é independente de x 1, x 2,…, x k e que u e normalmente distribuído com média zero e variância 2 : u ~ Normal(0, 2 ).

3 Hipóteses do CLM (cont.) Sob CLM, MQO é não apenas BLUE, mas também o estimador não-viesado de variância mínima. Podemos resumir as hipóteses do CLM como: y|x ~ Normal( x 1 +…+ k x k, 2 ) Embora assumamos normalidade, nem sempre ela se verifica. Em grandes amostras, a hipótese de normalidade não é necessária.

4 .. x1x1 x2x2 Uma distribuição normal homocedástica com uma única variável explicativa E(y|x) = x y f(y|x) Distribuições normais

5 Distribuição normal amostral

6 O teste t

7 O teste t (cont.) O conhecimento da distribuição amostral dos estimadores nos permite fazer testes de hipóteses. Comece com a hipótese nula. Por exemplo, H 0 : j =0 Se aceitamos a nula, aceitamos que x j, após controlarmos pelos outros xs, não tem efeito em y.

8 O teste t (cont.)

9 Teste t: caso unicaudal Além de nossa, H 0, precisamos de uma hipótese alternativa, H 1, e um nível de significância. H 1 pode ser unicaudal ou bicaudal. H 1 : j > 0 e H 1 : j < 0 são unicaudais. H 1 : j 0 é bicaudal. Se queremos apenas 5% de probabilidade de rejeitar H 0 caso ela seja, então dizemos que nosso nível de significância é de 5%.

10 Alternativa unicaudal (cont.) Escolhido um nível de significância,, olhamos no (1 – )-ésimo percentil na distribuição t com n – k – 1 df e chamamos esse valor, c, de valor crítico. Rejeitamos a hipótese nula se a estatística t é maior que o valor crítico. Se a estatística t for menor que o valor crítico, então não rejeitamos a nula.

11 y i = x i1 + … + k x ik + u i H 0 : j = 0 H 1 : j > 0 c 0 Alternativa unicaudal (cont.) Não rejeitamos Rejeitamos

12 Uni vs bicaudal Como a distribuição t é simétrica, testar H 1 : j < 0 é direto. O valor crítico é simplesmente o negativo do anterior. Rejeitamos a nula se t –c, então não rejeitamos a nula. Para um teste bicaudal, escolhemos um valor crítico baseado em /2 e rejeitamos H 1 : j 0 se o valor absoluto da estatística t for > c.

13 y i = X i1 + … + k X ik + u i H 0 : j = 0 H 1 : j 0 c 0 -c Alternativa bicaudal Rejeitamos Não rejeitamos

14 Resumo de H 0 : j = 0 A menos que seja explicitado ao contrário, estaremos considerando a alternativa bicaudal. Se rejeitamos a nula, dizemos que x j é estatisticamente significante ao nível de % Se não rejeitamos a nula, dizemos x j é estatisticamente não significativo ao nível de %

15 Testando outras hipóteses Podemos generalizar a estatística t testando H 0 : j = a j. Neste caso, a estatística t é dada por

16 Intervalos de confiança Outra forma de usar os procedimentos clássicos de teste de hipóteses é construindo um intervalo de confiança utilizando o mesmo valor crítico do teste bicaudal. Um intervalo de confiança de (1 - ) % é definido por:

17 Calculando o p-valor do teste t Uma alternativa ao procedimento clássico de teste é perguntar: qual é o menor nível de significância ao qual a nula seria rejeitada? Calcule a estatística t, e olhe em que percentil ela está na distribuição t apropriada – este é o p-valor. O p-valor é a probabilidade de observarmos valores iguais ou maiores (em valor absoluto) à estatística t obtida se a nula for verdadeira.

18 P-valores, testes t´s etc. A maioria dos pacotes calcula o p-valor, assumindo um teste bicaudal. Se se estiver interessado na alternativa unicaudal, basta dividir o p-valor reportado por 2.

19 Testando uma combinação linear Ao invés de testar se 1 é igual a uma constante, podemos testar que ele é igual a outro parâmetro, ou seja, H 0 : 1 = 2. Use o mesmo procedimento para calcular a estatística t

20 Testando uma combinação linear (cont.)

21 Então, precisamos de s 12. Muitos pacotes, como o Eviews, fornecem essa estatística. Mas o Eviews tem uma opção que permite fazer o teste automaticamente. O teste pode ser reescrito, conforme mostrado a seguir.

22 Exemplo: Suponha que você esteja interessado nos efeitos dos gastos de campanha no resultado das eleições. O modelo é votoA = log(gastoA) + 2 log(gastoB) + 3 prtystrA + u H 0 : 1 = - 2, ou H 0 : 1 = = 0 1 = 1 – 2 ; substituindo e rearranjando votoA = log(gastoA) + 2 log(gastoB - gastoA) + 3 prtystrA + u

23 Exemplo (cont.): É o mesmo modelo, mas agora você tem um erro padrão para 1 – 2 = 1 diretamente da regressão. Qualquer combinação linear de parâmetros pode ser testada de forma similar. Outros exemplos de testes de hipóteses sobre uma única combinação linear de parâmetros: 1 = ; 1 = 5 2 ; 1 = -1/2 2 ; etc

24 Múltiplas restrições lineares Os exemplos anteriores eram de uma única restrição linear (p.e. 1 = or 1 = 2 ) Mas também podemos testar conjuntamente múltiplas hipóteses sobre os parâmetros. Um exemplo é do restrição de exclusão – queremos testar se um grupo de parâmetros é igual a zero.

25 Teste de restrição de exclusão Agora, a hipótese nula é algo do tipo H 0 : k-q+1 = 0,, k = 0 A alternativa é H 1 : H 0 é falsa, ou seja, pelo menos um dos ´s é diferente de zero. Não podemos apenas fazer cada teste t isoladamente, porque queremos saber se os q parâmetros são conjuntamente significativos a um certo nível – é possível que nenhum seja individualmente significante a este nível.

26 Teste de restrição de exclusão (cont.) O teste é feito estimando o modelo restrito sem x k-q+1,, …, x k, assim como o modelo irrestrito com todos os xs. Intuitivamente, queremos saber se x k-q+1,, …, x k causam uma variação suficientemente grande na SSR

27 A estatística F A estatística F é sempre positiva, uma vez que a SSR do modelo restrito não pode ser menor que a do modelo irrestrito. A estatística F statistic mede o crescimento relativo na SSR quando se passa do modelo irrestrito para o modelo restrito. q = número de restrições, ou df r – df ur n – k – 1 = df ur

28 A estatística F (cont.) Para decidir se o aumento na SSR é grade o suficientes para rejeitar as exclusões, precisamos conhecer a distribuição amostral de nossa estatística F. Não é de se surpreender que F ~ F q,n-k-1, onde q é o número de graus de liberdade do numerador e n – k – 1 é o número de graus de liberdade do denominador.

29 0 c f( F ) F A estatística F (cont.) Rejeita Não rejeita Rejeita H 0 ao nível de significância se F > c

30 A estatística F em função do R 2 Podemos usar o fato de que, em qualquer regressão, SSR = SST(1 – R 2 ) e substituir na fórmula:

31 Significância da regressão Um caso especial é o teste H 0 : 1 = 2 =…= k = 0. Como o R 2 do modelo com apenas o intercepto será zero, a estatística F será simplesmente:

32 Restrições lineares gerais A forma básica da estatística F é válida para qualquer restrição linear. Primeiro estime os modelos irrestrito e restrito. Em cada caso, anote a SSR e substitua na fórmula.

33 Exemplo: O modelo is votoA = log(gastoA) + 2 log(gastoB) + 3 prtystrA + u. Agora a nula é H 0 : 1 = 1, = 0. Substituindo a restrição: votoA = 0 + log(gastoA) + 2 log(gastoB) + u. Agora votoA - log(gastoA) = log(gastoB) + u é o modelo restrito.

34 Estatística F: Resumo Da mesma forma que no teste t, o p-valor pode ser calculado olhando no percentil da distribuição F apropriada. Se apenas uma exclusão está sendo testada, então F = t 2 e o p-valor será o mesmo.


Carregar ppt "Análise da Regressão múltipla: Inferência Revisão da graduação."

Apresentações semelhantes


Anúncios Google