AULA 9 – Revisão Econometria

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Estatística amintas paiva afonso.
Analise de Regressão Parte 2.
Estatística amintas paiva afonso.
AJUSTE DE CURVAS 6.1 Introdução 6.2 Método dos quadrados mínimos
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
MÉTODOS QUANTITATIVOS
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Amintas engenharia.
ANÁLISE DISCRIMINANTE
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Importância do Ajustamento de Observações
Curso de ADMINISTRAÇÃO
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Capítulo 6 Estimativas e Tamanho de Amostras
Capítulo 7 Teste de Hipóteses
MB751 – Modelos de previsão
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
MEDIDAS E INCERTEZAS O Que é Medição?
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
APLICAÇÕES COM EXCEL: Distribuição Binomial
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Testes de Hipóteses Forma mais clássica de inferência estatística
Estatística Aplicada (Aula 5)
Estatística Aplicada (Aula 4)
Estatística e Probabilidade
ESTATÍSTICA.
Testes de Hipótese Dr Hermano Alexandre Doutorando em Saúde Coletiva
J. Landeira-Fernandez Ética e Ciência
ESTATÍSTICA.
Análise da Regressão múltipla: Inferência Revisão da graduação
ME623A Planejamento e Pesquisa
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
TESTES DE HIPÓTESES Spencer Barbosa da Silva
Estatística e Probabilidade
Estatística e Probabilidade
Medidas de Dispersão ou de Variabilidade:
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Desafios gerenciais Aula 4.
O que é Estatística, afinal de contas?
ESTATÍSTICA.
SÉRIES ESTATÍSTICAS.
MBA em Gestão de Empreendimentos Turísticos
Estatística Inferencial (cap. 7 Martins)
Aula 6 - Método não-experimental ou de seleção não-aleatória
Olhe fixamente para a Bruxa Nariguda
Teste de Hipótese.
Noções de Inferência Estatística
COMPARAÇÃO DE DUAS POPULAÇÕES
ANÁLISE ESTATÍSTICA II
Professor Antonio Carlos Coelho
Regressão e Previsão Numérica.
análise dos estimadores
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Metodologia da Pesquisa em Ensino de Ciências I
Aula 12 - Relaxando as hipóteses do MCRL
Regressão Linear Simples
AULA 3 – O Modelo de Regressão Simples
GESTÃO E GARANTIA DA QUALIDADE
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
AULA 11 – REGRESSÃO Parte I
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

AULA 9 – Revisão Econometria DISCIPLINA: Econometria PROFESSOR: Bruno Moreira CURSO: Tecnólogo em Gestão Financeira AULA 9 – Revisão Econometria

O que é Econometria? Para Gujarati (2000), econometria visa essencialmente, a uma conjunção da teoria econômica com medidas concretas, como uma ponte entre a teoria e as técnicas de inferência estatística.

Construção de um Modelo Econométrico

Características da Econometria “Econômica” e das “Finanças” Economia  Escassez de dados para testar as hipóteses; Erros de mensuração; Revisões dos dados.    Finanças  Base de dados muito grande - esforço maior para analisá-los; Dados com muito “ruído”; Em geral não são normalmente distribuídos, embora as metodologias assim os considerem.

Séries temporais; Cross-section (corte transversal); Painel. Exemplo de dados econométricos Séries temporais; Cross-section (corte transversal); Painel.

Séries temporais Séries temporais consistem em um conjunto de valores observados em diferentes pontos ao longo de um determinado período de tempo.

Cross-section (corte trasnversal) Cross-section (corte trasnversal) consiste em uma amostra de dados coletados em um determinado ponto no tempo.

Painel Painel consiste em uma série de tempo para cada membro do corte transversal do conjunto de dados.

Regressão : Conceitos O que é uma regressão? Regressão pode ser entendida como o estudo da dependência de uma variável em relação a uma ou mais variáveis com o objetivo de estimar e/ou prever a média ou o valor médio da dependente em termos dos valores fixos das variáveis que a explica.

Diferença entre Regressão e Causação Regressão X Causação Uma relação estatística, por si só, não pode logicamente implicar em uma causação. Para atribuir causalidade, deve-se recorrer a considerações teóricas.

Diferença entre Regressão e Correlação Regressão X Correlação Regressão e Correlação são conceitos intimamente relacionados, mas conceitualmente distintos. O objetivo da correlação é medir o grau ou intensidade de associação linear entre as variáveis. Na regressão objetivamos prever o valor médio de uma variável com base em valores fixados de outras variáveis.

Modelo de Regressão Linear Simples Esta equação define o Modelo de Regressão Linear Simples 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝑢 𝑖

Modelo de Regressão Linear Simples 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝑢 𝑖 Em que: u = Termo de erro ou termo estocástico é:  uma variável estocástica ou aleatória mas não observável ;  representa todos os fatores desconhecidos que possam influenciar uma relação económica.

Termo de erro Razões principais que justificam a presença do termo de erro nos modelos econométricos:   (a) no termo de erro incluímos fatores desconhecidos; (b) fatores conhecidos mas não quantificáveis (gostos, preferências, risco, incerteza); (c) os chamados erros de especificação: - especificação matemática imprópria - inclusão de variáveis irrelevantes  - exclusão de variáveis relevantes (d) erros de medição ou erros nas observações devido as simplificações, arredondamentos e transformações dos dados.

Hipóteses Adjacentes ao Modelo de Regressão Linear Simples Considerando: Hipótese 1 → E(u) = 0 A probabilidade do erro ser x unidades acima da reta é a mesma de ser x unidades abaixo. Hipótese 2 →E(u/x) = 0 O valor médio de u não depende do valor de x.

Função de Regressão Populacional Assim, considerando o valor esperado da equação que define o Modelo de Regressão Linear Simples condicionado a x, e levando em consideração a hipótese 2 temos: Que é a nossa Função de Regressão Populacional

Função de Regressão Amostral Por sua vez, quando não temos a disposição toda a população estudada podemos analisar apenas uma pequena parcela deste total, a amostra, o que nos dará a Função de Regressão Amostral (FRA). Que também pode ser escrita da seguinte forma: * Atenção para a diferença entre as duas.

Regressão : Conceitos O desafio é, portanto, estimar a FRP a partir da FRA. Aqui enfrentaremos alguns problemas!!! Pois é possível termos diversas FRA possíveis. Por causa da flutuação das amostras é difícil estimar a FRP de maneira acurada. Para n amostras é possível termos n FRAs.

Mínimos Quadrados Ordinários Para resolvermos o problema e conseguirmos obter a FRA que mais aproxima-se da FRP podemos utilizar do método Mínimos Quadrados Ordinários Sob certas hipóteses restritivas, o MQO tem algumas propriedades estatísticas muito atraentes, fazendo com que seja um dos métodos mais utilizados de regressão.

Mínimos Quadrados Ordinários O método de MQO pode ser apresentado relembrando a seguinte forma: FRP Como não é diretamente observável, a estimamos a partir da FRA:

Mínimos Quadrados Ordinários Mas como estimamos a FRA propriamente dita? Primeiro vamos expressar Da seguinte forma: Que mostra apenas que os resíduos são simplesmente as diferenças entre os valores reais e estimados.

Mínimos Quadrados Ordinários Então, para n pares de observação Y e X, queremos determinar a FRA de tal modo que seja tão próxima quanto possível do Y real. Para tanto podemos adotar o seguinte critério: Minimizando o quadrado dos erros. Ao elevarmos os erros ao quadrados implicitamente estaremos dando maior peso aos que se encontram

Mínimos Quadrados Ordinários Assim, como foi visto, a soma dos resíduos ao quadrado é uma função dos estimadores Pois, o método MQO escolhe os estimadores de tal maneira que, para uma dada amostra, é mínimo possível. Em outras palavras, para uma dada amostra, o método MQO nos fornece estimativas únicas dos estimadores que dão menor valor possível de

O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL) A partir de algumas hipóteses feitas com relação à interação entre estas variáveis é possível trabalharmos com o: O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL) Assim, o MCRL formula 10 hipóteses a respeito do comportamento das variáveis Y e X e os coeficientes β, bem como da interação entre eles.

Hipótese 1: Linearidade nos parâmetros Modelo Clássico de Regressão Linear Hipótese 1: Linearidade nos parâmetros

Hipótese 2: Os valores de X são fixados em amostra repetida Modelo Clássico de Regressão Linear Hipótese 2: Os valores de X são fixados em amostra repetida

Modelo Clássico de Regressão Linear Hipótese 2: Os valores de X são fixados em amostra repetida No nosso exemplo, escolhendo um valor de X (por exemplo US$ 80,00) teremos vários valores de Y. Isso implica que nossa análise de regressão é uma regressão condicional (condicional aos vários valores do regressor).

Modelo Clássico de Regressão Linear Hipótese 3: Valor médio zero da perturbação ui Dado o valor de X, o valor médio ou esperado do termo de erro estocástico ui é zero.

Modelo Clássico de Regressão Linear Hipótese 3: Valor médio zero da perturbação ui Isso significa que, os fatores não incluídos explicitamente no modelo (incluídos portanto, em u), não afetam sistematicamente o valor médio de Y, pois os valores positivos de u se anulam com os valores negativos. De modo que a sua média, ou o efeito médio sobre Y é nulo.

Modelo Clássico de Regressão Linear Hipótese 4: Homocedasticidade ou variância igual de ui Dado o valor de X, a variância de ui é a mesma para todas as observações. Ou seja, as variâncias condicionais de ui são idênticas. por causa da hipótese 3

Modelo Clássico de Regressão Linear Hipótese 4: Homocedasticidade ou variância igual de ui A variância de ui para cada Xi é algum número constante positivo igual a σ2 . De outra forma, a população dos Y dado X têm igual dispersão ou variância.

Hipótese 4: Homocedasticidade ou variância igual de ui Modelo Clássico de Regressão Linear Hipótese 4: Homocedasticidade ou variância igual de ui

Modelo Clássico de Regressão Linear Hipótese 4: Homocedasticidade ou variância igual de ui Se a dispersão varia para os diversos valores fixados de X temos uma situação de heterocedasticidade.

Modelo Clássico de Regressão Linear Hipótese 5: Nenhuma autocorrelação entre as perturbações ui Dado dois valores de X quaisquer, Xi e Xj, a correlação entre quaisquer dois valores ui e uj (i≠j) é zero.

Modelo Clássico de Regressão Linear Hipótese 5: Nenhuma autocorrelação entre as perturbações ui Não há correlação serial entre os erros. Por exemplo, se houvesse uma correlação entre ut e ut-1, Yt não dependeria apenas de X, mas de ut-1, pois este também explica ut.

Modelo Clássico de Regressão Linear Hipótese 6: Covariância zero entre ui e Xi ou E(uiXi) = 0 Isso significa que quando expressamos uma FRP, X e u exercem influência separada (independente) e cumulativa em Y.

Modelo Clássico de Regressão Linear Hipótese 7: O número de observações n deve ser maior que o número de parâmetros Ou seja, o número de observações deve ser maior que o de variáveis explicativas.

Modelo Clássico de Regressão Linear Hipótese 8: Variabilidade nos valores X Os valores de X em uma dada amostra não podem ser todos iguais. Se todos os valores fossem iguais Xi = X‾

Modelo Clássico de Regressão Linear Hipótese 8: Variabilidade nos valores X Isso tornaria impossível o cálculo dos coeficientes

Modelo Clássico de Regressão Linear Hipótese 9: Não há viés ou erro de especificação no modelo Parte do princípio de que o modelo foi construído a partir de uma fundamentação teórica.

Modelo Clássico de Regressão Linear Hipótese 9: Não há viés ou erro de especificação no modelo Parte do princípio de que o modelo foi construído a partir de uma fundamentação teórica.

Modelo Clássico de Regressão Linear ***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas Não há relações lineares perfeitas entre as variáveis Nenhuma das variáveis explicativas pode ser escrita como combinação linear das demais.

Modelo Clássico de Regressão Linear ***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas

Modelo Clássico de Regressão Linear ***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas Exemplo: Seja o modelo Em que Y = consumo; X2 = renda; X3= riqueza

Melhor Estimador Linear Não-Viesado No entanto, podemos admitir que, sob as hipóteses do MCRL as estimativas por mínimos quadrados possuem algumas propriedades ótimas. Estas propriedades estão descritas no Teorema de Gauss-Markov. E condicionam os estimadores a ser o Melhor Estimador Linear Não-Viesado (MELNV).

Melhor Estimador Linear Não-Viesado Um estimador, digamos o , será considerado um MELNV caso sejam válidas as seguintes condições: É linear, isto é, uma função linear de uma variável aleatória, tal como a variável dependente Y no modelo de regressão. É não viesado, isto é, seu valor médio esperado é igual ao valor verdadeiro β2. Tem mínima variância na classe de todos os estimadores lineares não viesados.

Melhor Estimador Linear Não-Viesado 3. Tem mínima variância na classe de todos os estimadores lineares não viesados. Um estimador não-viesado com a menor variância é conhecido como um estimador eficiente.

Teorema de Gauss-Markov No contexto da regressão pode-se provar que os estimadores por MQO são MELNV. Esta é a essência do Teorema de Gauss-Markov. Teorema de Gauss-Markov: dadas as hipóteses do Modelo Clássico de Regressão Linear, os estimadores por mínimos quadrados, na classe dos estimadores lineares não viesados, têm mínima variância, isto é, são MELNV.

O Coeficiente de Determinação r2 Depois de estimados os coeficientes de nossa regressão, como verificar o “grau de ajuste” (o quão bem a reta de regressão amostral se ajusta aos dados) do modelo estimado? Através do Coeficiente de Determinação r2 ou (R2 para regressões múltiplas) Que é uma medida sintética que diz o quão bem a reta de regressão amostral se ajusta aos dados.

Hipótese da Normalidade Mas, além de averiguar o “grau de ajuste” da regressão, podemos verificar se cada um dos coeficientes obtidos é estatisticamente significante. Isso é possível através do Teste de Hipótese. Para tanto, mais uma hipótese desse ser inserida ao nosso contexto. A Hipótese da Normalidade dos erros que resulta no: Modelo Clássico de Regressão Linear Normal

Modelo Clássico de Regressão Linear Normal O MCRLN assume, então, que cada termo de erro ui é distribuído normalmente com: Ou simplesmente:

Modelo Clássico de Regressão Linear Normal Considerando que, se duas variáveis normalmente distribuídas possuem covariância igual a zero elas são ditas independentes, podemos dizer que: Em que NID significa: Normalmente e independentemente distribuído.

Hipótese da Normalidade Mas por que assumir que os erros são normalmente distribuídos? Ou ainda, por que a distribuição normal?

Hipótese da Normalidade 1 – Sabemos que o termo de erro representa a influência de uma série de variáveis independentes que não estão explicitamente introduzidas na regressão. Pela Teoria do Limite Central sabemos ainda que se há um grande número de variáveis aleatórias independentes e identicamente distribuídas, o seu somatório tende a uma distribuição normal a medida que o número destas variáveis aumenta.

Hipótese da Normalidade 2 – Assumindo a hipótese da normalidade dos erros a distribuição de probabilidade dos estimadores do MQO também se torna mais simples de calcular. Pelas propriedades da distribuição linear “toda função linear de variáveis normalmente distribuídas é também normalmente distribuída”.

Hipótese da Normalidade 3 - A própria distribuição normal é mais simples de se trabalhar pois utiliza-se de apenas dois parâmetros: Normal (média, variância)

Hipótese da Normalidade 4 – Quando se trabalha com amostras relativamente pequenas, a hipótese da normalidade nos permite não apenas calcular a distribuição de probabilidade dos estimadores por MQO, mas também, que se use os testes estatísticos para os testes de hipótese.

Hipóteses dos estimadores por MQO sob a hipótese da Normalidade São não-viesados; Possui variância mínima; São consistentes, isto é, à medida que a amostra aumenta eles convergem para os valores verdadeiros da população.

4 – os estimadores podem ser calculados da seguinte forma: Hipótese da Normalidade 4 – os estimadores podem ser calculados da seguinte forma:

Hipótese da Normalidade 5 – Sob a hipótese da normalidade os estimadores terão variância mínima entre todos os estimadores não viesados, lineares ou não.

Teoria da Estimação Depois de assumirmos que os erros se distribuem normalmente, e consequentemente os estimadores da FRA, é possível agora testá-los para avaliar o quão próximos estão dos reais coeficientes. OU seja, se os betas encontrados são confiáveis ou não. Esta parte da análise econométrica é conhecida como Teoria da Estimação. Que consiste em duas partes: Estimativa de ponto; Estimativa de intervalo.

Estimativa de ponto Estimativa de ponto A Estimativa de ponto é o que temos feito até o momento. Calcular uma única estimativa (um valor) para um determinado parâmetro populacional que nos informará os valores de: Outros exemplos de estimativa de ponto são a média amostral, a variância amostral etc.

Para isso trabalharemos com a Estimativa de Intervalo. Estimativa de ponto Entretanto, sabemos que para cada nova FRA poderemos ter outros valores das estimativas de ponto, inclusive para os estimadores. Assim, torna-se interessante não apenas trabalharmos com pontos isolados, mas com um verdadeiro intervalo de pontos aos quais os valores dos coeficientes poderiam assumir. Para isso trabalharemos com a Estimativa de Intervalo.

Estimativa de Intervalo Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parâmetro populacional provavelmente se encontrará. Este intervalo dentro do qual um parâmetro populacional é esperado ocorrer é chamado de Intervalo de Confiança (IC).

Estimativa de Intervalo Matematicamente o Intervalo de Confiança pode ser representado da seguinte maneira: Em que 1: 1 – α = nível de confiança; α = nível de significância.

Estimativa de Intervalo 1 – α →Nível de confiança: é a probabilidade de que o intervalo encontrado contenha o valor real do parâmetro analisado; α → Nível de significância: é a probabilidade de que o intervalo encontrado NÃO contenha o valor real do parâmetro analisado.

Estimativa de Intervalo

Cálculo do Intervalo de Confiança Cálculo do IC: Considerando que os erros seguem uma distribuição normal podemos dizer que os próprios estimadores também seguem esta distribuição. Então é possível trabalharmos com a estatística:

Cálculo do Intervalo de Confiança Entretanto, toda vez que o desvio-padrão populacional não for conhecido devemos trabalhar com a estatística t-student. Dado as características estatísticas da distribuição Z ela pode ser reescrita da seguinte forma:***: Prova no Apêndice 5A.

Cálculo do Intervalo de Confiança Então, é possível estabelecer o Intervalo de Confiança para o estimador utilizando a estatística t-student ao invés da normal.

Cálculo do Intervalo de Confiança Que por sua vez pode ser matematicamente expresso da seguinte forma: Ou considerando os graus de liberdade:

Cálculo do Intervalo de Confiança Exemplo: A estimação de um modelo que testava a influência da renda no consumo resultou nos seguintes valores: E considerando um α (Nível de significância) de 5%, calcule os limites do intervalo de confiança para .

Cálculo do Intervalo de Confiança  

Cálculo do Intervalo de Confiança

Cálculo do Intervalo de Confiança  

Cálculo do Intervalo de Confiança Mas, notem que isso é diferente de dizer que a probabilidade é de 95% por cento que o intervalo específico (0,4268-0,5914) contenha o β2 verdade. Como o intervalo agora é fixo e não aleatório, portanto, β2 ou reside nele ou não: a probabilidade de que o especificado intervalo fixo inclua o β2 verdadeira é, então, 1 ou 0.

Testes de Hipóteses - Conceitos Também é possível testar se os dados que obtivemos para uma população são corroborados pela evidência de uma amostra. Esta é a base de Testes de Hipóteses. Em outras palavras o testes de hipóteses procura averiguar se uma dada observação encontrada é compatível com a hipótese testada. Onde a palavra “compatível”significa “suficientemente” próxima do valor hipotético de modo que podemos não rejeitar a hipótese levantada.

Testes de Hipóteses - Passos Para testarmos se uma hipótese é verdadeira ou não Tavares (2011) define os seguintes passos: 1) Definir a hipótese nula (H0) e a hipótese alternativa (H1); Hipótese nula (H0): especifica um valor para o parâmetro que queremos testar. Representa uma crença que mantemos até que a evidência seja refutada ou aceita. Hipótese alternativa (H1): confronta a hipótese nula.

Testes de Hipóteses - Passos 2) Definir o nível de significância (α). 3) Definir a distribuição amostral a ser utilizada (parcela da população que será analisada). 4) Definir os limites da região de rejeição e aceitação (o Intervalo de Confiança) 5) Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

Testes de Hipóteses - Passos Exemplo: O IBGE divulgou que em 2009 o PIB per capita da cidade de Formiga foi de aproximadamente R$ 10.500,00. Em uma pesquisa realizada na cidade com uma amostra de 121 pessoas, encontrou-se um PIB per capita de R$11.000,00 com desvio-padrão de R$1.500,00. Ao nível de significância de 5% é possível dizer que a média amostral é igual a média populacional?

Testes de Hipóteses - Passos 1 - Formulando nossas hipóteses. Ho: μ = R$ 10.500,00 H1: μ > R$ 10.500,00 (teste unicaudal à direita) – o retorno médio é superior a R$ 10.500,00; H1: μ < R$ 10.500,00 (teste unicaudal à esquerda) – o retorno médio é inferior a R$ 10.500,00; H1: μ ≠ R$ 10.500,00 (teste bicaudal) – o retorno médio é diferente de R$ 10.500,00.

Testes de Hipóteses - Passos 2 - Definir o nível de significância. O nível de significância de um teste é dado pela probabilidade de se cometer erro do tipo I (ocorre quando você rejeita a hipótese Ho e esta hipótese é verdadeira). Com o valor desta probabilidade fixada, você pode determinar o chamado valor crítico, que separa a chamada região de rejeição da hipótese Ho da região de aceitação da hipótese Ho. Definido em 5%.

Testes de Hipóteses - Passos O fato de estarmos usando resultados amostrais para fazermos inferência sobre uma população pode nos conduzir a erros. A estes erros damos os nomes: Erro tipo I: rejeitar H0 quando ela é verdadeira. Sua probabilidade é dada por α, denominado nível de significância. Erro tipo II: aceitar H0 quando ela é falsa. Sua probabilidade é dada por β e relaciona-se com o chamado Poder do teste (1- β).

Testes de Hipóteses - Passos 3 - Definir a distribuição amostral a ser utilizada. A estatística a ser utilizada no teste será definida em função da distribuição amostral a qual os dados seguem. Se quiser fazer um teste de hipótese para uma média ou diferença entre médias, utilize a distribuição de Z (variância conhecida) ou t de Student (variância desconhecida da população). Se quiser comparar a variância de duas populações, então deverá trabalhar com a distribuição F, ou seja, da razão de duas variâncias.

Testes de Hipóteses - Passos 4 - Definir os limites da região de rejeição Os limites entre as regiões de rejeição e aceitação da hipótese Ho, você definirá em função : Do tipo de hipótese H1; Do valor de (nível de significância); Da distribuição amostral utilizada.

4 - Definir os limites da região de rejeição Testes de Hipóteses - Passos 4 - Definir os limites da região de rejeição

Testes de Hipóteses - Passos 4 - Definir os limites da região de rejeição Então localizamos o intervalo de confiança para nossa amostra com α =5% e graus de liberdade = 120 na tabela t-student. Pela tabela t-student : IC = + ou - 1,980

4 - Definir os limites da região de rejeição Testes de Hipóteses - Passos 4 - Definir os limites da região de rejeição

Testes de Hipóteses - Passos 5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos. Para tanto calculamos a estatistica t de nossa amostra: t = 11.000 −10.500 1500 =0,33

Testes de Hipóteses - Passos 5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

Testes de Hipóteses - Passos 5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos. OU ainda podemos calcular a Região Crítica: 𝑅𝐶=10500 −1,980∗1500 ≤ β2≤10500+1,980∗1500 𝑹𝑪=𝟕𝟓𝟑𝟎≤ 𝜷𝟐≤𝟏𝟑𝟒𝟕𝟎

Testes de Hipóteses - Passos 5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

Testes de Hipóteses - Passos 6 – Tomar decisão Como em nosso exemplo a estatística t ficou dentro do intervalo de confiança (o valor do estimador ficou dentro da região de aceitação) dizemos que não é possível rejeitar a hipótese nula.

Valor p < α → rejeita-se Ho Valor p > α → não rejeita-se Ho Uma estatística importante calculada nas regressões é o valor p (p-value). O valor p pode ser entendido como o nível de significância observado ou exato. É o nível mínimo de significância ao qual a hipótese nula pode ser rejeitada. Em outras palavras, a probabilidade exata de se cometer o erro tipo I. Se o valor do p-valor for menor que o nível de significância estipulado, assume-se o erro tipo I e rejeita-se a hipótese nula. Valor p < α → rejeita-se Ho Ao contrário, se o p-valor for maior, não é assumido o erro tipo I e não se rejeita a hipótese nula. Valor p > α → não rejeita-se Ho

Análise Output da regressão Considere um modelo onde desejamos explicar o lucro por ação (LPA) de uma empresa através de algumas variáveis representadas por dados contábeis e medidas de mercado. Neste caso, as variáveis independentes escolhidas foram: Liquidez geral (liq_gera): Ativo Circulante + Realizável a Longo Prazo) / (Passivo Circulante + Passivo Não Circulante; Presença em bolsa (presen): % de participação em transações na bolsa no período analisado; Volatilidade (vol): variância ou mensuração do grau de risco de cada ativo;

Análise Output da regressão Lembrando que, para construirmos nosso modelo, temos que ter em mente o quadro visto: Pois, na maioria dos casos, o modelo deve ser construído com base em uma teoria anterior.

Análise Output da regressão Assim, nossa hipótese é que o lucro por ação é explicado pela Liquidez geral, pela Presença em bolsa e pela Volatilidade. Matematicamente falando: LPA = f(liq_gera; presen; vol) Econometricamente falando: LPA = β0 + β1 liq_gera+ β2 presen + β3 vol + ui

Análise Output da regressão Portanto, estimando nosso modelo (através do STATA) temos o seguinte output LPA = β0 + β1 liq_gera+ β2 presen + β3 vol + ui

Análise Output da regressão Em que:

Análise Output da regressão Assim, o modelo estimado foi: LPA = -0,843708 - 0,386184 liq_gera + 0,282046 presen -0,027831 vol

Análise Output da regressão Entretanto, considerando as estatísticas t e o valor p da regressão: Como: Valor p > α → não rejeita-se Ho (neste caso, testa-se se o coeficiente é igual a 0) É possível observar que para os coeficientes, liq_gera, presen e _const, não rejeitamos a hipótese nula de que eles são estatisticamente iguais a zero. Nesse caso, nosso modelo pouco explicou o lucro por ação.

Análise Output da regressão O que, de fato, também é apresentado pelo R2 muito baixo: A grosso modo, apenas cerca de 5% do lucro por ação é explicado pelas variáveis apresentadas.

Análise Output da regressão Sabendo disso podemos tentar testar outra hipótese: LPA = β0 + β1 vol + ui OU seja, testar se o LPA pode ser explicado apenas pela volatilidade das ações.

Assim, o resultado deste novo modelo: LPA = β0 + β1 vol + ui Análise Output da regressão Assim, o resultado deste novo modelo: LPA = β0 + β1 vol + ui

Análise Output da regressão Que por sua vez nos apresenta que: LPA = 1,927125 - 0,0277792 vol Com um R2 = 0,0508 Mas com todas aos valores p estatisticamente significante, ou seja, menores do que α=0,05, rejeitando a hipótese nula de que os coeficientes sejam igual a zero.

Análise Output da regressão Com base na teoria que vimos até aqui, comparando os dois modelos, como o R2 se mostram praticamente nos mesmos níveis (0,0509 para o modelo completo e 0,0508 para o modelo restrito), optaríamos pelo segundo modelo, pois, todos os coeficientes são estatisticamente diferentes de zero.

Análise Output da regressão A tomada de decisão entre dois modelos inicia-se desta forma, mais a frente veremos outros testes a serem aplicados. Mas de qualquer forma, temos que ter em mente a teoria econômica por trás do modelo. Vejamos se nosso modelo economicamente está correto:

Análise Output da regressão Nosso modelo está descrito da seguinte forma: LPA = 1,927125 - 0,0277792 vol Isso significa que o lucro por ação cai se a volatilidade aumenta (????) Considerando que nos dados obtidos a volatilidade variou de 20 (mínima) até 260 (máxima) podemos construir um gráfico desta variação.

Análise Output da regressão LPA beta 0 beta 1 Vol 1,371545 1,927125 0,027779 20 -2,23973   150 1,093755 30 -2,51752 160 0,815965 40 -2,79531 170 0,538175 50 -3,0731 180 0,260385 60 -3,35089 190 -0,01741 70 -3,62868 200 -0,2952 80 -3,90647 210 -0,57299 90 -4,18426 220 -0,85078 100 -4,46205 230 -1,12857 110 -4,73984 240 -1,40636 120 -5,01763 250 -1,68415 130 -5,29542 260 -1,96194 140

Análise Output da regressão

Análise Output da regressão Com isso, nosso modelo nos diz que se a volatilidade for igual a 20 o lucro por ação será de cerca de 1,37, e caso a volatilidade suba para 260, este lucro será, na verdade, um prejuízo de cerca de -5,3. Será???? Na verdade sabemos que o lucro por ação está num intervalo maior do que isso. Além disso, alguns estudos apontam que o lucro por ação explica parte da volatilidade encontrada.

Análise Output da regressão Resultado: Mesmo nossos os coeficientes sendo estatisticamente diferentes de zero, nosso modelo cai devido à sua falta de fundamentação teórica e empírica. Ou seja, este nosso modelo seria rejeitado.