Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRaul Pereira Gameiro Alterado mais de 6 anos atrás
1
MBA em Gestão de Projetos e Processos Organizacionais
Estatística Aplicada Galo Lopez Noriega
2
Regressão Linear Simples
Levine: Capítulos 11 e 12 Anderson: Capítulo 12
3
Alguns Exemplos Aumento das vendas de acordo com a incidência de anúncios na TV em horário nobre; Receita do Hotel Bellagio em Las Vegas de acordo com o número de shows feitos pelo Cirque du Soleil; Coerência das deduções feitas pelos contribuintes em relação à sua receita bruta; Aumento do consumo de energia elétrica devido ao crescimento do uso de computadores; Taxas especiais em hotéis para quem viaja à negócios; Taxa de desemprego e taxa de criminalidade.
4
Previsão de Vendas Márcia M. é a Gerente de MKT da Mota & Alves Editora, uma grande editora de livros nacionais e importados. A M&A lançou um nova linha de livros de idiomas no mercado. Esta nova linha de produtos foi lançado inicialmente em algumas de suas unidades no nordeste norte americano, fazendo uso de campanhas publicitárias (a tabela a seguir mostra os gastos em publicidade e os valores das vendas).
6
Márcia está interessada em analisar estes dados para determinar quais serão as vendas em duas novas regiões nas quais as verbas para Publicidade são de US$ 2,0 milhões. Com base nas informações fornecidas gostaríamos responder as seguintes questões: Qual a relação entre a publicidade e as vendas? Qual o valor estimado para as vendas em regiões nas quais se pretende investir $2,0 milhões? Quão confiáveis são estes valores estimados?
7
Primeiro vamos desenhar o gráfico scatter plot...
8
Agora vamos adicionar a linha de tendência...
Reta estimada inclinações da reta
9
Com isso, temos a Equação de Regressão Estimada...
Para estimarmos quais serão as vendas para um investimento de $2,0 milhões em publicidade, basta usarmos a equação determinada: Conclusão: As vendas estimadas serão de $111,02 milhões
10
Regressão Linear Simples
A regressão linear simples ocorre quando desejamos explicar uma variável y usando uma variável explicativa x. O Modelo de Regressão Linear Simples: A Equação de Regressão Estimada Valores estimados Não é causa e efeito entre as variáveis
11
Hummmm.... E se o coeficiente b1 for igual a zero???
Para pensar... Hummmm.... E se o coeficiente b1 for igual a zero???
12
Para pensar... Se o coeficiente b1 for zero, então y não depende do valor de com x. Isso significa dizer que eles não são linearmente relacionados. Alternativamente, se o valor b1 não é igual a zero, concluímos que as duas variáveis estão relacionadas. Desta forma, para testarmos uma relação de regressão significante, devemos realizar um teste de hipóteses para determinar se o valor de b1 é zero.
13
Coeficiente de Correlação (–1<r<1) Relação Linear
Análise ANOVA no Excel... ANalysis Of VAriance Coeficiente de Correlação (–1<r<1) Relação Linear Coeficiente de Determinação (0<r2<1) Relações lineares e não-lineares Teste t Valor p
14
Coeficiente de Correlação
Como exemplo, podemos citar a correlação fortemente positiva da relação entre idade e estatura de uma criança; quanto maior a idade maior a estatura. Um exemplo de forte correlação negativa é a relação entre a temperatura e o consumo de cobertores; quando maior a temperatura, menor o consumo de cobertores. Um exemplo da inexistência de correlação é a relação entre o número do calçado de um adulto e o seu nível intelectual. Ou ainda, a paixão pelo Timão em função do número de vitórias ou derrotas!
15
Hummm.... Mas os valores que achamos têm significância?
Para pensar... Hummm.... Mas os valores que achamos têm significância?
16
Inferências (hipóteses) sobre os parâmetros da população na Regressão
Vamos ao Teste de Significância Inferências (hipóteses) sobre os parâmetros da população na Regressão Estabelecer conclusões sobre a inclinação da população b1 H0 : b 1 = 0 H1 : b 1 0 Caso b1 seja igual a zero, então y não depende de x (não existe relação)
17
Rejeite H0 se t < - t/2 ou se t > t/2
Regra de Rejeição em um Nível de Significância Rejeite H0 se t < - t/2 ou se t > t/2 Onde t/2 é baseado em uma distribuição t com n – 2 graus de liberdade. Não rejeitar H0 Valor crítico Rejeitar H0 A estatística de t segue uma distribuição com n-p-1 g.l.
18
Regra de Rejeição em um Nível de Significância
Vamos ao nosso problema... 1- Pegamos a estatística t da nossa análise ANOVA: Statistic t = 12,5838 Nossas hipóteses: H0 : b 1 = 0 H1 : b 1 0 2- Vamos comparar com a tabela t para um nível de significância de 0,05 e 12 graus de liberdade : t0,025 = 2,179 3- Comparando: 12,58 > 2,179 rejeito a hipótese de H0: 1 = 0. Isto é, existe uma relação entre x e y.
19
Temos 14 observações. Então n – 2 = 14 – 2 = 12 graus de liberdade
Tabela t-Student Vamos analisar para um nível de significância de 5%. Isso é = 0,05. Para a nossa análise, precisamos de /2. Então, /2 = 0,025. Com isso entramos na tabela Temos 14 observações. Então n – 2 = 14 – 2 = 12 graus de liberdade
20
Resumo R-Múltiplo=0,96 é o coeficiente de correlação amostral (lembre-se que o coeficiente de correlação situa-se entre –1 e 1) R-quadrado=0,93 é o coeficiente de Determinação da regressão. Explica que 93% das variações nas vendas (y) são “explicadas” pelos gastos em publicidade, ficando 7% sem explicação. O valor 0, é o valor p do teste de hipótese de b1 ser zero. Como o p-value é menor que 5% rejeitamos a hipótese nula, isto é, b1 é diferente de zero. (p ≥ a, a hipótese nula não é rejeitada; p < a, a hipótese nula é rejeitada). A equação estimada é y = 13, ,6x
21
Exercício O índice Dow Jones Industrial Average (DJIA) e o Standard & Poor’s (S&P500) são ambos medidas da movimentação no mercado de ações. O DJIA é baseado na movimentação dos preços dos papéis das 30 maiores companhias, o S&P500 é um índice composto de 500 ações. A tabela a seguir mostra os índices para o DJIA e S&P500 para as últimas 10 semanas de 1997.
22
Qual é a relação entre o DJIA e o S&P500 ?
Quão confiáveis são os valores estimados?
23
Análise da Regressão
24
Análise ANOVA no Excel
25
Regra de Rejeição em um Nível de Significância
Vamos ao nosso problema... 1- Pegamos a estatística t da nossa análise ANOVA: Statistic t = 28,779 Nossas hipóteses: H0 : b 1 = 0 H1 : b 1 0 2- Vamos comparar com a tabela t para um nível de significância de 0,05 e 8 graus de liberdade t0,025 = 2,306 3- Comparando: 28,779 > 2,306 rejeito a hipótese de H0: 1 = 0. Isto é, existe uma relação entre x e y.
26
Temos 10 observações. Então n – 2 = 10 – 2 = 8 graus de liberdade
Tabela t-Student Vamos analisar para um nível de significância de 5%. Isso é = 0,05. Para a nossa análise, precisamos de /2. Então, /2 = 0,025. Com isso entramos na tabela Temos 10 observações. Então n – 2 = 10 – 2 = 8 graus de liberdade
27
Resumo da Análise de Regressão
R2=0,99 indica que 99% da variação do S&P500 pode ser explicada pela variação do DJIA através da equação de regressão A Estatística de t é igual a 28,78, portanto, rejeitamos H0 e concluímos que existe uma relação linear entre y e x Equação de regressão y = 166,0828+0,100601x
28
Estudo de caso 1: Gastos e Desempenho Estudantil
Deseja-se descobrir se o progresso educacional dos estudantes está relacionado com quanto um estado em que residem gasta com educação. Em muitas comunidades, essa importante questão tem sido colocada nas pautas das discussões pelos secretários de educação, que vêem uma relação positiva entre os gastos e o progresso dos estudantes, para que haja um aumento na taxa de gastos governamentais com o ensino. Neste caso você é convidado a analisar os dados relativos a gastos e pontuações de progresso para determinar se há alguma relação entre os gastos e o progresso dos estudantes nas escolas públicas. O Levantamento Nacional de Progresso Educacional (National Assessment Educational Progress-NAEP) é freqüentemente usado para medir a qualidade da educação nos EUA. O arquivo EC-Reg Linear.xls (planilha EC1-naep) exibe o gasto total corrente por aluno/ano e a pontuação média do teste NAEP para 35 estados participantes do programa. A pontuação média é a soma das pontuações em matemática, ciências e leitura no teste NAEP de A pontuação máxima é de 1300 pontos.
29
Relatório Gerencial: Desenvolva um resumo numérico e gráfico dos dados (média, desvio padrão e diagrama de dispersão). Verifique – utilizando regressão linear - se há alguma relação entre a quantia gasta por aluno e a pontuação média do teste NAEP. Discuta suas conclusões (teste o gasto como variável independente). Você acredita que a regressão estimada poderia ser usada para estimar as pontuações médias para estados que não participaram do programa NAEP? Explique. Suponha que você use na regressão somente estados que gastam no mínimo US$4000 por aluno e não mais que US$6000 por aluno. Para estes estados, a relação entre as duas variáveis parece ser de alguma forma diferente do conjunto completo de dados? Explique. Baseado nas suas análises, você acha que o nível de progresso educacional dos estudantes está relacionado com o montante que o estado gasta com educação?
30
Relatório Gerencial: Desenvolva um resumo numérico e gráfico dos dados (média, desvio padrão e diagrama de dispersão).
31
O que você acha Relatório Gerencial:
Verifique – utilizando regressão linear - se há alguma relação entre a quantia gasta por aluno e a pontuação média do teste NAEP. Discuta suas conclusões (teste o gasto como variável independente). O que você acha
32
Relatório Gerencial: Você acredita que a regressão estimada poderia ser usada para estimar as pontuações médias para estados que não participaram do programa NAEP? Explique.
33
O que você acha Relatório Gerencial:
Suponha que você use na regressão somente estados que gastam no mínimo US$4000 por aluno e não mais que US$6000 por aluno. Para estes estados, a relação entre as duas variáveis parece ser de alguma forma diferente do conjunto completo de dados? Explique. O que você acha
34
Análise ANOVA no Excel
35
Relatório Gerencial: Baseado nas suas análises, você acha que o nível de progresso educacional dos estudantes está relacionado com o montante que o estado gasta com educação?
36
Exercício Proposto A Value Line (February 24, 1995) reportou que o mercado beta para a Woolworth Corporation é 1,25. Mercados beta para ações são determinados por regressão linear simples. Para cada ação, a variável dependente é a sua porcentagem do retorno trimestral (valorização do capital mais dividendos) menos a porcentagem de retorno que poderia ser obtida de um investimento livre de riscos (risk-free). A variável independente é a porcentagem de retorno trimestral (valorização do capital mais dividendos) para o mercado de ações (S&P500) menos a porcentagem de retorno de um investimento livre de riscos. Uma equação de regressão estimada é desenvolvida com dados trimestrais; o mercado beta para a ação é a inclinação da equação de regressão estimada (b1). O valor do mercado beta é freqüentemente interpretado como uma medida do risco associado à ação. Mercados beta maiores que 1 indicam que ação é mais volátil do que a média do mercado; mercados beta menores que 1 indicam que a ação é menos volátil do que a média do mercado.
37
A equação de regressão estimada forneceu um bom ajuste? Explique.
As diferenças entre a porcentagem de retorno e a porcentagem livre de riscos para 10 trimestres da S&P500 e da IBM são mostradas: Desenvolva a equação de regressão linear para determinar o mercado beta para a IBM. Qual é o mercado beta da IBM? Faça o teste t de significância da regressão com 0,05 de nível de significância A equação de regressão estimada forneceu um bom ajuste? Explique. Use os mercados beta da Woolworth e da IBM para comparar o risco associado às duas ações. (a) Mercado beta=0,95; (b)relação significante; (c)r2=0,470, não é um ajuste muito bom; (d) Woolworth tem um risco maior
38
Desenvolva a equação de regressão linear para determinar o mercado beta para a IBM. Qual é o mercado beta da IBM? Mercado beta da IBM é 0,95 (o coeficiente angular)
39
1- Pegamos a estatística t da nossa análise ANOVA:
b) Faça o teste t de significância da regressão com 0,05 de nível de significância Nossas hipóteses: 1- Pegamos a estatística t da nossa análise ANOVA: Statistic t = 2,6609 H0 : b 1 = 0 H1 : b 1 0 2- Vamos comparar com a tabela t para um nível de significância de 0,05 e 8 graus de liberdade t0,025 = 2,306 3- Comparando: 2,6609 > 2,306 rejeito a hipótese de H0: 1 = 0. Isto é, existe uma relação entre x e y.
40
c) A equação de regressão estimada forneceu um bom ajuste? Explique.
O que você acha d) Use os mercados beta da Woolworth e da IBM para comparar o risco associado às duas ações. Mercado beta da Woolworth é 1,25. Isso indica ações mais voláteis e portanto, maior risco.
41
Analisando a não-linearidade
42
Como os dados estão relacionados
Desenhando o gráfico scatter plot... Como os dados estão relacionados
43
Tipos de regressão
46
Estudo de caso 3: Mudanças leste-oeste
Exercício de hoje Escolha um dos casos abaixo, faça todas as análises estatísticas e de regressão. O que podemos concluir? Estudo de caso 2: U.S. Department of Transportation Estudo de caso 3: Mudanças leste-oeste Estudo de caso 4: Springville Herald Entregar exercício, na próxima aula, em grupos de até 3 alunos.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.