A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística

Apresentações semelhantes


Apresentação em tema: "UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística"— Transcrição da apresentação:

1 UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística
Estudo da expectativa de vida nos Estados Unidos utilizando regressão linear múltipla. Laboratório de Estatística I Outubro, 2007 Jéssica Jabczenski Roslindo

2 Introdução Expectativa de vida é o número médio de anos que uma pessoa pode esperar viver, se submetido, desde o nascimento, às taxas de mortalidade observadas no momento. Várias variáveis influenciam na composição dessa estatística, como: acesso a saúde, educação, cultura, lazer, violência, criminalidade, poluição e situação econômica do lugar em questão. Segundo o IBGE a expectativa de vida dos Estados Unidos é de 77,3 e do Brasil 70,3 para o ano de 2005.

3 Objetivo Encontrar quais as variáveis que mais influenciam na expectativa de vida dos Estados Unidos com base nos dados coletados.

4 Dados Os dados se referem-se aos 50 estados norte-americanos.
Variáveis X3 : Renda per capita em 1974, em US$ X4 : Proporção de analfabetos em 1970 X6 : Taxa de criminalidade por habitantes, em 1976 X7 : Porcentagem de estudantes que concluíram o 2º grau em 1970 X8 : Número de dias do ano com temperatura abaixo de zero grau Celsus na cidade mais importante do estado X9 : Densidade demográfica, calculada através da divisão entre a população estimada em julho de 1975 e a área de cada estado Y : Expectativa de vida em anos 1969 – 1970

5 Análise dos dados Resultados
Foi utilizada a regressão linear múltipla. Análise das regressoras: Correlação: tirar 95% de confiança!!! Correlação entre cada Xi e Y: Correlações em vermelho e verde são significativas: p-valor < 0, e 95% de nível de confiança.

6 Análise dos dados Resultados
Normalidade de Y: teste de Shapiro-WilK: 0,97 p-valor: 0,44 A variável resposta possui distribuição normal. Utilizando os métodos de seleção forward, backward e stepwise encontramos o seguinte modelo: Y = – 0,28 X6 + 0,04 X7 – 0,007 X8 – 0,45 X9 QMres = 0,528 R2 = 0,73 R2a = 0,70

7 Análise dos dadosResultados
Existe correlação significativa entre as regressoras: X6 e X7 = -0,48 X6 e X8 = -0,53 Demais correlações mão estâp correlacionadas estatisticamete. VIF: Como os valores dos VIF’s não ultrapassaram 5, os coeficientes da regressão não estarão pobremente estimados por causa da multicolinearidade.

8 Análise dos dadosResultados
Análise dos Resíduos: Resíduos x valores ajustados: Há homogeneidade nas variâncias dos erros. Gráfico Normal de Probabilidade: Os resíduos são normalmente distribuidos. RAIZ dos Resíduos padronizados x valores ajustados: Independência. ?? Distância de Cook: pontos atípicos: 11, 40 e 47.

9 Análise dos dadosResultados
Diagnóstico de Influência: Explicar o ponto de corte cada uma!!!! ??????

10 Análise dos dados Análise do modelo sem a observação 40: ??????

11 Resultados Conclusões
Escrever o modelo e sua interpretação.


Carregar ppt "UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística"

Apresentações semelhantes


Anúncios Google