A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Aplicada Larson Farber 9 Correlação e regressão.

Apresentações semelhantes


Apresentação em tema: "Estatística Aplicada Larson Farber 9 Correlação e regressão."— Transcrição da apresentação:

1 Estatística Aplicada Larson Farber 9 Correlação e regressão

2 Correlação Seção 9.1

3 Correlação Que tipo de relação existe entre as duas variáveis? A correlação é significante? x y Cigarros fumados por dia Nota no vestibular Altura Horas de treinamento Variável explanatória (ou independente) Variável resposta (ou dependente) Uma relação entre duas variáveis. Número de acidentes Número do sapatoAltura Capacidade pulmonar Média de notas na graduação QI

4 Correlação negativa: à medida que x cresce, y decresce. x = horas de treinamento y = número de acidentes Mapas de dispersão e tipos de correlação 60 50 40 30 20 10 0 02468 1214161820 Horas de treinamento Acidentes

5 Correlação positiva: à medida que x cresce, y cresce também. x = nota no vestibular y = média de notas na graduação Média de notas na graduação Mapas de dispersão e tipos de correlação 4,00 3,75 3,50 3,00 2,75 2,50 2,25 2,00 1,50 1,75 3,25 300350400450500550600650700750800 Nota no vestibular

6 Não há correlação linear. x = altura y = QI Mapas de dispersão e tipos de correlação 160 150 140 130 120 110 100 90 80 606468727680 Altura QI

7 Coeficiente de correlação Mede a intensidade e a direção da relação linear entre duas variáveis. O intervalo de r vai de –1 a 1. Se r está próximo de 1, há uma forte correlação positiva. Se r está próximo a –1, há uma forte correlação negativa. Se r está próximo de 0, não há correlação linear. –1 0 1

8 x y 8 78 2 92 5 90 12 58 15 43 9 74 6 81 Faltas Nota final Aplicação 95 90 85 80 75 70 65 60 55 45 40 50 0246810121416 Nota final X Faltas

9 6.084 8.464 8.100 3.364 1.849 5.476 6.561 624 184 450 696 645 666 486 575163.75157939.898 1 8 78 2 2 92 3 5 90 4 12 58 5 15 43 6 9 74 7 6 81 64 4 25 144 225 81 36 xy x 2 y2y2 Cálculo de r x y (3.751) (39.898) 13.030 0,975 3.155

10 r é o coeficiente de correlação em uma amostra. O coeficiente de correlação populacional é (rô). A distribuição amostral de r é uma distribuição t com n – 2 g.l. Estatística teste padronizada: Em um teste bicaudal de significância: Para testar a significância negativa ou positiva, no caso de cauda à esquerda e de cauda à direita: Teste de hipóteses para determinar a significância (A correlação não é significante.) (A correlação é significante.) H0H0 H0H0 H0H0 HaHa HaHa HaHa

11 Uma distribuição t com cinco graus de liberdade. Teste de significância Você encontrou a correlação entre o número de faltas e a nota final, r = –0,975. Há sete pares de dados. Teste a significância dessa correlação. Use = 0,01. 1. Estabeleça as hipóteses nula e alternativa. 2. Estabeleça o nível de significância. 3. Identifique a distribuição amostral. (A correlação não é significante.) (A correlação é significante.) = 0,01 HaHa H0H0

12 t 0 4,032 –4,032 Regiões de rejeição Valores críticos ± t 0 4. Determine o valor crítico. 5. Determine a região de rejeição. 6. Determine a estatística teste. 0,975 0,09937 0,009875 9,811, 0,049375

13 t 0 –4,032 t = –9,811 cai na região de rejeição. Rejeite a hipótese nula. Há, sim, uma correlação significante entre o número de faltas e as notas finais. 7. Tome sua decisão. 8. Interprete sua decisão.

14 Regressão linear Seção 9.2

15 Pode-se escrever a equação de uma reta como y = mx + b, onde m é a inclinação da reta e b, o intercepto y. Assim, a reta de regressão é: A inclinação m é: E o intercepto y é: Depois de constatar que existe uma correlação linear significante, você pode escrever uma equação que descreva a relação entre as variáveis x e y. Essa equação chama-se reta de regressão ou reta do ajuste ótimo. A reta de regressão

16 180 190 200 210 220 230 240 250 260 1,52,02,53,0 Investimento em publicidade = um resíduo (xi,yi)(xi,yi) = um ponto de dados Receita = um ponto na reta com o mesmo valor de x é um mínimo

17 Calcule m e b. Escreva a equação da reta de regressão com x = número de faltas e y = nota final. A reta de regressão é:= –3,924x + 105,667 6.084 8.464 8.100 3.364 1.849 5.476 6.561 624 184 450 696 645 666 486 57 5163.75157939.898 1 8 78 2 2 92 3 5 90 4 12 58 5 15 43 6 9 74 7 6 81 64 4 25 144 225 81 36 xy x 2 y2y2 x y 3,924 73,714(–3,924)(8,143) 105,667 (3.751)

18 0246810121416 40 45 50 55 60 65 70 75 80 85 90 95 Faltas Nota final m = –3,924 e b = 105,667 A reta de regressão é: Note que o ponto = (8,143, 73,714) está na reta. A reta de regressão 3,924 105,667

19 Com a reta de regressão, é possível prever valores de y correspondentes aos valores de x que caiam em determinado intervalo de dados. A equação de regressão para o número de faltas e a nota final é: Use essa equação para prever a nota esperada de um aluno com: (a) 3 faltas(b) 12 faltas (a) (b) Prevendo valores y = –3,924(3) + 105,667 = 93,895 = –3,924(12) + 105,667 = 58,579 = –3,924x + 105,667

20 Medidas de regressão e correlação Seção 9.3

21 O coeficiente de determinação, r 2, é a razão entre a variação explicada em y e a variação total em y. O coeficiente de correlação entre as faltas e a nota final era r = –0,975. O coeficiente de determinação é r 2 = (–0,975) 2 = 0,9506. Interpretação: cerca de 95% da variação nas notas finais pode ser explicada pelo número de vezes que o aluno falta. Os outros 5% são inexplicados e podem dever-se a um erro amostral ou outras variáveis, como inteligência, tempo dedicado ao estudo etc. O coeficiente de determinação Variação explicada Variação total

22 O erro padrão da estimativa, s e, é o desvio padrão dos valores y i observados em torno do valor previsto. O erro padrão da estimativa

23 1 8 78 74,275 13,8756 2 2 92 97,819 33,8608 3 5 90 86,047 15,6262 4 12 58 58,579 0,3352 5 15 43 46,807 14,4932 6 9 74 70,351 13,3152 7 6 81 82,123 1,2611 92,767 = 4,307 xy Calcule para cada x i O erro padrão da estimativa 92,767 3,924x105,667

24 Dados uma equação de regressão linear específica e x 0, um valor específico de x, um intervalo de previsão c para y será: onde Use uma distribuição t com n – 2 graus de liberdade. A estimativa pontual é e o erro máximo da estimativa é E. Intervalos de previsão

25 Construa um intervalo de confiança de 90% para a nota final de um estudante que faltou seis vezes. 1. Determine a estimativa pontual: O ponto (6, 82,123) é o ponto na reta de regressão em que a coordenada x é 6. Aplicação 3,924 105,667 3,924(6) 105,667 82,123

26 Construa um intervalo de confiança de 90% para a nota final de um estudante que faltou seis vezes. 2. Determine E: A um nível de confiança de 90%, o erro máximo da estimativa é 9,438. Aplicação 8,14 2,015(4,307) 1,18273 9,438

27 Construa um intervalo de confiança de 90% para a nota final de um estudante que faltou seis vezes. Quando x = 6, o intervalo de confiança de 90% vai de 72,685 a 91,586. 3. Determine os extremos. Aplicação – E = 82,123 – 9,438 = 72,685 + E = 82,123 + 9,438 = 91,561 72,685 < y < 91,561

28 Análise de regressão A equação de regressão é: y = 106 – 3,92x Predictor Coef StDev T P Constant 105.668 3.655 28.91 0.000 Resultado no Minitab x –3.9241 0.4019 –9.76 0.000 S = 4.307 R-Sq = 95.0% R-Sq(adj) = 94.0%

29 Regressão múltipla Seção 9.4

30 Faltas QI Nota Mais variáveis explanatórias 8 2 5 12 15 9 6 115 135 126 110 105 120 125 78 92 90 58 43 74 81

31 Análise de regressão A equação de regressão é: Nota = 52,7 – 2,65 faltas + 0,357 QI Predictor Coef StDev T P Constante Faltas QI Resultado no Minitab S = 4.603 R-Sq = 95.4% R-Sq(adj) = 93.2% 0.573 0.277 0.571 0.61 –1.26 0.62 86.110 2.111 0.580 52.720 –2.652 0.357

32 Interpretação A equação de regressão é: Nota = 52,7 – 2,65 faltas + 0,357 QI Se as outras variáveis forem 0, a nota será 52,7. Se o QI permanece constante, a cada nova falta a nota esperada cai 2,65 pontos. Se o número de faltas permanece constante e o QI cresce um ponto, a nota esperada cresce 0,357 ponto.

33 A equação de regressão é: Nota = 52,7 – 2,65 faltas + 0,357 QI Prevendo a variável resposta Use a equação de regressão para prever a nota de um estudante que faltou cinco vezes e tem um QI de 125. Nota = 52,7 – 2,65 faltas + 0,357 QI Nota = 52,7 – 2,65(5) + 0,357(125) = 80,075 (cerca de 80) Use a equação de regressão para prever a nota de um estudante que faltou nove vezes e tem um QI de 120. Nota = 52,7 – 2,65 faltas + 0,357 QI Nota = 52,7 – 2,65(9) + 0,357(120) = 71,69 (cerca de 72)


Carregar ppt "Estatística Aplicada Larson Farber 9 Correlação e regressão."

Apresentações semelhantes


Anúncios Google