A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Ogliari – Técnicas estatísticas para predição Correlação Correlação.

Apresentações semelhantes


Apresentação em tema: "Ogliari – Técnicas estatísticas para predição Correlação Correlação."— Transcrição da apresentação:

1 Ogliari – Técnicas estatísticas para predição Correlação Correlação

2 Ogliari – Técnicas estatísticas para predição Correlação Interesse em analisar o comportamento conjunto de duas variáveis quantitativas. Interesse em obter uma medida estatística que indique se existe ou não uma relação linear entre duas variáveis; e se existe, qual a sua magnitude e sinal. –Exemplo: anos de experiência em programação e o tempo gasto para realizar uma determinada tarefa. –Número de acessos a uma página e o tamanho da população economicamente ativa.

3 Ogliari – Técnicas estatísticas para predição Exemplo 1 Processo de queima de massa cerâmica para pavimento – X 1 = retração linear (%), –X 2 = resistência mecânica (MPa) e –X 3 = absorção de água (%).

4 Ogliari – Técnicas estatísticas para predição Exemplo Dados: ensaioX1X1 X 2 X 3 ensaioX 1 X 2 X 3 18,7038,425,541013,2460,240,58 211,6846,932,83119,1040,583,64 38,3038,055,58128,3341,075,87 412,0047,041,101311,3441,943,32 59,5050,900,64147,4835,536,00 68,5834,107,251512,6838,420,36 710,6848,231,88168,7645,264,14 86,3227,749,92179,9340,705,48 98,2039,205,63186,5029,668,98

5 Ogliari – Técnicas estatísticas para predição Diagramas de dispersão Uma representação gráfica bastante útil para se estudar a dependência entre variáveis quantitativas é o gráfico de dispersão, mostrados nos próximos slides.

6 Ogliari – Técnicas estatísticas para predição Exemplo 1 - Diagramas de dispersão: Interpretar a correlação entre as duas variáveis.

7 Ogliari – Técnicas estatísticas para predição Exemplo 1 - Diagramas de dispersão: Interpretar a correlação entre as duas variáveis.

8 Ogliari – Técnicas estatísticas para predição Exemplo 1 - Diagramas de dispersão: Interpretar a correlação entre as duas variáveis.

9 Ogliari – Técnicas estatísticas para predição IndivíduoTeste (X)Tempo (Y) A45343 B52368 C61355 D70334 E74337 F76381 G80345 H90375 Resultado de um teste (de 0 a 100) sobre conhecimento (X) e tempo gasto (minutos) para aprender a operar uma máquina (Y) para oito indivíduos.

10 Ogliari – Técnicas estatísticas para predição Interpretar a correlação entre as duas variáveis.

11 Ogliari – Técnicas estatísticas para predição X e Y estão positivamente correlacionadas quando elas caminham num mesmo sentido. Estão negativamente correlacionadas quando elas caminham em sentidos opostos. As maiores correlações positivas e negativas são obtidas somente quando todos os pontos estão bem próximos à uma linha reta.

12 Ogliari – Técnicas estatísticas para predição Idéia de construção do Coef. de Correlação de Pearson

13 Ogliari – Técnicas estatísticas para predição Ensaio XY XY 18,7038,42-0,82-2,911013,2460,243,7218,91 211,6846,932,165,60119,1040,58-0,42-0,75 38,3038,05-1,22-3,28128,3341,07-1,19-0,26 412,0047,042,485,711311,3441,941,820,61 59,5050,90-0,029,57147,4835,53-2,04-5,80 68,5834,10-0,94-7,231512,6838,423,16-2,91 710,6848,231,166,90168,7645,26-0,763,93 86,3227,74-3,20-13,59179,9340,700,41-0,63 98,2039,20-1,32-2,13186,5029,66-3,02-11,67

14 Ogliari – Técnicas estatísticas para predição

15 Padronização (x i, y i ) (x i, y i ) : (i = 1, 2,..., n) Padronização

16 Ogliari – Técnicas estatísticas para predição Padronização (0, 0)

17 Ogliari – Técnicas estatísticas para predição Idéia de construção do Coef. de Correlação de Pearson (i = 1, 2,..., n) Considere os produtos dos valores padronizados: x iy i

18 Ogliari – Técnicas estatísticas para predição Sinais dos produtos dos valores padronizados: Quadrante com x iy i negativos Quadrante com x iy i positivos Quadrante com x iy i negativos Quadrante com x iy i positivos x y

19 Ogliari – Técnicas estatísticas para predição Sinais dos produtos dos valores padronizados: Quadrante com x iy i negativos Quadrante com x iy i positivos Quadrante com x iy i negativos Quadrante com x iy i positivos x y

20 Ogliari – Técnicas estatísticas para predição Sinais dos produtos dos valores padronizados: Quadrante com x iy i negativos Quadrante com x iy i positivos Quadrante com x iy i negativos x y Quadrante com x iy i positivos

21 Ogliari – Técnicas estatísticas para predição Sinais dos produtos dos valores padronizados: Quadrante com x iy i negativos Quadrante com x iy i positivos Quadrante com x iy i negativos Quadrante com x iy i positivos x y

22 Ogliari – Técnicas estatísticas para predição Coeficiente de correlação de Pearson Definição: é uma medida do grau de correlação entre X e Y e, também, da proximidade dos dados a uma reta. Esta medida varia no intervalo de -1 a 1.

23 Ogliari – Técnicas estatísticas para predição Idéia de construção do Coef. de Correlação de Pearson Padronização (x i, y i ) (x i, y i ) : (i = 1, 2,..., n) Coef. de Correlação de Pearson:

24 Ogliari – Técnicas estatísticas para predição Valores possíveis de r e interpretação da correlação Sentido Força Negativa Ausência Forte Moderada Fraca Positiva Fraca Moderada Forte Valor de r

25 Ogliari – Técnicas estatísticas para predição Exemplo 1. Matriz de correlações retração linear resistência mecânica absorção de água retração linear1,000,75-0,88 resistência mecânica 0,751,00-0,84 absorção de água -0,88-0,841,00 Interpretar.

26 Ogliari – Técnicas estatísticas para predição Exercício: calcular o coeficiente de correlação de Pearson para a porcentagem de acertos (Y) e tamanho da cache, em mil bytes, (X), para um determinado tipo de pré- carregamento. (Y) 44,45 46,99 50,66 53,21 (X)

27 Ogliari – Técnicas estatísticas para predição Outra forma de calcular r Exercício: calcular o coeficiente de correlação de Pearson para a porcentagem de acertos (Y) e tamanho da cache, em bytes, (X), para um determinado tipo de pré-carregamento usando a expressão acima. (Y) 44,45 46,99 50,66 53,21 (X)

28 Ogliari – Técnicas estatísticas para predição É um parâmetro ou característica da população, representada pela letra grega e desconhecido. Coeficiente de correlação populacional POPULAÇÃO (X,Y)

29 Ogliari – Técnicas estatísticas para predição Coeficiente de correlação populacional Exemplo: considere uma empresa que vende e conserta microcomputadores. Deseja-se estudar a relação entre o período de tempo do serviço de chamadas, em minutos (X) e o número de componentes eletrônicos no computador que devem ser consertados ou substituídos (Y).

30 Ogliari – Técnicas estatísticas para predição Inferência sobre Inferência sobre Dada uma amostra aleatória simples (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) do par de variáveis aleatórias (X, Y), o coeficiente r pode ser considerado uma estimativa do verdadeiro e desconhecido coeficiente. Podemos usar o coeficiente de correlação amostral, r, para fazer várias inferências sobre. Uma população que tenha duas variáveis não- correlacionadas, pode produzir uma amostra com coeficiente de correlação diferente de zero, simplesmente devido à seleção dos dados.

31 Ogliari – Técnicas estatísticas para predição Exemplo: considere uma empresa que vende e conserta computadores. Para estudar a relação entre o período de tempo do serviço de chamadas, em minutos (X), e o número de componentes eletrônicos no computador que devem ser consertados ou substituídos, uma amostra de registros foi observada. Os resultados estão apresentados na tabela a seguir: Teste de significância de Teste de significância de

32 Ogliari – Técnicas estatísticas para predição

33 Teste de significância de Teste de significância de H 0 : = 0 (as variáveis X e Y são não correlacionadas) H 1 : 0 (as variáveis X e Y são correlacionadas) (pode também ser unilateral) O cálculo do coeficiente de correlação na amostra selecionada produziu: r = 0,994

34 Ogliari – Técnicas estatísticas para predição Teste de significância de Teste de significância de Estatística do teste a qual tem distribuição t de Student com parâmetro n-2 graus de liberdade. Com os dados da amostra, obtemos: a qual tem distribuição t de Student com parâmetro 14-2=12 graus de liberdade.

35 Ogliari – Técnicas estatísticas para predição Teste de significância de Teste de significância de Região crítica –É um teste bilateral, da distribuição t de Student, obtemos para nível de significância ( ) de 5% e 12 graus de liberdade:

36 Ogliari – Técnicas estatísticas para predição Conclusão: como t 0 pertence a região de rejeição, rejeitamos a hipótese nula (H 0 ), isto é, existe dependência entre tempo de chamada e número de componentes eletrônicas consertadas ou substituídas. Teste de significância de Teste de significância de

37 Ogliari – Técnicas estatísticas para predição Hipóteses: Estatística do teste Região crítica Resultado da amostra Conclusão Teste de significância de Teste de significância de

38 Ogliari – Técnicas estatísticas para predição Exercício –Desejamos testar se existe ou não correlação entre o número de clientes (Y) e os anos de experiência de agentes de seguros (X). Foram sorteados cinco agentes e observamos as duas variáveis em cada agente, cujos resultados foram: –Agentes A B C D E –Anos –Clientes –Teste a hipótese de não haver correlação entre número de clientes e anos de experiência. Utilize nível de significância de 10% ( =0,10). Teste de significância de Teste de significância de

39 Ogliari – Técnicas estatísticas para predição Estimação de Estimação de Quando nós rejeitamos H 0, isto é, que é diferente de zero, é bastante interessante construir um intervalo de confiança para o coeficiente de correlação populacional ( ). Inicialmente obtemos o intervalo de confiança de 95% para, dado por: onde: Obs.: é a média da distribuição de uma transformação da estatística r.

40 Ogliari – Técnicas estatísticas para predição Estimação de Estimação de Para o exemplo da empresa que vende e conserta computadores, o intervalo de confiança de 95% para é dado por: Ver exemplo

41 Ogliari – Técnicas estatísticas para predição Estimação de Estimação de Finalmente, podemos encontrar os extremos do intervalo de confiança para o coeficiente de correlação populacional. Assim de: e = 2,7183

42 Ogliari – Técnicas estatísticas para predição Estimação de Estimação de Obtemos o intervalo para Assim, podemos afirmar que o coeficiente de correlação populacional é um número entre 0,98 e 0,998.

43 Ogliari – Técnicas estatísticas para predição Exercício –Concluímos que existe correlação entre o número de clientes e anos de experiência dos agentes (r = 0,95). Estime o verdadeiro valor do coeficiente de correlação com confiança de 90%. Estimação de Estimação de

44 Ogliari – Técnicas estatísticas para predição Causalidade versos correlação Pesquisadores freqüentemente são tentados a inferir uma relação de causa e efeito entre X e Y quando eles ajustam um modelo de regressão ou realizam uma análise de correlação. Uma associação significativa entre X e Y em ambas as situações não necessariamente implica numa relação de causa e efeito. Exemplo: (Box, Hunter & Hunter, Statistics for Experimenters, p.8) O gráfico mostra a população de Oldemberg, Alemanha, no fim de cada um dos 7 anos (Y) contra o número de cegonhas (pássaros) naquele ano (X). Interpretação: existe associação entre X e Y. Freqüentemente, quando duas v. X e Y parecem estar fortemente associadas, pode ser porque X e Y estão, de fato, associadas com uma terceira variável, W. No exemplo, X e Y aumentam com W = tempo. Correlação não necessariamente implica em causalidade


Carregar ppt "Ogliari – Técnicas estatísticas para predição Correlação Correlação."

Apresentações semelhantes


Anúncios Google