A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Correlação Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp.

Apresentações semelhantes


Apresentação em tema: "Correlação Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp."— Transcrição da apresentação:

1 Correlação Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp

2 Idéias importantes na pesquisa: VARIÁVEL RELAÇÃO A Estatística preocupa-se com a relação entre as variáveis

3 Correlação O que se pode dizer sobre a intensidade do relacionamento entre x e y ? A magnitude refere-se à força de associação entre x e y. Por exemplo: Correlação Interpretação r = 0.00 Não há relacionamento entre x e y r = 0.20 Baixo relacionamento entre x e y r = 0.40 Moderado relacianamento entre x e y r = 0.70 Alto relacionamento entre x e y r = 1.00 Perfeita correspondência entre x e y

4 Revisão: Pearson Y X Coeficiente de correlação de Pearson não deve ser usado quando o relacionamento entre X e Y é não-linear Antes de calcular o coeficiente de correlação Deve-se observar o diagrama de dispersão para verificar se o relacionamento é linear

5 Relacionamento Forte Fraco Pearson

6 Y X Nenhum Relacionamento Pearson

7 Correlação Positiva Linear x x y yy x (a) Positiva (b) Forte positiva (c) Perfeita positiva Pearson

8 Correlação Negativa Linear x x y yy x (d) Negative (e) Strong negative (f) Perfect negative Pearson

9 Correlação Não Linear x x y y (g) Nenhuma Correlação (h) Correlação Não linear Pearson

10 n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r = Calculadoras Científicas (estatística) podem calcular r Fórmula do Coeficiente de Correlação Linear para dados não rankeados Pearson

11 Correlação não é Causa O simples fato que duas variáveis se correlacionam não significa que uma seja a causa da outra.

12 A correlação entre a proporção de Crimes e o número de Igrejas na cidade é r = Significa, então, que quanto mais igrejas teremos mais crimes? CORRELAÇÃO NÃO É CAUSA

13 Correlação ordinal de Pearson medida de associação É para dados em posição Valor entre –1.00 e +1.00

14 n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r =r = Calculadoras Científicas (estatística) podem calcular r s se entrarmos com os dados rankeados Fórmula do Coeficiente de Correlação Linear para dados rankeados Pearson

15 Fórmula simplificada para o cálculo de r Onde… r é o coeficiente de correlação D é a diferença entre posições de valores correspondentes de X e Y N é o número de pares dos valores dados indica a soma de todos os pares de valores dados A fórmula simplificada (aproximada) foi desenvolvida por Spearman em Ela é igual a equação de Pearson para dados rankeados, quando não houver empates n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r = Fórmula de Pearson

16 Valores de r próximos de -1 ou 1 indicam uma forte associação linear e valores próximos de 0 indicam uma falta de associação linear. Interpretação de r Fórmula aproximada para o cálculo de r (quando houver empates) Fórmula exata para o cálculo de r (quando não houver empates)

17 Exemplo: Dados Sem transformação Suponha que tenhamos as medições médias da Largura e Profundidade de um rio em 10 posições ao longo de seu curso Queremos saber se as duas variáveis estão correlacionadas X: Largura (Width)Y: Profundidade (Depth)

18 Exemplo: Dados Sem transformação 10(153,10) – (125)(11.90) 10(1681)–(125) 2 10(14,65) – (11,90) 2 r = n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r = r = 0,571 … dados originais Fórmula de Pearson Pearson

19 Exemplo: dados agora ordenados. Suponha que tenhamos as medições médias da Width e Depth de um rio em 10 posições ao longo de seu curso Queremos saber se as duas variáveis estão correlacionadas X: Largura (Width)Y: Profundidade (Depth) º1.1 4º 9 2º º 15 8º1.2 5º 12 6º1.0 3º 10 3º1.4 8º 8 1º0.9 2º 16 9º1.4 9º 13 7º º 20 10º1.5 10º º0.8 1º Empate. Exº: para a largura, 11 m ocupa a posição 4ª e 5ª, assim cada valor recebe o rank de (4+5)/2 = 4.5

20 n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r =r = Dados em rank r = 0,530 … dados ordenados (rankeados) 10(346) – (55)(55) 10(384,5)–(55) 2 10(384,5)–( ) 2 r =r = = r = 0,530 Pearson

21 Exemplo: Uso da fórmula simplificada Suponha que tenhamos as medições médias da Largura e Profundidade de um rio em 10 posições ao longo de seu curso Queremos saber se as duas variáveis estão correlacionadas Width Rank Depth Rank D D 2 *11 m m * * * * empate

22 Width Rank Depth Rank D D 2 11 m m Quando houver dados iguais, então, recebem a mesma posição (média dos ranks para os dois valores) Exº.: Para a largura, 11 m ocupa a posição 4ª e 5ª, assim cada valor recebe o rank de (4+5)/2 = 4.5 Os dados são classificados (rankeados) do menor (1) ao maior (10)

23 Width Rank Depth Rank D D 2 11 m m Calculamos a diferença (D) e (D 2 ) entre os ranks para cada par Aplicamos a fórmula simplificada (N=10) = 77 Positivo e moderado

24 n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r = r = 0,530 Na presença de empates diferem os resultados = n xy – ( x)( y) n( x 2 ) – ( x) 2 n( y 2 ) – ( y) 2 r =r = r = 0,571 = Dados em rank Dados originais Fórmula de Spearman Pearson Spearman Quanto maior o nº de empates maior o desacordo

25 Exemplo SEM empates. Competição. Dados ordenados. FotografiasFotógrafo ProdutoSomas Nº da fotoJoão (X)Pedro (Y)XY 1248 XY = x = y = y 2 = x 2 = N = (189) – (36)(36) 8( ) – ( ) 2 r =r = =216/335,99 0,6428 = Pearson

26 Exemplo. Competição: dados ordenados SEM empates FotografiasFotógrafo Diferença(Diferença) 2 João (X)Pedro (Y)dd2d Spearman

27 OBSERVAÇÕES SOBRE O USO DA FÓRMULA SIMPLIFICADA Fórmula desenvolvida por Spearman em 1906 para facilitar as contas da fórmula de Pearson

28 Dennis Roberts and R. Kunst. A case against the continuing use of the Spearman rank-order correlation formula. Psychological Reports, 66, pp (1990) The use of the Spearman rank-order correlation should stop... Spearmans original formula is only exact where there are no tied values on the original X and Y variables. In this case, and only in this case, is the Spearman formula equivalent to the Pearson formula on the same ranked scores. Of course, there are formulas in the literature that correct this problem and provide a correlation value on the ranks as if there were no ties.

29 Lost in this shuffle however, is the fact that if these correction formulas are used, then the result is not a Spearman rank-order correlation value anymore, but rather, the Pearson correlation on the ranks. Unfortunately, the common jargon in this case is to (still) say that we have a Spearman rank-order correlation, corrected for tied ranks. However this terminology is incorrect.

30 Of course, the most direct way to have solved this problem would have been to use the Pearson formula on the ranks in the first place (never using the term Spearman) and not attempting to modify in some way the original Spearman formula. In this context, Spearman formula is merely a short-cut expedient to what used to be a more cumbersome way to calculate correlations on ranks with the Pearson formula. However, the rationale for providing a short-cut expedient that was legitimately relevant in earlier times no longer has any validity... Dennis M. Roberts: A Note on the Continuing Use of the Spearman Rank-Order Correlation. The Pennsylvania State University. Febr 1991.

31 Correlação ordinal de Pearson Termos que devem ser familiares Empates Correlação ordinal Spearman


Carregar ppt "Correlação Ordinal Pearson Prof. Ivan Balducci FOSJC / Unesp."

Apresentações semelhantes


Anúncios Google