A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos

Apresentações semelhantes


Apresentação em tema: "CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos"— Transcrição da apresentação:

1 CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos
Análise Multivariada Aplicada as Ciências Agrárias CORRELAÇÃO A análise de correlação tem como objetivo determinar o grau de relacionamento entre duas variáveis, isto é, a covariabilidade entre elas. Não é necessário que uma variável seja dependente e a outra independente. Carlos Alberto Alves Varella Novembro-2006

2 O coeficiente de correlação
O coeficiente de correlação entre variáveis aleatórias contínuas é: O quadrado do coeficiente de correlação é igual ao coeficiente de determinação. 14/11/2018

3 A análise de correlação procura obter as variáveis que conjuntamente têm efeito sobre o fenômeno.
A correlação pode ser: positiva; negativa; nula. O coeficiente de correlação mede a relação linear entre duas variáveis. parabólica hiperbólica retilínea Modelo linear de 20 grau Relação entre penetração de raízes e produção de feijão Efeito da compactação do solo 14/11/2018

4 Partindo-se do modelo linear Y=Xb+e, podemos obter a equação de regressão:
A correlação entre valores preditos e observados é feita pela seguinte fórmula: Neste caso da regressão Y deve ser o efeito devido a X, isto é, Y é a variável dependente do efeito de X, independente. 14/11/2018

5 A equação de regressão é:
O coeficiente de correlação múltipla (r) também é estimado pela raiz quadrada da relação entre as somas de quadrados da regressão e total: O quadrado do coeficiente de correlação múltipla (R2) é o coeficiente de determinação múltipla; A equação de regressão é: 14/11/2018

6 De maneira geral o coeficiente de correlação é:
No programa computacional MATLAB é calculada com o comando corrcoef: x = 2 4 6 8 10 Y = 10 12 15 17 21 >> cor=corrcoef([x Y]); %variavel X versus variavel Y cor = 14/11/2018

7 Matriz de correlação A matriz de correlação entre as variáveis X1, X2, ... , Xp é: A matriz é simétrica 14/11/2018

8 Estimativa da matriz de correlação (C)
Essa matriz contem as correlações simples entre as variáveis em estudo. 14/11/2018

9 Aplicações da matriz de correlação
Valores altos indicam presença de multicolinearidade; Valor igual a um indica multicolinearidade perfeita; Quando a correlação for alta: Podemos retirar do modelo uma das variáveis do par altamente correlacionado; A retirada dessas variáveis resolve o problema de aplicação do método dos mínimos quadrados. 14/11/2018

10 Multicolinearidade perfeita
Dizemos que existe multicolinearidade perfeita quando existem na matriz X, colunas linearmente dependentes. Neste caso o determinante de X’X é igual a zero: Não é possível inverter a matriz X’X; Impossível obter a estimativa de parâmetros pelo método dos mínimos quadrados. A retirada de variáveis de pares altamente correlacionados pode resolver o problema. 14/11/2018

11 Conseqüências da multicolinearidade
Frequentemente a matriz X apresenta alta multicolinearidade, mas não perfeita. As principais conseqüências são: Variâncias e covariâncias muito elevadas, isto é, as estimativas podem ter erros elevados; Mascara a influência de variáveis importantes no fenômeno. O problema pode ser da amostragem. Os coeficientes obtidos para o modelo variam muito de amostra para amostra. A adição de algumas observações altera o resultado. 14/11/2018

12 Coeficiente de determinação múltipla (R2)
O coeficiente de determinação múltipla é definido por: Mostra a proporção da soma de quadrados total que é “explicada” pela regressão múltipla. Note que R2 varia entre zero e um. 14/11/2018

13 Teste de significância para o coeficiente de determinação múltipla
Um teste F deve ser feito no coeficiente de determinação múltipla Este mesmo teste é aplicado para o coeficiente de correlação múltipla. 14/11/2018

14 Coeficiente de determinação múltipla corrigido para grau de liberdade
O coeficiente de determinação múltipla é corrigido devido que seu valor não diminui com a inclusão de novas variáveis, mesmo que estas não tenham nenhuma relação com a variável independente. 14/11/2018

15 Considerações sobre o coeficiente de determinação corrigido
O coeficiente corrigido sempre é menor que o não corrigido; O coeficiente corrigido pode ser negativo. 14/11/2018

16 Coeficiente de variação
O coeficiente de variação é um indicador da qualidade do ajustamento do modelo; O resultado é tanto melhor quanto menor for o coeficiente de variação; É normalmente apresentado em porcentagem de variação. QMR é erro de (modelagem+amostragem+acaso)=erro puro 14/11/2018

17 Coeficiente de correlação parcial
A correlação parcial é a correlação entre duas variáveis quaisquer quando o efeito de outras variáveis são mantidos constantes. É usado para capturar o efeito de variáveis sobre os pares correlacionados; Esclarece se a relação entre duas variáveis é uma correlação simples ou tem origem na causa-efeito. 14/11/2018

18 Calculo do coeficiente de correlação parcial
A correlação parcial entre as variáveis Xi e Yj é rij.m, onde m representa as variáveis mantidas constantes. O algoritmo para cálculo apresenta três etapas. 14/11/2018

19 Primeira etapa: cálculo da matriz de correlação
14/11/2018

20 Segunda etapa: obter a inversa C-1
No programa computacional MATLAB: invcor=inv(corrcoef([X Y])); 14/11/2018

21 Terceira etapa: Aplicar a expressão
No programa computacional MATLAB: i=1; j=2; r1234=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)) 14/11/2018

22 Teste de significância para o coeficiente de correlação parcial
n= número de observações; v= número de variáveis (v=m+2). Este mesmo teste é aplicado para o coeficiente de determinação parcial. 14/11/2018

23 Interpretação do coeficiente de correlação parcial
Sejam as variáveis: X1 notas em matemática X2 notas em estatística X3 notas em pesquisa operacional X4 notas em processamento de dados 14/11/2018

24 r12.4=0,875 X1 notas de matemática X2 notas de estatística X3 notas de pesquisa operacional X4 notas de processamento de dados Representa o coeficiente de correlação parcial entre as notas de matemática e estatística, para os estudantes com a mesma nota em processamento de dados. Na obtenção desse índice as notas em pesquisa operacional não foram consideradas (3). 14/11/2018

25 r12.34=0,824 X1 notas de matemática X2 notas de estatística X3 notas de pesquisa operacional X4 notas de processamento de dados Coeficiente de correlação entre as notas de matemática e estatística, para os estudantes que obtiveram as mesmas notas em pesquisa operacional e processamento de dados. 14/11/2018

26 Exemplo de aplicação As vaiáveis são X1, X2, X3 e X4 e total de observações é 64. Foi obtida a seguinte matriz de correlação: c = 14/11/2018

27 Cálculo da inversa da matriz de correlação
No programa computacional MATLAB invc=inv(c); invc = 14/11/2018

28 Cálculo de r12.34, r13.24 e r14.23 No programa computacional MATLAB
i=1;j=2; r1234=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); i=1;j=3; r1324=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); i=1;j=4; r1423=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); r1234 = 0.0655 r1324 = 0.4754 r1423 = 0.3066 14/11/2018

29 Teste de significância para o coeficiente de correlação parcial
Neste caso temos que n=62 e v=4, visto que v=m+2 n=62; m=2; v=m+2; F1234=(n-v)*r1234^2/(1-r1234^2); %F calculado F1324=(n-v)*r1324^2/(1-r1324^2); %F calculado F1423=(n-v)*r1423^2/(1-r1423^2); %F calculado F1234 = 0.2499 F1324 = F1423 = 6.0185 Ftab1234= finv(0.95,1,n-v);%F tabelado Ftab1234 = 4.0069 14/11/2018


Carregar ppt "CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos"

Apresentações semelhantes


Anúncios Google