CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos

Slides:



Advertisements
Apresentações semelhantes
Regressão Linear Simples
Advertisements

Regressão Linear Múltipla Arquivo: seleção2.sav. Base de dados Variáveis independentes: X 1, X 2, X 3,..., X 14 Variável dependente ou Resposta: Y 1428.
Variáveis multinomiais ordenadas. Variável dependente ordenada: aplicações Avaliação de pesquisas de satisfação de clientes – Kreke et al. (1995): avaliação.
Amintas engenharia.
TÉCNICAS DE AMOSTRAGEM – Unidade 2 Professor Marcelo Menezes Reis
UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA PROJETO PIBEG Unidade IV Interpolação Polinomial.
Correlação e Regressão Linear
DISTRIBUIÇÕES AMOSTRAIS
PAULO TADEU M. E S. DE OLIVEIRA HELENO BOLFARINE
Professora Renata Prestes Antonangelo de Oliveira
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Técnicas de Reamostragem Camilo Daleles Rennó
Cinemática de uma partícula
Sinais e Sistemas Aula 1 - Revisão
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Inferência Estatística Camilo Daleles Rennó
FUNÇÃO DE 1º GRAU FORMA GERAL: f(x) = ax + b y = ax + b ou
O OBJETIVO FUNDAMENTAL DA DISCIPLINA
Correlação e Regressão
Medidas de Dispersão para uma amostra
Função quadrática: A função geral de 2º grau
Medidas de Dispersão Aula 8.
“ASSOCIAÇÃO EDUCACIONAL FANUEL” GUARDA MIRIM DE TELÊMACO BORBA
Aprendizado de Máquina
ANÁLISE FATORIAL.
Prof. Dr. Adolpho Walter Pimazoni Canton
Modelos de variáveis qualitativas multinomiais ordenadas
Análise de Regressão.
Heterocedasticidade O que fazer? Erro padrão robusto MQG
ESTATÍSTICA Aula 5.
Econometria Aplicação Teorema FWL: dessazonalização Ajuste do Modelo
Inferência Estatística aplicada à Pesquisa em Saúde.
ESTATÍSTICA AULA 06 ANÁLISE EXPLORATÓRIA DE DADOS II – Unidade 4
Sistemas de Controle III N8SC3
Universidade Tecnológica Federal do Paraná Mestrado Profissional em Tecnologia de Alimentos Análise Estatística de Experimentos Profª Sheila Regina Oro.
Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno
Distribuições bidimensionais
Regressão Logística Modelos de regressão não linear são usados, em geral, em duas situações: casos em que as variáveis respostas são qualitativas e os.
Modelos de variáveis qualitativas dependentes
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Componentes Principais Camilo Daleles Rennó
Ajustamento de Observações
Tópicos em Econometria I
ANOVA II.
Medidas de Dispersão Mostra quanto dispersos estão os dados em torno da média Amplitude Variância Desvio-padrão Comparação da dispersão dos elementos dos.
Cap 3. Modelo de regressão de duas variáveis: o problema da estimação Prof. MSc. Saulo Jardim Modelagem Estatística.
Combinando inequações lineares
GEOGEBRA COMO FERRAMENTA PARA O ENSINO DE ESTATÍSTICA
Econometria Heterocedasticidade Consequências da violação
Regressão
SPSS para cientistas sociais
2ª Aula: Programação Linear
9. Testes de Hipóteses Paramétricos
Secretaria de Gestão e Desenvolvimento Institucional
Estatística Aplicada Larson Farber 9 Correlação e regressão.
Agosto / 2018 Erros e tratamento de dados experimentais 1 Quanti I Profa. Dra Michelle Liberato.
              Investigação Operacional Métodos de Programação Linear: Big M, 2 Fases, S Dual (Mestrado) Engenharia Industrial
Multicolinearidade Observações missing
O que você deve saber sobre
PROCESSAMENTO DE IMAGENS
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Estimação Pontual Camilo Daleles Rennó
Econometria Inferência.
INTRODUÇÃO À ENGENHARIA AVALIAÇÃO DE SOLUÇÕES
Site: Estatística Prof. Edson Nemer Site:
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Prof. Guilherme Alexandre Monteiro Reinaldo Recife
Jurandir Peinado GESTÃO DE OPERAÇÕES Previsão de demanda.
Análise Exploratória de Dados
UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística
INTRODUÇÃO À ANÁLISE DE REGRESSÃO APLICADA À ENGENHARIA FLORESTAL
Álgebra Linear Sistemas de Equações Lineares
Determinantes e Sistemas Lineares
Transcrição da apresentação:

CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias CORRELAÇÃO A análise de correlação tem como objetivo determinar o grau de relacionamento entre duas variáveis, isto é, a covariabilidade entre elas. Não é necessário que uma variável seja dependente e a outra independente. Carlos Alberto Alves Varella Novembro-2006

O coeficiente de correlação O coeficiente de correlação entre variáveis aleatórias contínuas é: O quadrado do coeficiente de correlação é igual ao coeficiente de determinação. 14/11/2018

A análise de correlação procura obter as variáveis que conjuntamente têm efeito sobre o fenômeno. A correlação pode ser: positiva; negativa; nula. O coeficiente de correlação mede a relação linear entre duas variáveis. parabólica hiperbólica retilínea Modelo linear de 20 grau Relação entre penetração de raízes e produção de feijão Efeito da compactação do solo 14/11/2018

Partindo-se do modelo linear Y=Xb+e, podemos obter a equação de regressão: A correlação entre valores preditos e observados é feita pela seguinte fórmula: Neste caso da regressão Y deve ser o efeito devido a X, isto é, Y é a variável dependente do efeito de X, independente. 14/11/2018

A equação de regressão é: O coeficiente de correlação múltipla (r) também é estimado pela raiz quadrada da relação entre as somas de quadrados da regressão e total: O quadrado do coeficiente de correlação múltipla (R2) é o coeficiente de determinação múltipla; A equação de regressão é: 14/11/2018

De maneira geral o coeficiente de correlação é: No programa computacional MATLAB é calculada com o comando corrcoef: x = 2 4 6 8 10 Y = 10 12 15 17 21 >> cor=corrcoef([x Y]); %variavel X versus variavel Y cor = 1.0000 0.9925 0.9925 1.0000 14/11/2018

Matriz de correlação A matriz de correlação entre as variáveis X1, X2, ... , Xp é: A matriz é simétrica 14/11/2018

Estimativa da matriz de correlação (C) Essa matriz contem as correlações simples entre as variáveis em estudo. 14/11/2018

Aplicações da matriz de correlação Valores altos indicam presença de multicolinearidade; Valor igual a um indica multicolinearidade perfeita; Quando a correlação for alta: Podemos retirar do modelo uma das variáveis do par altamente correlacionado; A retirada dessas variáveis resolve o problema de aplicação do método dos mínimos quadrados. 14/11/2018

Multicolinearidade perfeita Dizemos que existe multicolinearidade perfeita quando existem na matriz X, colunas linearmente dependentes. Neste caso o determinante de X’X é igual a zero: Não é possível inverter a matriz X’X; Impossível obter a estimativa de parâmetros pelo método dos mínimos quadrados. A retirada de variáveis de pares altamente correlacionados pode resolver o problema. 14/11/2018

Conseqüências da multicolinearidade Frequentemente a matriz X apresenta alta multicolinearidade, mas não perfeita. As principais conseqüências são: Variâncias e covariâncias muito elevadas, isto é, as estimativas podem ter erros elevados; Mascara a influência de variáveis importantes no fenômeno. O problema pode ser da amostragem. Os coeficientes obtidos para o modelo variam muito de amostra para amostra. A adição de algumas observações altera o resultado. 14/11/2018

Coeficiente de determinação múltipla (R2) O coeficiente de determinação múltipla é definido por: Mostra a proporção da soma de quadrados total que é “explicada” pela regressão múltipla. Note que R2 varia entre zero e um. 14/11/2018

Teste de significância para o coeficiente de determinação múltipla Um teste F deve ser feito no coeficiente de determinação múltipla Este mesmo teste é aplicado para o coeficiente de correlação múltipla. 14/11/2018

Coeficiente de determinação múltipla corrigido para grau de liberdade O coeficiente de determinação múltipla é corrigido devido que seu valor não diminui com a inclusão de novas variáveis, mesmo que estas não tenham nenhuma relação com a variável independente. 14/11/2018

Considerações sobre o coeficiente de determinação corrigido O coeficiente corrigido sempre é menor que o não corrigido; O coeficiente corrigido pode ser negativo. 14/11/2018

Coeficiente de variação O coeficiente de variação é um indicador da qualidade do ajustamento do modelo; O resultado é tanto melhor quanto menor for o coeficiente de variação; É normalmente apresentado em porcentagem de variação. QMR é erro de (modelagem+amostragem+acaso)=erro puro 14/11/2018

Coeficiente de correlação parcial A correlação parcial é a correlação entre duas variáveis quaisquer quando o efeito de outras variáveis são mantidos constantes. É usado para capturar o efeito de variáveis sobre os pares correlacionados; Esclarece se a relação entre duas variáveis é uma correlação simples ou tem origem na causa-efeito. 14/11/2018

Calculo do coeficiente de correlação parcial A correlação parcial entre as variáveis Xi e Yj é rij.m, onde m representa as variáveis mantidas constantes. O algoritmo para cálculo apresenta três etapas. 14/11/2018

Primeira etapa: cálculo da matriz de correlação 14/11/2018

Segunda etapa: obter a inversa C-1 No programa computacional MATLAB: invcor=inv(corrcoef([X Y])); 14/11/2018

Terceira etapa: Aplicar a expressão No programa computacional MATLAB: i=1; j=2; r1234=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)) 14/11/2018

Teste de significância para o coeficiente de correlação parcial n= número de observações; v= número de variáveis (v=m+2). Este mesmo teste é aplicado para o coeficiente de determinação parcial. 14/11/2018

Interpretação do coeficiente de correlação parcial Sejam as variáveis: X1 notas em matemática X2 notas em estatística X3 notas em pesquisa operacional X4 notas em processamento de dados 14/11/2018

r12.4=0,875 X1 notas de matemática X2 notas de estatística X3 notas de pesquisa operacional X4 notas de processamento de dados Representa o coeficiente de correlação parcial entre as notas de matemática e estatística, para os estudantes com a mesma nota em processamento de dados. Na obtenção desse índice as notas em pesquisa operacional não foram consideradas (3). 14/11/2018

r12.34=0,824 X1 notas de matemática X2 notas de estatística X3 notas de pesquisa operacional X4 notas de processamento de dados Coeficiente de correlação entre as notas de matemática e estatística, para os estudantes que obtiveram as mesmas notas em pesquisa operacional e processamento de dados. 14/11/2018

Exemplo de aplicação As vaiáveis são X1, X2, X3 e X4 e total de observações é 64. Foi obtida a seguinte matriz de correlação: c = 1.0000 0.3597 0.5749 0.4109 0.3597 1.0000 0.4630 0.3050 0.5749 0.4630 1.0000 0.2702 0.4109 0.3050 0.2702 1.0000 14/11/2018

Cálculo da inversa da matriz de correlação No programa computacional MATLAB invc=inv(c); invc = 1.6765 -0.0981 -0.7987 -0.4432 -0.0981 1.3378 -0.5002 -0.2326 -0.7987 -0.5002 1.6838 0.0258 -0.4432 -0.2326 0.0258 1.2461 14/11/2018

Cálculo de r12.34, r13.24 e r14.23 No programa computacional MATLAB i=1;j=2; r1234=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); i=1;j=3; r1324=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); i=1;j=4; r1423=-invc(i,j)/sqrt(invc(i,i)*invc(j,j)); r1234 = 0.0655 r1324 = 0.4754 r1423 = 0.3066 14/11/2018

Teste de significância para o coeficiente de correlação parcial Neste caso temos que n=62 e v=4, visto que v=m+2 n=62; m=2; v=m+2; F1234=(n-v)*r1234^2/(1-r1234^2); %F calculado F1324=(n-v)*r1324^2/(1-r1324^2); %F calculado F1423=(n-v)*r1423^2/(1-r1423^2); %F calculado F1234 = 0.2499 F1324 = 16.9325 F1423 = 6.0185 Ftab1234= finv(0.95,1,n-v);%F tabelado Ftab1234 = 4.0069 14/11/2018