CORRELAÇÃO E REGRESSÃO PROF. M.Sc. INGRID MILLÉO 2012
CORRELAÇÃO - DEFINIÇÃO Segundo TRIOLA (2005): “Existe uma correlação entre duas variáveis quando uma delas está relacionada com a outra de alguma maneira.”
CORRELAÇÃO EXEMPLO: Idade e alturas das crianças Tempo de prática de esporte e ritmo cardíaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo Vendas e Gasto com publicidade
CORRELAÇÃO Investigar a presença ou ausência de relação linear sob dois pontos de vistas. Quantificando a força dessa relação – Correlação; Explicitando a forma dessa relação – Regressão. Representação gráfica das duas variáveis quantitativas: Diagrama de dispersão
DIAGRAMA DE DISPERSÃO Um diagrama de dispersão é um gráfico no qual os dados amostrais emparelhados são plotados. Servem para mostrar, de forma mais clara, a relação entre duas variáveis.
CORRELAÇÃO POSITIVA
CORRELAÇÃO NEGATIVA
CORRELAÇÃO NÃO LINEAR
COEFICIENTE DE CORRELAÇÃO LINEAR O coeficiente de correlação linear r mede a intensidade da relação linear entre os valores quantitativos emparelhados x e y em uma amostra.
EXEMPLO Usando os dados abaixo, calcule o coeficiente de correlação linear. X 1 3 5 Y 2 8 6 4
MINITAB
EXCELL
EXEMPLO
EXEMPLO
INTERPRETAÇÃO DE r O valor de r está sempre entre -1 e +1, inclusive. Se r estiver muito próximo de 0, concluímos que não há correlação linear significante entre x e y.
INTERPRETAÇÃO DE r Se o valor absoluto do valor calculado de r exede o valor tabelado, concluímos que há uma correlação linear significativa. Caso contrário, não há evidência suficiente para apoiar a conclusão de uma correlação linear significativa.
EXEMPLO No exemplo anterior encontramos r = - 0,135. Será que podemos dizer que ele está “tão próximo de 0” para afirmar que não há correlação linear significativa?
EXEMPLO Consultando o valor tabelado para n=4 temos para , o valor 0,950. Comparando com o valor calculado para r = - 0,135 temos: Podemos, então, concluir com mais precisão que não há correlação linear significativa entre as variáveis em questão.
TABELA DE CORRELAÇÃO
REGRESSÃO Definição: dada uma coleção de dados amostrais emparelhados, a equação de regressão, descreve algebricamente a relação entre as duas variáveis.
REGRESSÃO Calculo da inclinação :
REGRESSÃO Calculo do intercepto y:
EXEMPLO Para o exemplo anterior temos r = - 0,135 . Calculamos primeiro a inclinação:
EXEMPLO Agora calculamos o intercepto y:
EXEMPLO Portanto a equação de regressão é:
PREDIÇÕES Se não há correlação linear, o melhor valor predito de y é . Se há correlação linear, o melhor valor predito de y é encontrado pela substituição do valor de x na equação de regressão linear. Na falta de uma correlação linear, não devemos usar a equação de regressão para projeções ou predições.
EXERCÍCIOS LISTA 4