Escola Politécnica de Pernambuco Departamento de Ensino Básico Capítulo 09 Ajuste de Curvas, Regressão e Correlação Prof. Sérgio Mário Lins Galdino http://epoli.pbworks.com/
Agenda Ajuste de curvas; Regressão; O método dos mínimos quadrados; A linha mínimos quadrados; A linha mínimos quadrados em termos da variância amostral e covariância;
Agenda Desvio Padrão da Estimativa; O Coeficiente de Correlação Linear; Coeficiente de Correlação Generalizado; Correlação e Dependência;
Ajuste de curvas A determinação de equações de curvas que se ajustem a determinados conjuntos de dados observados é chamado de Ajustamento de Curvas.
Ajuste de curvas Pode-se fazer uma análise da seguinte forma: coleta-se os dados de duas variáveis. Por exemplo, x e y, a altura e peso de um grupo de pessoas, , respectivamente. traça-se um gráfico dos pontos (X1,Y1), (X2,Y2)....(Xn,Yn) em um sistema de coordenadas retangulares. O conjunto resultante é conhecido como diagrama de dispersão. Com esse diagrama pode-se visualizar uma curva aproximativa de dados ( curva de ajuste).
Ajuste de curvas Relação linear entre variáveis Relação linear não linear
Ajuste de curvas Não existe relação
Regressão Um dos objetivos do ajustamento é estimar uma das variáveis (V. D.) em função da outra (V. I.). Esse processo é conhecido como regressão (y(x) versus x) . A equação e a curva de regressão de x sobre y ocorre quando a variável x é estimado em função de y (x(y) versus y) .
Método dos mínimos quadrados De todas curvas que se aproximam de determinados conjuntos de pontos, a curva que atende a propriedade : d₁2 + d₂2 + ......+dn2 = mínimo Obs: o dn corresponde a diferença entre o valor e o valor ajustado pela curva
Método dos mínimos quadrados dn = desvio, erro ou resíduo C = melhor curva ajustadora
A linha de mínimos quadrados A reta de mínimos quadrados aproxima o conjunto de pontos (xi , yi), tem a equação onde a e b são determinadas pela solução das equações normais para linha de mínimos quadrados
A linha de mínimos quadrados Os valores de a e b são
A linha de mínimos quadrados O valores b pode ser reescrito como: onde
A linha passando pelo centróide A reta de mínimos quadrados passa pelo ponto , chamado centróide (centro de gravidade dos dados). Ou a linha de regressão de x sobre y
Exemplo Altura do Pai (x) (polegadas) 65 63 67 64 68 62 70 66 69 71 Altura do Filho (y) (polegadas)
Exemplo a= 35.82 e b= 0.476 y = 35.82 + 0.476.x x = 800 y = 811 65 68 4225 4420 4624 63 66 3969 4158 4356 67 4489 4556 64 4096 4160 69 4692 4761 62 3844 4092 70 4900 4760 4290 71 4828 5041 4970 x = 800 y = 811 x2 = 53.418 xy = 54.107 y2 = 54.849 a= 35.82 e b= 0.476 y = 35.82 + 0.476.x
A linha mínimos quadrados em termos da variância amostral e covariância As variâncias e covariâncias amostrais de x e y são dadas por É definido o coeficiente de correlação amostral como: Então a equação da reta de regressão de mínimos quadrados de y sobre x:
Desvio Padrão da Estimativa A medida da dispersão em torno de uma curva de regressão é dado por: Como verificamos que a curva de mínimos quadrados é a que apresenta o menor desvio padrão de estimativa dentre as curvas de regressão.
Coeficiente de correlação linear O coeficiente pode ser definido como: : variação explicada ( os desvios tendem a um padrão definido pela reta de regressão de mínimos quadrados). : variação total
Coeficiente de correlação linear O r é a medida de quão bem a reta de regressão de mínimos quadrados se ajusta aos dados. Assim r2=1 é definido como correlação linear perfeita. Se r2=0 a variação total é toda não explicada. Observação: ‘r’ estar entre 0 e 1.
Coeficiente de Correlação Generalizado O coeficiente pode ser definido como: : variação explicada : variação total Mede quão bem uma curva de regressão não-linear se ajusta aos dados = Coeficiente de Correlação Generalizado
Exemplo Encontre o coeficiente de determinação e o coeficiente de correlação linear do exemplo acima. Relembrando que o coeficiente de determinação é r2: O coeficiente de correlação é r:
Correlação e Dependência Sempre que duas variáveis x e y tem coeficiente de correlação diferente de 0, ela são dependentes ( sentido probabilístico). Nem sempre essa correlação representa uma interdependência causal direta. Exemplo 1 : altura e peso→ interdependência direta Exemplo 2: salário e criminalidade → Interdependência indireta.