A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

ANÁLISES DE REGRESSÃO.

Apresentações semelhantes


Apresentação em tema: "ANÁLISES DE REGRESSÃO."— Transcrição da apresentação:

1 ANÁLISES DE REGRESSÃO

2 Coeficiente de correlação
Coeficiente de correlação linear produto momento, segundo Pearson (r) SPXY = xy -(x y) / n; SQX = x2 - (x)2 / n; SQY = y2 - (y)22 / n r: -1 à +1; r: 0, não há correlação linear entre x e y.

3 Coeficiente de determinação
r2*100%: fração da variância total de x e y explicada pela relação linear; ajuste da distribuição dos pontos em relação à reta. teste usado para verificar se a correlação é ou não significativa, com (n-2)g.l.

4 Coeficiente de correlação não paramétrico, segundo Spearman (rS)
variáveis não possuem distribuição normal xi e yi ordenados por postos (rank), segundo os seus valores (x*i e y*i) di = x*i - y*i ; n = número de pares de valores x*i , y*i

5 O coeficiente de correlação linear é influenciado pela presença de valores anômalos (outliers).
Grande diferença entre o coeficiente de correlação linear e o coeficiente de correlação por postos reflete tanto uma relação não-linear como presença de pares de valores extremos.

6

7

8 Regressão linear Verificado pelo valor de r que ocorre uma significante correlação linear entre duas variáveis há necessidade de quantificar tal relação, o que é feito pela análise de regressão. Modelo: equação de uma reta que, disposta num sistema de eixos cartesianos, com valores de yi (variável dependente) na ordenada e xi (variável independente) na abcissa, a soma dos quadrados dos desvios verticais dos pontos em relação a ela seja mínima.

9 equação da reta Y = a + bX onde yi é o valor estimado para um específico valor xi; “b” revela a inclinação da reta, ou seja o acréscimo ou decréscimo do valor de y em relação à x; “a” localiza na ordenada o ponto de interseção da reta em relação ao sistema de coordenada retangulares. Utilizando o método dos mínimos quadrados, os valores da equação da reta são determinados por:

10

11

12 Eixo maior reduzido Quando
não ocorre dependência entre variáveis não há conhecimento de uma variável sem erro Desvios verticais dos pontos em relação à reta: análise de regressão Areas dos triângulos compreendidos entre os pontos e a reta: eixo maior reduzido

13 Y = a + bX sendo o sinal de “b” o do correspondente r

14 Regressão curvilínea potências crescentes de xi, variável independente e coeficientes xi e xi2: parábola com um único ponto de inflexão com potências crescentes de xi, curva mais complexa para ajuste processo por etapas (stepwise) O modelo para a regressão polinomial de grau k é

15 cálculo dos coeficientes de regressão 

16 Função quadrática

17 Função cúbica

18 Regressão múltipla Testa dependências cumulativas de uma única variável dependente em relação à diversas variáveis independentes: Y = a1A + a2B + a3C + a4D + ...ε A variância total de Y é em parte "explicada" pelas diversas variáveis X's e o restante pela variabilidade devido ao erro ε A proporção da variância dos Y observados "explicada" por uma equação de regressão ajustada é representada pelo coeficiente de determinação R², variando entre 0 e 1 O termo "explicada" tem apenas um significado numérico não implicando necessariamente em um conhecimento causa-efeito sobre o porque da relação existente É verificada a contribuição pura de cada variável independente por comparações sucessivas entre os diversos resultados. Regressão múltipla é multivariada no sentido de que mais de uma variável é medida simultaneamente em cada observação; trata-se, porem de uma técnica univariada, pois o estudo é em relação à variação da variável dependente Y, sem que o comportamento das variáveis independentes, Xs, seja objeto de análise.

19

20 Regressão polinomial superfícies contínuas calculadas por critérios de regressão polinomial, onde Zi é a variável dependente em função linear das coordenadas X-Y dos pontos amostrados e irregularmente distribuídos o modelo para a representação da superfície pelo método dos polinômios não ortogonais é: onde zi(X,Y) é a variável mapeada em função das coordenadas xi e yi e ei representa os resíduos, ou seja, a fonte não-sistemática de variação.

21 Análise de superfícies de tendência
Separação entre o aspecto estrutural (determinístico) e o aspécto errático (casual): tendências regionais e pequenas, aparentemente não ordenadas flutuações, que se impõem aos padrões mais gerais. Detecção de anomalias: resíduos, positivos e negativos, de superfícies de baixo grau. Modelagem por suavização: verificação da superfície de mais alto grau possível que se ajuste aos dados. A representação de uma superfície linear é dada por:

22 Superfície de grau 1 para o cálculo dos coeficientes ai, dispõe-se os dados num sistema de equações normais [A] = [XY]-1[Z]

23 Superfície de grau 2

24 procurar tecer considerações apenas em relação à área coberta pelos pontos evitando as extremidades dos mapas, pois a extrapolação pode apresentar distorções; o número de pontos deve ser maior que o número de coeficientes do polinômio a ser calculado; o arranjo dos pontos, ainda que irregular, deve ser casual e razoavelmente bem distribuído, evitando agrupamentos;

25 Quando da inversão da matriz, por programas em microcomputador, podem ocorrer problemas com os resultados obtidos para superfícies de mais alto grau, isso porque em sistemas com valores de diversos dígitos, tipo UTM, a precisão computacional se deteriora exigindo formato de dupla precisão. Mesmo assim podem ocorrer limitações e, então, a solução é a transformação das coordenadas xi e yi, conforme as equações, que fornecem valores para as coordenadas entre 0 e 1 e não modifica a forma das superfícies:

26

27 Verificação do ajuste das superfícies
COEFICIENTE DE DETERMINAÇÃO (r2) Proporção da variação total da variável dependente “zi” que é explicada pela variação das variáveis independentes “xi” e “yi” Variação total dos dados: SQT = Z2 – (Z)2/n Variação devido à superfície calculada: SQP = Z*2–(Z*)2/n Variação devido aos resíduos: SQR = SQT - SQP Porcentagem de ajuste da superfície: R2 = (SQP/SQT)100 O coeficiente de correlação “r” indica a relação entre variáveis e “r2” indica o quanto uma variável “explica” a outra, ou quanto a superfície calculada se ajusta aos dados espaciais originais.

28 Exemplo

29

30

31

32


Carregar ppt "ANÁLISES DE REGRESSÃO."

Apresentações semelhantes


Anúncios Google