A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Análise de Regressão Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/

Apresentações semelhantes


Apresentação em tema: "Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Análise de Regressão Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/"— Transcrição da apresentação:

1 Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Análise de Regressão
Camilo Daleles Rennó

2 Regressão Análise de Regressão
“método estatístico que utiliza a relação entre duas ou mais variáveis para que uma variável possa ser estimada (ou predita) a partir da outra ou das outras” relação Neter, J. et al. Applied Linear Statistical Models. McGraw Hill, 1996

3 Relação funcional x Relação estatística
As variáveis podem possuir dois tipos de relações: Funcional: a relação é expressa por uma fórmula matemática: Y = f(X) Ex: relação entre o perímetro (P) e o lado de um quadrado (L) Lado do Quadrado (L) Perímetro (P) Todos os pontos caem perfeitamente sobre a reta que representa a relação funcional entre L e P

4 Relação funcional x Relação estatística
Estatística: não há uma relação perfeita como no caso da relação funcional. As observações em geral não caem exatamente na curva da relação. Ex: relação entre o peso (P) e a altura (A) de uma pessoa Altura (A, cm) Peso (P, kg) A existência de uma relação estatística entre a variável dependente Y e a variável independente X não implica que Y dependa de X, ou que exista uma relação de causa-efeito entre X e Y.

5 Medida de Associação X Y X Y X Y r = 0,9 r = 0,3 r = 0
Coeficiente de Correlação (de Pearson) mede o grau de relação linear entre X e Y X Y r = - 0,9

6 Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação Um alto coeficiente de correlação nem sempre indica que a equação de regressão estimada está bem ajustada aos dados. ? X Y X Y X Y X Y ? Y X

7 Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação Um coeficiente de correlação próximo de zero nem sempre indica que X e Y não são relacionadas. X Y A X Y X Y X Y B

8 Modelo de Regressão Regressão Linear Simples Yi = 0 + 1Xi + i
Descrever como duas ou mais variáveis se relacionam Estimar os parâmetros da função que determina a relação entre as variáveis dependente (Y) e independentes (X) Usar a equação ajustada para prever valores da variável dependente. Regressão Linear Simples Yi = 0 + 1Xi + i variável dependente (variável resposta) variável independente (valores fixos conhecidos) componente aleatório

9 Modelo de Regressão Linear Simples
Y i E(Yi) = 0 + 1 Xi 1 Coeficiente angular b0 Inclinação populacional X Intercepto populacional

10 Estimação dos parâmetros
Em geral não se conhece os valores de 0, 1 e 2 Eles podem ser estimados através de dados obtidos por amostras. O método utilizado na estimação dos parâmetros é o método dos mínimos quadrados, o qual considera os desvios dos Yi de seu valor esperado: i = Yi – (0 + 1 Xi) Em particular, o método dos mínimos quadrados requer que consideremos a soma dos n desvios quadrados, denotado por Q:

11 Estimação dos parâmetros
De acordo com o método dos mínimos quadrados, os estimadores de 0 e 1 são aqueles, denotados por b0 e b1, que tornam mínimo o valor de Q. Derivando Igualando-se essas equações a zero obtém-se os valores b0 e b1 que minimizam Q: (resíduo)

12 Estimação da Variância do Erro (2)
A variância dos erros i,, denotada por 2, é um parâmetro do modelo de regressão, e necessita ser estimada através dos desvios de Yi em torno de sua própria média estimada . Soma de quadrados dos resíduos (SQRes): A soma dos quadrados dos resíduos tem n – 2 graus de liberdade, pois 2 graus de liberdade foram perdidos por estimar b0 e b1. Portanto, o estimador de 2, denominado de Quadrado Médio do Resíduo (QMRes), é dado pela razão entre a soma dos quadrados dos resíduos e (n – 2): Pode ser demonstrado que:

13 Inferência em Análise de Regressão
Considere o modelo: Yi = 0 + 1 Xi + i  ~ N(0; 2) e COV (i,j)= 0 IC para 0 e 1 IC para Ynovo 0 = 0 ? 1 = 0 ? (teste de hipótese) X Y ? se H0 verdadeira E(t) = 0 se H0 falso E(t) <<<< 0

14 ANOVA x Análise de Regressão
Y Yi SQTo = SQReg SQRes Coeficiente de determinação 0  R2  1 Interpretação: R2 mede a fração da variação total de Y explicada pela regressão e por isso pode ser representada em porcentagem X

15 ANOVA x Análise de Regressão
se H0 verdadeiro E(F) = 1 se H0 falso E(F) >>>> 1

16 Análise de Regressão no EXCEL
Y 1 1,1 2 1,9 3 2,5 4 4,3 5 6,1 6 6,3 7 7,8 8 7,0 9 9,1 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,9745 R-Quadrado 0,9496 R-quadrado ajustado 0,9424 Erro padrão 0,6735 Observações 9 ANOVA gl SQ MQ F F de significação Regressão 1 59,8002 131,8267 8,55E-06 Resíduo 7 3,1754 0,4536 Total 8 62,9756 Coeficientes Stat t valor-P 95% inferiores 95% superiores Interseção 0,1306 0,4893 0,2668 0,7973 -1,0265 1,2876 X 0,9983 0,0870 11,4816 0,7927 1,2039 s valor-P s2 OBS: Para regressão linear simples: teste F = teste t para 1 (bilateral)

17 Modelos Linearizáveis
Modelo Padrão: Yi = 0 + 1Xi + i exponencial potencial logaritmo potência inverso

18 Análise de Resíduos Resíduo =

19 Análise de Resíduos Resíduo Padronizado =

20 Análise de Resíduos “ideal” 2 não constante não linearidade “outlier”
Resíduos Padronizados “outlier” Resíduos Padronizados não independência tempo

21 Regressão passando pela origem (0 = 0)
(R2 pode ser negativo!)


Carregar ppt "Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Análise de Regressão Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/"

Apresentações semelhantes


Anúncios Google