A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó

Apresentações semelhantes


Apresentação em tema: "Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó"— Transcrição da apresentação:

1 Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó

2 Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10 e variância 2 = 16 ? Hipóteses H 0 : = 10 H 1 : 10 Se H 0 é verdadeira, então (hipótese nula) (hipótese alternativa) z >>> 0 Se H 0 falsa z crít -z crít z = 0 Se H 0 verdadeira z <<< 0 Se H 0 falsa aceitação de H 0 rejeição de H 0 rejeição de H 0 Região Crítica: aceito H 0 se –z crít < z < z crít P(–z crít < z < z crít ) = 1 - rejeito H 0 caso contrário P(|z| > z crít ) = Conclusão (sempre associada a um nível de significância) Teste de Hipótese para Teste de Hipótese para

3 z crít -z crít Teste de Hipótese para Teste de Hipótese para Hipóteses H 0 : = 10 H 1 : 10 Se H 0 é verdadeira, então (hipótese nula) (hipótese alternativa) - + 1,96-1,96 aceitação de H 0 rejeição de H 0 rejeição de H 0 Região Crítica: aceito H 0 se –z crít < z < z crít P(–z crít < z < z crít ) = 1 - rejeito H 0 caso contrário P(|z| > z crít ) = Conclusão (sempre associada a um nível de significância) Uma amostra de 25 valores foi selecionada, chegando a uma média amostral igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10 e variância 2 = 16 ? Adotando-se 5% de significância % 2,5% aceito H 0 se –1,96 < z < 1,96 rejeito H 0 caso contrário 1,625 Conclusão: não há razões para duvidar que a média seja de fato 10, adotando-se 5% de significância

4 Teste de Hipótese para Teste de Hipótese para Hipóteses H 0 : = 10 H 1 : > 10 (teste unilateral) Se H 0 é verdadeira, então z crít aceitação de H 0 rejeição de H 0 Região Crítica: aceito H 0 se z < z crít P(z < z crít ) = 1 - rejeito H 0 caso contrário P(z > z crít ) = Conclusão (sempre associada a um nível de significância)

5 Teste de Hipótese para Teste de Hipótese para Hipóteses H 0 : = 10 H 1 : > 10 (teste unilateral) Se H 0 é verdadeira, então z crít Região Crítica: aceito H 0 se z < z crít P(z < z crít ) = 1 - rejeito H 0 caso contrário P(z > z crít ) = Conclusão (sempre associada a um nível de significância) 95% 5% 1,645 aceitação de H 0 rejeição de H 0 aceito H 0 se z < 1,645 rejeito H 0 caso contrário 1,625 Conclusão: não há razões para duvidar que a média seja de fato 10, adotando-se 5% de significância (teste unilateral)

6 Teste de Hipótese – Erros I e II Hipóteses H 0 : = 0 H 1 : > 0 Existe a possibilidade de se selecionar uma amostra de uma população com média 0 e obter alto de forma que leve a conclusão errada de que H 0 é falsa? z crít

7 Teste de Hipótese – Erros I e II Hipóteses H 0 : = 0 H 1 : > 0 Existe a possibilidade de se selecionar uma amostra de uma população com média 0 e obter alto de forma que leve a conclusão errada de que H 0 é falsa? Sim. Este erro é chamado de erro do tipo I e equivale ao nível de significância P(rejeitar H 0 / H 0 é verdadeira) = P(aceitar H 0 / H 0 é verdadeira) = 1 -

8 Teste de Hipótese – Erros I e II Hipóteses H 0 : = 0 H 1 : > 0 Existe a possibilidade de se selecionar uma amostra de uma população com média 1 ( > 0 ) e obter de forma que leve a conclusão errada de que H 0 é verdadeira? Sim. Este erro é chamado de erro do tipo II ou erro. - 0 P(aceitar H 0 / H 1 é verdadeira) = P(rejeitar H 0 / H 1 é verdadeira) = 1 - (poder do teste) + 1 aceitação de H 0

9 Teste de Hipótese – Erros I e II Hipóteses H 0 : = 0 H 1 : > H 0 é verd. H 0 é falso Aceita H 0 Rejeita H Alternativas para diminuir : distanciar 1 de 0 aumentar aumentar n

10 Teste de Hipótese para Teste de Hipótese para No exemplo anterior, uma amostra de 25 valores foi selecionada, chegando-se a uma média amostral igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão que a verdadeira média poderia ser igual a 10, adotando-se o nível de significância de 5% (considerando 2 = 16 ). Mas qual a probabilidade de chegarmos a esta mesma conclusão, sendo a verdadeira média igual a 12, ou seja, qual o valor de ? H 0 : = 10 H 1 : > 10 Se H 0 é verdadeira, então z crít = ? 1,645 aceito H 0 se z < 1,645 rejeito H 0 se z > 1,645 Conclusão: Aceito H 0 Aceito H 0, ou seja, a média é igual a 10 considerando 5% de significância

11 Teste de Hipótese para Teste de Hipótese para Agora, considerando a igual a 12 H 0 : = 10 H 1 : = 12 = P(aceitar H 0 / H 1 é verdadeiro) z crít = ? 1,645 H 0 verdadeiro

12 Teste de Hipótese para Teste de Hipótese para - 10 H0H0 11,316 H1H Agora, considerando a igual a 12 H 0 : = 10 H 1 : = 12 = P(aceitar H 0 / H 1 é verdadeiro)

13 Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 ( z crítico = 1,645). A média continuaria ser significativamente maior do que 20 se fosse adotado um nível de significância de 1%? 2, ,645 Aceita H 0 Rejeita H 0 H 0 : = 20 H 1 : > 20 Se H 0 é verdadeira, então

14 Teste de Hipótese – valor-P (p-value) A média continuaria ser significativamente maior do que 100 se fosse adotado um nível de significância de 1%? 2,5 H 0 : = 20 H 1 : > 20 Se H 0 é verdadeira, então 2, ,33 Aceita H 0 Rejeita H 0 Para que valores de nível de significância, a média poderia ser considerada igual a 20? Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 ( z crítico = 1,645).

15 Teste de Hipótese – valor-P (p-value) A média continuaria ser significativamente maior do que 100 se fosse adotado um nível de significância de 1%? 2,5 H 0 : = 20 H 1 : > 20 Se H 0 é verdadeira, então Para que valores de nível de significância, a média poderia ser considerada igual a 20? 2, Aceita H 0 Rejeita H 0 ? 0,0062 Pode-se aceitar H 0 para qualquer nível de significância ( ) menor que 0,0062. valor-P = P(Z > z), ou seja, neste caso valor-P = P(Z > 2,5) = 0,0062 valor-P Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 ( z crítico = 1,645).

16 Teste de Hipótese – valor-P (p-value) Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão ( p ) de 0,90. A tabela abaixo apresenta a exatidão estimada, o resultado do teste (estatística z) e o valor-P de cada mapa. z valor-P Mapa 10,87-0,7070,2397 Mapa 20,62-6,6002,07e-11 Mapa 30,82-1,8860,0297 Mapa 40,84-1,4140,0786 Quais mapas possuem exatidão menor que 0,90, com 5% de significância? Quais mapas possuem exatidão menor que 0,90, com 1% de significância? Mapas 2 e 3 Somente Mapa 2

17 Teste de Hipótese para 2 S amostra 2 = 25 Uma população com variância 2 = 25 conhecida poderia produzir uma amostra com s 2 = 27,34 ? Hipóteses H 0 : 2 = 25 H 1 : 2 25 (hipótese nula) (hipótese alternativa) s 2 = 27,34

18 Teste de Hipótese para 2 S amostra 2 = 25 Uma população com variância 2 = 25 conhecida poderia produzir uma amostra com s 2 = 27,34 ? Hipóteses H 0 : 2 = 25 H 1 : 2 25 Se H 0 é verdadeira, então (hipótese nula) (hipótese alternativa) s 2 = 27,34

19 Hipóteses H 0 : 2 = 25 H 1 : 2 25 Teste de Hipótese para 2 Se H 0 é verdadeira, então aceitação de H 0 rejeição de H 0 rejeição de H 0 Região Crítica: aceito H 0 se x a < X < x b P(x a < X < x b ) = 1 - rejeito H 0 caso contrário Conclusão (sempre associada a um nível de significância) 0 + (hipótese nula) (hipótese alternativa)

20 Teste de Hipótese para 2 Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Supondo que s 2 = 2,34, teste a hipótese de que a verdadeira variância 2 seja de fato igual a 4, considerando 5% de significância. ? 12, ? 39,36 Hipóteses H 0 : 2 = 4 H 1 : 2 4 Se H 0 é verdadeira, então Região Crítica: aceito H 0 se 12,40 < X < 39,36 rejeito H 0 caso contrário Conclusão: Aceito H 0, ou seja, não há razões para discordar que, a 5%, 2 = 4

21 Teste de Hipótese para com 2 desconhecida Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância 2 também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que e s 2 = 4,5, teste a hipótese unilateral a 1% de que = 15. Rejeito H 0, ou seja, a média é significativamente (a 1%) menor que 15 H 0 : = 15 H 1 : < 15 Se H 0 é verdadeira, então t crít = ? - 2,492 aceito H 0 se t > -2,492 rejeito H 0 se t < -2,492 Conclusão:

22 Inferência entre parâmetros de duas populações S1S1 S2S2 n1n1 n2n2 Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais? Se 1 e 2 são iguais, então = 0.

23 Teste de Hipótese para 1 = z crít -z crít desconhecidas, mas conhecidas Se H 0 é verdadeira, então Hipóteses H 0 : = 0 ( 1 = 2 ) H 1 :

24 Teste de Hipótese para 1 = 2 e desconhecidas (fazendo) ( homocedástico)

25 Teste de Hipótese para 1 = 2 e desconhecidas

26 Teste de Hipótese para 1 = 2 e desconhecidas

27 Teste de Hipótese para 1 = 2 e desconhecidas mas t crít -t crít Hipóteses H 0 : = 0 ( 1 = 2 ) H 1 : Se H 0 é verdadeira, então ( t homocedástico)

28 Teste de Hipótese para 1 = 2 e desconhecidas mas t crít -t crít ( t heterocedástico) Hipóteses H 0 : = 0 ( 1 = 2 ) H 1 : Se H 0 é verdadeira, então

29 Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: Teste de Hipótese para 1 = 2 Usar teste t homocedástico ou heterocedástico? primeiramente deve-se testar se

30 Distribuição F (de Snedecor) (lê-se: X tem distribuição F com g 1 e g 2 graus de liberdade) Propriedades: a) seeentão 0 + b) seentão

31 Distribuição F 0 + F g1g1 g2g2

32 0 + F g1g1 g2g2

33 0 + F g1g1 g2g2

34 Se

35 Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: Teste de Hipótese para ? 0 + ? Se H 0 é verdadeira, então Região Crítica: aceito H 0 se 0,47 < F < 1,99 rejeito H 0 caso contrário Hipóteses Conclusão: Aceito H 0, ou seja, não há razões para discordar que, a 5%,

36 Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: % t-t 2,5% ? 1,997 Teste de Hipótese para 1 = 2 (cont.) Se H 0 é verdadeira, então Hipóteses H 0 : = 0 ( 1 = 2 ) H 1 : ( t homocedástico) t = -14,9515 Conclusão: Rejeito H 0, ou seja, as médias são diferentes significativamente a 5%

37 Teste de Hipótese para p Hipóteses H 0 : p = p 0 H 1 : p p 0 Se H 0 é verdadeira, então Região Crítica: aceito H 0 se –z crít < z < z crít P(–z crít < z < z crít ) = 1 - rejeito H 0 caso contrário P(|z| > z crít ) = Conclusão (sempre associada a um nível de significância) z crít -z crít aceitação de H 0 rejeição de H 0 rejeição de H 0

38 Teste de Hipótese para p 1 = p 2 Hipóteses H 0 : p 1 – p 2 = 0 (p 1 = p 2 ) H 1 : p 1 – p 2 0 Se H 0 é verdadeira, então Região Crítica: aceito H 0 se –z crít < z < z crít P(–z crít < z < z crít ) = 1 - rejeito H 0 caso contrário P(|z| > z crít ) = Conclusão (sempre associada a um nível de significância) z crít -z crít aceitação de H 0 rejeição de H 0 rejeição de H 0

39 Teste de Hipótese (resumo) para se 2 é conhecida se 2 é desconhecida para 2 para se e são conhecidas se e são desconhecidas, mas

40 Teste de Hipótese (resumo) para se 2 é conhecida se 2 é desconhecida para 2 para para p para p 1 – p 2 para se e são conhecidas se e são desconhecidas, mas

41 Teste de Hipótese / EXCEL amostraAlvo 1Alvo Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta? Comparação de duas médias: teste-t Mas qual? Homo ou heterocedástico? Teste-F: duas amostras para variâncias Alvo 1Alvo 2 Média119,2101,6 Variância90, ,04444 Observações10 gl99 F2, P(F<=f) uni-caudal0, F crítico uni-caudal3, Teste-t: duas amostras presumindo variâncias equivalentes Alvo 1Alvo 2 Média119,2101,6 Variância90, ,04444 Observações10 Variância agrupada63,44444 Hipótese da diferença de média0 gl18 Stat t4, P(T<=t) uni-caudal5,28E-05 t crítico uni-caudal1, P(T<=t) bi-caudal0, t crítico bi-caudal2, H 0 : = 0 H 1 : > 0 Conclusão: através do teste-t homocedástico unilateral, pôde-se concluir que a média do alvo 1 deve ser maior que a do alvo 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (0, ).

42 Teste t pareado 10 pontos são escolhidos em cada imagem Imagem AImagem B Esquema 1 Esquema 2 amostraAB amostraAB

43 Teste t pareado Esquema 1 Esquema 2 amostraAB amostraAB (Ac. H 0 a 5%) Teste t (Ac. H 0 a 5%) Teste t Se H 0 verdadeiro H 0 : A = B H 1 : A > B H 0 : A = B H 1 : A < B

44 Teste t pareado Esquema 1 Esquema 2 amostraAB amostraABA-B (Ac. H 0 a 5%) Teste t Teste t pareado H 0 : A-B = 0 H 1 : A-B < 0 Se H 0 verdadeiro (Rej. H 0 a 5%)

45 Comparando-se as médias de r populações S1S1 S2S2 n1n1 n2n2 SrSr nrnr X ij é o i -ésimo elemento da amostra retirada da população j (população = tratamento) j é a média da população j i = 1,..., n j j = 1,..., r X ij = j + ij ij ~ N(0, 2 ) média globalefeito da pop. j efeito aleatório j = * + j X ij = * + j + ij r * Todas r populações têm a mesma variância!!!

46 Comparando-se as médias de r populações ABCD Total Média njnj ABCD X 11 X 12 X 13 X 14 X 21 X 22 X 23 X 24 X 32 X 33 Total X *1 X *2 X *3 X *4 X ** Média X1X1 X2X2 X3X3 X4X4 XTXT njnj n1n1 n2n2 n3n3 n4n4 nTnT

47 Comparando-se as médias de r populações ABCD Total Média njnj ABCD

48 Comparando-se as médias de r populações ABCD Total Média njnj ABCD

49 Comparando-se as médias de r populações ABCD Total Média njnj ABCD

50 Comparando-se as médias de r populações ABCD Total Média njnj SQTOSQTSQE = +

51 Análise de Variância ABCD Total Média njnj Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrado Médio Tratamentos Erro Total n T - 1 n T - r r - 1 ANOVA (Análise de Variância)

52 Análise de Variância ABCD Total Média njnj Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrado Médio Tratamentos Erro Total n T - 1 n T - r r - 1 ANOVA (Análise de Variância)

53 Análise de Variância ABCD Total Média njnj Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrado Médio Tratamentos Erro Total n T - 1 n T - r r - 1 ANOVA (Análise de Variância) H 0 : 1 = 2 =... = r H 1 : nem todos j são iguais H 0 : j = 0 H 1 : nem todos j = 0

54 Análise de Variância ABCD Total Média njnj Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrado Médio Tratamentos Erro Total n T - 1 n T - r r - 1 ANOVA (Análise de Variância) H 0 verd. H 0 falso ac. H 0 rej. H 0 H 0 : 1 = 2 =... = r H 1 : nem todos j são iguais 0 + 1

55 Análise de Variância ABCD Total Média njnj Fonte de Variação Soma dos Quadrados Graus de Liberdade Quadrado Médio F calculadoValor - P Tratamentos258 Erro46 Total ANOVA (Análise de Variância) 7, ,20,0072 Conclusão: rej. H 0 a 5%, pelo menos uma média é diferente das demais

56 Análise de Variância OBSERVAÇÕES: -Cada observação é independente das demais; -Cada tratamento tem distribuição normal; -Todas as distribuições têm a mesma variância; e -ANOVA com 2 tratamentos ( r = 2) é similar a um teste t bilateral (homocedástico).

57 Teste de Bartlett (igualdade de variâncias) Se,..., são as variâncias amostrais de r populações com distribuição normal, então Fazendo onde 0 + H 0 verd. H 0 falso ac. H 0 rej. H 0 H 0 : H 1 : nem todas são iguais

58 Teste de Bartlett (igualdade de variâncias) Usando-se o exemplo da ANOVA: ABCD Total s2s njnj H 0 : H 1 : nem todas são iguais 0 + 0,05 Conclusão: aceito H 0 a 5%, ou seja, as variâncias dos grupos podem ser as mesmas

59 O teste consiste em calcular um valor ( D crít ), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. Teste de Tukey (teste para comparação múltipla) Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de significância. H 0 : H 1 : onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – studentized range) associado ao nível de significância adotado.

60 Distribuição da Amplitude Studentizada g r

61 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA:

62 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: aaaa

63 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: aaaaaa

64 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: aaabaaab

65 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: aaabaaab

66 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: aaabaaab

67 Teste de Tukey (teste para comparação múltipla) ABCD Total Média njnj Usando-se o exemplo da ANOVA: a ab b BACD


Carregar ppt "Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó"

Apresentações semelhantes


Anúncios Google