Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó
Valor do dado Freq. Abs. Obs Freq. Abs. Esp.? Valor do dado Freq. Abs. Obs Freq. Abs. Esp Teste de Aderência Exemplo: Deseja-se testar a hipótese de que um dado seja honesto. Para tanto, joga-se o mesmo 1200 vezes anotando-se os resultados: Valor do dado Freq. Abs. Obs H 0 : ? H 0 : p i = 1/6 (i = 1, 2,..., 6) (dado honesto) H 1 : pelo menos algum p i 1/6 Se H 0 é verdadeira, então c é o número de classes 0 + H 0 verd. H 0 falso ac. H 0 rej. H 0
Valor do dado Freq. Abs. Obs Freq. Abs. Esp Teste de Aderência Exemplo: Deseja-se testar a hipótese de que um dado seja honesto. Para tanto, joga-se o mesmo 1200 vezes anotando-se os resultados (tabela abaixo). H 0 : p i = 1/6 (i = 1, 2,..., 6) (dado honesto) H 1 : p i 1/6 Se H 0 é verdadeira, então Conclusão: considerando 5% de significância, aceita-se H 0, ou seja, não há razões para discordar que o dado seja honesto. 0 + = 0,05
2,24,13,54,55,03,73,02,63,41,6 3,13,33,83,14,73,72,54,34,93,6 2,93,33,93,14,83,13,74,43,24,1 1,93,44,73,83,02,63,93,04,23,5 Teste de Normalidade / Teste de Aderência Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer Y. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal com média igual a 3,6 e variância 2 igual a 0,8. H 0 : Y ~ N( = 3,6; 2 = 0,8) H 1 : Y ~ ? H 0 : (Y – 3,6)/0,8944 = Z ~ N(0,1) H 1 : (Y – 3,6)/0,8944 ~ ? Valores padronizados: -1,570,56-0,111,011,570,11-0,67-1,12-0,22-2,24 -0,56-0,340,22-0,561,230,11-1,230,781,450,00 -0,78-0,340,34-0,561,34-0,560,110,89-0,450,56 -1,90-0,221,230,22-0,67-1,120,34-0,670,67-0,11
Teste de Normalidade / Teste de Aderência Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer Y. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal com média igual a 3,6 e variância 2 igual a 0,8. Valores padronizados: Agrupando-se os valores padronizados em 7 classes equiprováveis tem-se LimitesFAObs - a -1, ,068 a -0, ,566 a -0, ,180 a 0,1806 0,180 a 0,5666 0,566 a 1,0684 1,068 a ,570,56-0,111,011,570,11-0,67-1,12-0,22-2,24 -0,56-0,340,22-0,561,230,11-1,230,781,450,00 -0,78-0,340,34-0,561,34-0,560,110,89-0,450,56 -1,90-0,221,230,22-0,67-1,120,34-0,670,67-0,11 LimitesFAObsFAEsp - a -1,068640/7 -1,068 a -0,566440/7 -0,566 a -0,180940/7 -0,180 a 0,180640/7 0,180 a 0,566640/7 0,566 a 1,068440/7 1,068 a + 540/7 X = 3, = 0,05 Conclusão: aceita-se H 0 a 5% sig., ou seja, Y ~ N( = 3,6; 2 = 0,8)
Teste de Aderência OBSERVAÇÕES: -Deve-se agrupar os dados em 2 a 20 classes excludentes (ideal 5); -Se houver apenas 2 classes, o valor esperado de cada uma deve ser 5; -Se houver mais que 2 classes, não mais de 20% dos valores esperados devem ser < 5, e nenhum deve ser nulo; -Não é necessário que as classes sejam equiprováveis; -Este teste não é sensível ao ordenamento das classes; e -Para cada parâmetro estimado, perde-se 1 grau de liberdade.
2,24,13,54,55,03,73,02,63,41,6 3,13,33,83,14,73,72,54,34,93,6 2,93,33,93,14,83,13,74,43,24,1 1,93,44,73,83,02,63,93,04,23,5 Teste de Normalidade / Teste de Aderência Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer Y. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal. H 0 : Y ~ N( = 3,5275; 2 = 0,6528) H 1 : Y ~ ? H 0 : (Y – 3,5275)/0,8080 = Z ~ N(0,1) H 1 : (Y – 3,5275)/0,8080 ~ ? Valores padronizados: -1,640,71-0,031,201,820,21-0,65-1,15-0,16-2,39 -0,53-0,280,34-0,531,450,21-1,270,961,700,09 -0,78-0,280,46-0,531,57-0,530,211,08-0,410,71 -2,01-0,161,450,34-0,65-1,150,46-0,650,83-0,03
LimitesFAObs - a -1, ,068 a -0, ,566 a -0, ,180 a 0,1805 0,180 a 0,5667 0,566 a 1,0684 1,068 a + 7 LimitesFAObsFAEsp - a -1,068640/7 -1,068 a -0,566440/7 -0,566 a -0,180740/7 -0,180 a 0,180540/7 0,180 a 0,566740/7 0,566 a 1,068440/7 1,068 a + 740/7 Teste de Normalidade / Teste de Aderência Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer Y. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal. Valores padronizados: Agrupando-se os valores padronizados em 7 classes equiprováveis tem-se X = = 0,05 Conclusão: aceita-se H 0 a 5% sig., ou seja, Y ~ N -1,640,71-0,031,201,820,21-0,65-1,15-0,16-2,39 -0,53-0,280,34-0,531,450,21-1,270,961,700,09 -0,78-0,280,46-0,531,57-0,530,211,08-0,410,71 -2,01-0,161,450,34-0,65-1,150,46-0,650,83-0, = 4
Teste de Kolmogorov-Smirnov Exemplo (usado no teste 2 ): Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer X. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal com média igual a 3,6 e variância 2 igual a 0,8. 2,24,13,54,55,03,73,02,63,41,6 3,13,33,83,14,73,72,54,34,93,6 2,93,33,93,14,83,13,74,43,24,1 1,93,44,73,83,02,63,93,04,23,5 H 0 : X ~ N( = 3,6; 2 = 0,8) H 1 : X ~ ? H 0 : (X – 3,6)/0,8944 = Z ~ N(0,1) H 1 : (X – 3,6)/0,8944 ~ ? Valores padronizados: -1,570,56-0,111,011,570,11-0,67-1,12-0,22-2,24 -0,56-0,340,22-0,561,230,11-1,230,781,450,00 -0,78-0,340,34-0,561,34-0,560,110,89-0,450,56 -1,90-0,221,230,22-0,67-1,120,34-0,670,67-0,11
Teste de Kolmogorov-Smirnov Exemplo (usado no teste 2 ): Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer X. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal com média igual a 3,6 e variância 2 igual a 0,8. Valores padronizados ordenados: -2,24-1,9-1,57-1,23-1,12 -0,78-0,67 -0,56 -0,45-0,34 -0,22 -0,11 0,000,11 0,22 0,34 0,56 0,670,780,891,011,23 1,341,451,57 valores críticos tabelados! Se D maior que D crít, então conclui-se que a distribuição teórica não é válida, com certo nível de significância.
Teste de Kolmogorov-Smirnov
Exemplo (usado no teste 2 ): Considere os dados abaixo, resultantes da observação de 40 valores de uma variável aleatória qualquer X. Deseja-se testar a hipótese de que esta variável aleatória tenha distribuição normal com média igual a 3,6 e variância 2 igual a 0,8. Valores padronizados ordenados: -2,24-1,9-1,57-1,23-1,12 -0,78-0,67 -0,56 -0,45-0,34 -0,22 -0,11 0,000,11 0,22 0,34 0,56 0,670,780,891,011,23 1,341,451,57 Conclusão: pode-se aceitar a hipótese de que os dados provenham de uma normal, a 5% de significância.
Teste de Kolmogorov-Smirnov OBSERVAÇÕES: -É o teste mais apropriado para dados ordenados; -Ideal quando a variável tem distribuição contínua; e -Não há uma modificação quando se estima os parâmetros de uma distribuição (não há perdas de graus de liberdade como no teste 2 ).
Teste de Independência Exemplo: Suponha que 200 estudantes sejam selecionados aleatoriamente em uma universidade e que cada estudante seja classificado de acordo com a sua área de estudo e com sua preferência entre dois candidatos para uma próxima eleição. Área de Estudo Candidato Total ABIndeciso Engenharia Psicologia Direito Administração Total Deseja-se testar a hipótese de que a preferência a um certo candidato é independente da área de estudo. p i = probabilidade de estar na área i p j = probabilidade de votar no candidato j H 0 : p ij = p i * p j H 1 : p ij p i * p j
Área de Estudo Candidato Total ABIndeciso Engenharia?59 Psicologia48 Direito38 Administração55 Total Área de Estudo Candidato Total ABIndeciso Engenharia27,1418,8812,9859 Psicologia22,0815,3610,5648 Direito17,4812,168,3638 Administração25,3017,6012,1055 Total Teste de Independência Exemplo: Suponha que 200 estudantes sejam selecionados aleatoriamente em uma universidade e que cada estudante seja classificado de acordo com a sua área de estudo e com sua preferência entre dois candidatos para uma próxima eleição. Área de Estudo Candidato Total ABIndeciso Engenharia Psicologia Direito Administração Total H 0 : p ij = p i * p j H 1 : p ij p i * p j Observado Se H 0 é verdadeira, então Esperado l é o número de linhas c é o número de colunas
27,1418,8812,98 22,0815,3610,56 17,4812,168,36 25,3017,6012,10 Teste de Independência Exemplo: Suponha que 200 estudantes sejam selecionados aleatoriamente em uma universidade e que cada estudante seja classificado de acordo com a sua área de estudo e com sua preferência entre dois candidatos para uma próxima eleição Observado Esperado 0 + = 0,05 Conclusão: aceita-se H 0 a 5% sig., ou seja, há independência entre a área e o candidato escolhido pelo estudante