A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs.

Apresentações semelhantes


Apresentação em tema: "Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs."— Transcrição da apresentação:

1 Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas

2 Objetivos Desenvolver habilidades para inferir o comportamento da população a partir de dados de uma amostra Desenvolver habilidades para inferir se o comportamento de duas população diferem a partir de dados de duas amostras Desenvolver habilidades para estimar o poder de um teste em rejeitar uma hipótese 2 Christopher Souza: Teste de hipóteses

3 Relevância do conteúdo Definição e avaliação de hipóteses é o cerne de estudos científicos Testes de hipóteses trazem o respaldo matemático para apoiar afirmações sobre o comportamento da população em estudo Christopher Souza: Teste de hipóteses 3

4 Conteúdo Fundamentos de testes de hipóteses Testes sobre uma população Testes sobre duas populações Christopher Souza: Teste de hipóteses 4

5 Fundamentos de testes de hipóteses Hipótese Hipótese nula e alternativa Estatística de teste Valor crítico Valor p Decisões e conclusões Erro do tipo I e do tipo II Poder de um teste Christopher Souza: Teste de hipóteses 5

6 Hipótese: nula e alternativa Em estatística, hipótese é uma afirmação sobre uma propriedade da população Teste de hipótese: teste da afirmação Hipótese nula: afirmação em que o valor de um parâmetro é comparado a um valor específico H 0 : = 0 Hipótese alternativa: afirmação que se deseja testar H 1 : 0, H 1 : > 0, H 1 : < 0 Christopher Souza: Teste de hipóteses 6

7 Estatística de teste Valor usado para tomar decisão sobre a hipótese nula (rejeitá-la ou não) Estimativa pela conversão da estatística amostral em um escore (z, t, ²), a partir da suposição de que a hipótese nula seja verdadeira Christopher Souza: Teste de hipóteses 7

8 Intervalos de confiança (proporção) Requisitos: Amostra aleatória simples. Condições para a distribuição binomial satisfeitas. Haver pelo menos 5 sucessos e 5 fracassos, o que permite aproximar pela distribuição normal Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de proporção esteja inserido no intervalo construído a partir da proporção amostral Christopher Souza: Teste de hipóteses 8 PopulaçãoInfinitaFinita Margem de Erro Tamanho da Amostra

9 Intervalos de confiança (, para conhecido) Requisitos: Amostra aleatória simples. Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino) Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral Christopher Souza: Teste de hipóteses 9 PopulaçãoInfinitaFinita Margem de Erro Tamanho da Amostra

10 Intervalos de confiança (, para desconhecido) Requisitos: Amostra aleatória simples. Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino) Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral Christopher Souza: Teste de hipóteses 10 Margem de Erro População infinita População finita

11 Intervalos de confiança ( ² ) Requisitos: Amostra aleatória simples. Distribuição normal mesmo para grandes amostras Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de variância esteja inserido no intervalo construído a partir da variância amostral Estima-se desvio amostral a partir da raiz da estimativa do parâmetro de variância Christopher Souza: Teste de hipóteses 11

12 Região crítica Conjunto de todos os valores da estatística que podem nos fazer rejeitar a hipótese nula Definição a partir da escolha do valor crítico, assim como estimado no estudo de intervalos de confiança Christopher Souza: Teste de hipóteses 12

13 Intervalos de confiança Christopher Souza: Teste de hipóteses 13 Estamos 95% confiantes de que o intervalo ± E contém o valor de

14 Valor P Probabilidade de obter, no mínimo, um valor da estatística teste tão extremo quanto o valor representado pela amostra Obtenção de magnitude do valor P permite a decisão de rejeitar ou não a hipótese nula sem definir a priori o valor crítico Rejeitar ou não a hipótese depende da ponderação sobre o que se considera crítico e sua relação com o valor P Christopher Souza: Teste de hipóteses 14

15 Decisão e conclusões Teste da hipótese nula permite: Rejeitá-la Deixar de a rejeitar Se afirmativa original contiver igualdade e for rejeitada, pode se concluir que: Há evidência suficiente para garantir a rejeição de H 0 Senão Não há evidência suficiente para garantir a rejeição de H 0 Se afirmativa original não contiver igualdade e for rejeitada, pode se concluir que: Os dados amostrais apóiam a afirmativa de que H 0 Senão Não há evidência amostral suficiente para apoiar H 0 Christopher Souza: Teste de hipóteses 15

16 Erros Tipo I ( ) Rejeitar H 0 quando deveria ser aceita Tipo II ( ) Não rejeitar H 0 quando deveria ser rejeitada Controle de erros:, e n estão relacionados Christopher Souza: Teste de hipóteses 16

17 Investigações sobre Erro do tipo I Supondo: = 0,05 = 0,0625 n = 64 H o : p=0,5 Tem-se: z /2 =1,96 p /2 =0,5 0,1225 Se utilizarmos =0,01 z /2 =2,575 p /2 =0,5 0,1609 Se utilizarmos n=100 = 0,05 z /2 =1,96 p /2 =0,5 0,098 Christopher Souza: Teste de hipóteses 17

18 Investigações sobre Erro do tipo II Supondo: = 0,05 n = 64 = 0,0625 H o : p=0,5 p /2 =0,5 0,1225 H 1 : p=0,7 Tem-se: z 1 = (0,5-0,1225-0,7) / 0,0625 = -5,16 z 2 = (0,5+0,1225-0,7)/ 0,0625 = -1,24 P =0, Se utilizarmos H 1 : p=0,55 z 1 =(0,5-0,1225-0,55) / 0,0625 = -2,76 z 2 = (0,5+0,1225-0,55)/ 0,0625 = 1,16 P =0,877-0,0029=0,8741 Se utilizarmos n=100 z 1 = (0,5-0,1225-0,7) / 0,05 = -6,45 z 2 = (0,5+0,1225-0,7)/ 0,05 = -1,55 P =0,0606 Christopher Souza: Teste de hipóteses 18

19 Investigações sobre Erro do tipo II Supondo: = 0,05 n = 64 = 0,0625 H o : p=0,5 p /2 =0,5 0,1225 H 1 : p=0,7 Tem-se: z 1 = (0,5-0,1225-0,7) / 0,0625 = -5,16 z 2 = (0,5+0,1225-0,7)/ 0,0625 = -1,24 P =0, Se utilizarmos =0,01 z 1 =(0,5-0,1609-0,7) / 0,0625 = -5,77 z 2 = (0,5+0,1609-0,7)/ 0,0625 = -0,625 P =0,266 Christopher Souza: Teste de hipóteses 19

20 Resumo de investigações Quando n aumenta, os dois erros diminuem Quando diminui, aumenta Erro tipo II mais provável se H 1 se aproxima de H 0 Maior interesse em detectar grandes diferenças entre valores supostos (H 0 ) e verdadeiros (H 1 ) p /2 n,p=0,7,p=0,55 0,5 0, , ,8741 0,5 0, ,266 0,5 0, ,0606 Christopher Souza: Teste de hipóteses 20

21 Poder de um teste Poder de apoiar uma hipótese alternativa verdadeira (1- ). Christopher Souza: Teste de hipóteses 21

22 Testes de hipóteses sobre uma população Método tradicionalValor P Comparação de estatística de teste, z, t ou ², com valor crítico para o nível de confiança estatística de teste é estimada como visto nas distribuições de estatísticas amostrais, normal para médias, t e ², Comparação de áreas sob as curvas estimadas a partir da estatística de teste e a região crítica 22 Christopher Souza: Teste de hipóteses

23 Testes de hipóteses sobre uma população Método do intervalo de confiança Comparação de intervalos de confiança com valor crítico para o nível de significância Se valor crítico for inferior ao intervalo, rejeita-se a hipótese nula Christopher Souza: Teste de hipóteses 23

24 Amostra não-normal Uma hipótese (a ser testada): (Dúvida:) Estatística de teste = valor obtido da amostra original Valor crítico estimado por percentil da distribuição bootstrap Método do intervalo de confiança não se aplica Christopher Souza: Teste de hipóteses 24

25 Inferências sobre duas proporções Requisitos: Amostras aleatórias simples. Condições para a distribuição binomial satisfeitas. Haver pelo menos 5 sucessos e 5 fracassos em cada amostra, o que permite aproximar pela distribuição normal Proporção amostral combinada: Christopher Souza: Teste de hipóteses 25 Estatística de teste: Estimativa de intervalo de confiança

26 Inferências sobre duas médias Amostras independentes, desconhecido Requisitos: Amostras aleatórias simples. Distribuições normais ou n>30 Sugestão: Analise preliminarmente as amostras Para identificar valores críticos: Christopher Souza: Teste de hipóteses 26 Estatística de teste: Estimativa de intervalo de confiança

27 Inferências sobre duas médias Amostras independentes, conhecido Requisitos: Amostras aleatórias simples. Distribuições normais ou n>30 Sugestão: Analise preliminarmente as amostras Christopher Souza: Teste de hipóteses 27 Estatística de teste: Estimativa de intervalo de confiança

28 Inferências sobre duas médias Amostras emparelhadas, desconhecido Requisitos: Amostras aleatórias simples. Distribuições normais ou n>30 Sugestão: Analise preliminarmente as amostras Dados trabalhados como diferenças de valores emparelhados (d) Christopher Souza: Teste de hipóteses 28 Estatística de teste: Estimativa de intervalo de confiança

29 Inferências sobre duas variações Requisitos: Amostras aleatórias simples. Populações independentes Distribuição normal std 1 >std 2 Christopher Souza: Teste de hipóteses 29 Estatística de teste:

30 Inferências sobre duas variações Método Conte Cinco Não requer distribuição normal Tamanhos amostrais iguais Se uma das amostras têm pelo menos cinco dos maiores desvios médios absolutos, sua população tem uma maior variância Christopher Souza: Teste de hipóteses 30 Teste de Levene-Brown- Forsythe Transforma-se cada conjunto de dados por meio da subtração de cada dado por sua mediana Em seguida, aplica-se o teste t para duas populações

31 Testes não-paramétricos VantagensDesvantagens Não exigem que a distribuição seja normal São aplicáveis a dados categóricos (qualitativos) Cálculos mais simples Desperdiçam informação por tratarem dados de forma qualitativa Menor eficiência dos testes 31 Christopher Souza: Teste de hipóteses

32 Eficiência Teste não-paramétrico, população normal AplicaçãoParamétricoNão- paramétrico Eficiência Pares combinadost ou zSinais0,63 Postos com sinais de Wilcoxon 0,95 Duas amostras independentes t ou zSoma de postos de Wilcoxon 0,95 Várias amostras independentes FKruskal-Wallis0,95 CorrelaçãoCorrelação linearCorrelação de postos 0,91 Aleatoriedade-Seqüências- Christopher Souza: Teste de hipóteses 32

33 Postos Número atribuído a um item da amostra de acordo com sua posição na lista ordenada. Em caso de empates, aplica-se a média dos postos como valor de posto de cada item com igual valor Ex: x: [ ] xo: [ ] io: [ ,5 7,5] i: [7, ,5] Christopher Souza: Teste de hipóteses 33

34 Testes não-paramétricos Sinais Proporção = 50% Igualdade de medianas (pareado) Mediana de uma população Soma de Postos de Wilcoxon (igualdade de medianas) Pareado Homogeneidade – Mann- Whitney Kruskal-Wallis – igualdade de medianas de três ou mais populações Sequências - Inflexões (Aleatoriedade) Wald-Wolfowitz (Independência) Correlação de Spearman Significância da correlação Estacionariedade da série Pettitt (Quebra de tendência) Grubbs e Beck (Outlier) Christopher Souza: Teste de hipóteses 34

35 Teste dos sinais Dados nominais (Proporção = 50%) Requisitos Amostra aleatória Fundamento: teste de freqüência de sinais x = número de vezes que ocorreu sinal menos freqüente n = número de sinais positivos e negativos combinados Cuidado: Se dados contradizem H1 nem aplica teste, pois deixa- se de fazer sentido o teste Christopher Souza: Teste de hipóteses 35 Estatística de teste: p/ n 25: x p/ n > 25: Valor crítico: p/ n 25, buscar x na tabela A- 7 do Triola p/ n>25, buscar z na tabela A- 2 do Triola

36 Teste dos sinais Pares combinados (igualdade de medianas) Procedimento: Subtrair cada valor da segunda variável pelo correspondente na primeira Posições de diferenças nulas são excluídas Série constituída apenas por sinais de diferenças Fundamento: Se medianas são iguais, número de sinais positivos e negativos são iguais Christopher Souza: Teste de hipóteses 36 Estatística de teste: p/ n 25: x p/ n > 25: Valor crítico: p/ n 25, buscar x na tabela A- 7 do Triola p/ n>25, buscar z na tabela A- 2 do Triola

37 Teste dos sinais Mediana de uma população Procedimento: Subtrair cada valor da amostra do valor da mediana sugerida em H 0 Posições de diferenças nulas são excluídas Série constituída apenas por sinais de diferenças Christopher Souza: Teste de hipóteses 37 Estatística de teste: p/ n 25: x p/ n > 25: Valor crítico: p/ n 25, buscar x na tabela A- 7 do Triola p/ n>25, buscar z na tabela A- 2 do Triola

38 Soma de postos de Wilcoxon Diferença de amostras emparelhadas Requisito: Diferenças tem distribuição aproximadamente simétrica. a=soma de valores absolutos dos postos negativos das diferenças d não-nulas (51) b=soma dos postos positivos das diferenças d não-nulas (15) T=min(a,b) Estatística de teste: p/ n 30: T (tab. A-8 para T ) p/ n>30: Reg.Sec.dPostosSinais Christopher Souza: Teste de hipóteses 38

39 Soma de postos de Wilcoxon Duas amostras independentes Requisito: n>10 para cada amostra Trabalha também dados ordinais Equivale a Mann-Whitney R=soma dos postos de uma das amostras Estatística de teste: Onde: Christopher Souza: Teste de hipóteses 39 HomensMulheres PostoIMC Posto 11,523,819,62,5 923,223,811,5 1424,619,62,5 1726,229, ,525,215,5 1324,521,45 621,522, ,427, ,433, ,720, ,829, ,117,71 15,525,2 R 1 =187n 1 =13R 1 =138n 1 =12

40 Kruskal-Wallis Igualdade de medianas de três ou mais populações Requisito: n>5 para cada amostra H ~ ² k-1 Equivale a ANOVA H grande para amostras muito diferentes (teste unilateral à direita) R=soma dos postos de uma das amostras Estatística de teste: Onde: Christopher Souza: Teste de hipóteses 40 Para corrigir H em função do número de empates, divida H por Onde (m = número de empates para cada valor): Valor crítico estimado via ² k-1

41 Sequências Aleatoriedade Sequência: sucessão de dados com mesma característica Ex.: valores se acima ou abaixo da mediana Trabalha também dados ordinais G=número de sequências na amostra Aleatoriedade definida se 0<

42 Wald-Wolfowitz Independência Séries aleatórias podem não ser independentes Influência de contribuições subterrâneas às vazões de rio resulta em maior dependência para intervalos menores de discretização Para tanto, calcula-se: Christopher Souza: Teste de hipóteses 42 Estatística de teste: onde

43 Significância de correlação de postos de Spearman H 0 : s =0 H 1 : s 0 Estatística de teste: Se não houver empate para um mesmo conjunto de dados: Se houver empate: Valores críticos: Se n 30, use tabela A-9 do Triola Senão, Christopher Souza: Teste de hipóteses 43

44 Estacionariedade Teste de correlação de Spearman entre postos de dados e suas respectivas posições na série Christopher Souza: Teste de hipóteses 44

45 Teste de Grubbs e Beck Identificação de outliers Limites para consideração de outliers são estimados por: Limite superior Limite inferior onde Christopher Souza: Teste de hipóteses 45


Carregar ppt "Teste de hipóteses Aula 06 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs."

Apresentações semelhantes


Anúncios Google