Testes de Hipótese Dr Hermano Alexandre Doutorando em Saúde Coletiva Mestre em Saúde Pública Especialista em auditoria de sistemas de saúde Faculdade de Medicina Universidade Federal do Ceará
Tópicos essenciais da aula Significância estatística Intervalos de confiança Inferência estatística
Tópicos Testes de hipótese Teste t de student Teste F Teste chi quadrado Intervalos de confiança Inferência estatística
Teste de hipótese Visa testar qual a probabilidade de que um determinado resultado encontrado em uma determinada amostra seja somente devido ao acaso.
O que é hipótese? Em inglês, hypothesis Em alemão, Hypothese Em latim, hypothesis ... Vem de: base(hipo) de uma proposição(thesis).
O que é hipótese? População 100 Obesos Amostra 100 Não obesos
O que é hipótese? Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos
Por que testar a hipótese O acaso (erro tipo I)
Hipóteses de um Teste Ho - Hipótese Nula H1 - Hipótese Alternativa
Hipóteses de um Teste Ho - Hipótese Nula - hipótese que será suposta inicialmente como verdadeira. É, basicamente, a negação do que o pesquisador deseja provar.
Hipóteses de um Teste H1 - Hipótese Alternativa - hipótese que será aceita, se os dados mostrarem evidências suficientes para a rejeição da hipótese nula. Geralmente, é a própria hipótese da pesquisa.
Exemplo Ho: Em média, as vendas não aumentam com a introdução da propaganda. H1: Em média, as vendas aumentam com a introdução da propaganda. Ho: Em média, o IAM não diminui com uso de aspirina. H1: Em média, o IAM diminui com o uso de aspirina.
Exemplo Suspeita-se que uma moeda, utilizada em jogo de azar, seja viciada, isto é, que a probabilidade de sair “cara” seja diferente de 50%.
Hipóteses Ho: p = 0,5 (a probabilidade é 50%) H1: p = 0,5 (a probabilidade não é 50%) p - probabilidade de cara.
Amostra Para se tomar a decisão de se aceitar, ou não, que a moeda seja honesta, tomou-se uma amostra com 10 lançamentos e observou-se o número de caras. (variável X - estatística do teste).
Valor Esperado Qual é o valor esperado para o número de caras (variável X - estatística do teste) se a probabilidade for realmente 50%? 5 caras
Resultado da amostra Valor esperado se a probabilidade for realmente 50%: 5 caras. Situação 1: Valor obtido: X = 10 caras. Qual seria a conclusão? Situação 2: Valor obtido: X = 7 caras. Qual seria a conclusão?
Desvio Observado Desvio Valor esperado se Ho for verdadeira Valor observado na amostra ocorreu por acaso? (Ho verdadeira) Desvio ocorreu porque Ho é falsa ?
Tipos de testes estatísticos Cada um para uma finalidade específica Tipo de variável Distribuição da variável Paramétricos Não paramétricos Quantidade de amostras Amostras relacionadas ou não
Tipos de variáveis Numéricas? T de student Teste F ANOVA Mann Whitney Categóricas? Chi quadrado Análise de verossimilhança Kendall`s Tau B
Distribuição de variáveis Paramétricas Teste T Anova Não paramétricas Mann Whitney Chi quadrado *Kolmogorov Smirnov
Quantidade de amostras Duas? Mann Whitney Teste T Chi quadrado K? Kruskall Wallis ANOVA
Relação entre amostras Com controle? McNemar Wilcoxon Sem controle? Teste T Chi quadrado
Como funciona um teste? Fórmula matemática Valor lançado em uma curva
Como funciona um teste? Valor de p
Teste T Utilizado para comparar duas médias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos T(Médias)
F(Variâncias) Teste F (ANOVA) Utilizado para comparar duas variâncias, variáveis paramétricas ou não, não relacionadas, K amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos F(Variâncias)
Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Vários tipo de chi quadrado Ideia -> Obesos Não Obesos Pré diabéticos 37(50) 13(50) Não Pré diabéticos 63(50) 87(50)
X2(Categorias) Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos X2(Categorias)
Intervalo de confiança As medidas de tendência central apresentam valores que podem assumir até um certo limite com uma certa confiança O limite mais utilizado é o de 95% Médias 122 (IC 95% 110 – 134) Médias 98 (IC 95% 86 – 110)
Inferência estatística Generalizar uma proposição retirada de uma amostra para uma população. Critérios de causalidade; Viéses.
Inferência estatística População Conjectura (hipótese) sobre o comportamento de variáveis Amostra Resultados reais obtidos Decisão sobre a admissibilidade da hipótese
Probabilidade de Significância (ps) – Valor de p Probabilidade da estatística do teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra observada. Pode ser compreendida como a probabili-dade do desvio observado ter ocorrido por acaso se a hipótese nula for verdadeira.
Desvio Observado Valor esperado se Ho for verdadeira Valor observado na amostra ocorreu por acaso? (Ho verdadeira) Desvio ocorreu porque Ho é falsa ?
Situação 1 A amostra apresentou 10 caras. Se p = 0,5, a probabilidade da amostra apresentar X = 10 (ou X=0) caras é:
Situação 1 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.01 0.01 0.001 0.001 X 1 2 3 4 5 6 7 8 9 10 ps = 0,002 ou 0,2%
Conclusão... ps = 0,2% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Rejeita-se Ho, ou seja, não se admite que o desvio tenha ocorrido por acaso.
Situação 2 A amostra apresentou 7 caras. Se p = 0,5, a probabilidade da amostra apresentar X = 7 ou mais (ou X=3 ou menos) caras é:
Situação 2 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.01 0.001 0.006 0.001 X 1 2 3 4 5 6 7 8 9 10 ps = 0,344 ou 34,4%
Conclusão... ps = 34,4% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Aceita-se Ho,ou seja, não se pode afirmar que o desvio não tenha ocorrido por acaso.
Decisão Se a probabilidade do desvio ter ocorrido por acaso for considerável (ps alta), não há evidências para se rejeitar Ho. Aceita-se Ho. Quando a probabilidade do desvio ter ocorrido por acaso for considerada pequena (ps baixa), há evidências para a rejeição de Ho. Rejeita-se Ho.
VALOR DE P O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste. Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira. Os valores mais comuns para o nível de significância são 5%, 10% e 1%.
Critérios de causalidade Força de associação (maior proporção de imc elevado e pré-diabetes) Consistência ( Se repetido o estudo, encontra-se o mesmo resultado) Especificidade (todos os imc elevados teriam pré-diabetes) Temporalidade (primeiro vem o imc alto, depois a pré-diabetes)
Critérios de causalidade Gradiente biológico (Maior imc, maior glicemia de jejum) Plausibilidade (Faz sentido relacionar imc e pré-diabetes?) Coerência (Existe teoria que contradiz?) Evidência experimental (Se engordarmos uma pessoa ela adquire pré-diabetes?)
Viéses Decorre do fato de não se utilizar a população inteira Viés de seleção Viés de estimativa Viés de financiamento
Obrigado! Dúvidas ou sugestões? hermanoalexandre@gmail.com