Análise de Associação: Tabelas de contingência Curso de Especialização em Pesquisa Clínica - FCMSCSP MÓDULO 3 – EPIDEMIOLOGIA E BIOESTATÍSTICA Profa. Ting Hui Ching - 2009
As etapas de uma pesquisa científica x Estatística Definir 6w Why (Por que): objetivo Who (Quem): público alvo What (O que): desfecho When (quando): tempo Where (onde): local How (como): forma de coleta de dados Planejamento Coleta de dados Banco de dados Execução Como analisar os dados Qual n para garantir a confiabilidade Como selecionar a amostra Análise Descritiva Inferência Análise Estatística Relatório Protocolo Discussão Conclusão
Relatório e as etapas da pesquisa científica Introdução Planejamento Material e Método Execução Resultados Análise Discussão Conclusão Conclusão
Estatística Descritiva Visão Global Estatística Descritiva (“Fotografia”) Consistência dos dados Caracterização da amostra Interpretações iniciais População Planejamento Como selecionar amostra? Qual o tamanho da amostra? Amostra Inferência Estatística (“Adivinhar”) Estimação de quantidades desconhecidas Testes de hipóteses Extrapolação dos resultados (modelagem)
Dados Teorias Estatísticas Análise Descritiva Modelos Probabilísticos Fazer afirmação sobre característica de uma população, baseando-se em resultados de uma amostra Inferência Estatística
Exemplos de testes de hipóteses Tratamento novo é melhor que o tratamento tradicional? Dieta para ganho de peso funciona? Existe associação entre fumo e câncer de pulmão? H0: m novo= m tradiconal Ha: m novo ≠ m tradiconal H0: Peso antes= Peso depois Ha: Peso antes ≠ Peso depois H0: Não existe associação entre fumo e câncer de pulmão Ha: Existe associação entre fumo e câncer de pulmão
As decisões Situação (população) H0 Ha Decisão Correta Erro H0 Decisão Tipo II () Decisão (amostra) (poder do teste=1-β) Erro Decisão Correta Ha Tipo I () Pela amostra, encontramos “p”, onde p=p-valor=nível descritivo=probabilidade de acontecer H0
Consumo de Cafeína (mg/dia) Ex: Consumo de cafeína e estado civil das pacientes em acompanhamento pré-natal Consumo de Cafeína (mg/dia) Estado Civil 1-150 151-300 >300 Total Casada 652 1537 598 242 2029 Divorciada/Separada 36 46 38 21 141 Solteira 218 327 106 67 718 906 1910 742 330 3888 Fonte: Martin and Bracken, 1987 O consumo de cafeína é diferente entre os diferentes estados civis?
Consumo de Cafeína (mg/dia) Ex: Consumo de cafeína e estado civil das pacientes em acompanhamento pré-natal Consumo de Cafeína (mg/dia) Estado Civil 1-150 151-300 >300 Total Casada 22% 51% 20% 8% 3029(100%) Divorciada/Separada 26% 33% 27% 15% 141(100%) Solteira 30% 46% 9% 718(100%) 23% 49% 19% 3888(100%) Fonte: Martin and Bracken, 1987 O consumo de cafeína é diferente entre os diferentes estados civis?
Tabela de Frequência - Sexo Distribuição de pacientes por sexo obtidos de um estudo clínico* *Dados hipotéticos
Tabela de Frequência - Hipertensão Distribuição de pacientes portadores de hipertensão obtidos de um estudo clínico* *Dados hipotéticos
Estudar a associação entre Sexo e Hipertensão – Tabela de contingência Variável desfecho: Doença Exposição: Fator de risco Existe associação entre Sexo e Hipertensão ?
Estudo de Associação PREVISÃO Duas variáveis qualitativas: Tabela de contingência Duas variáveis quantitativas: Correlação
Tabela de contingência – % Geral Frequentemente utilizada em Estudo transversal
Tabela de contingência – % em Doença (Coluna) Distribuição por sexo nas duas sub-populações são iguais? (Frequentemente utilizada em Estudo de Caso-controle)
Tabela de contingência – % em Fator (Linha) Risco de Pop Feminina > Risco de Pop Masculina? Diferença de % significante?
Dimensão de Tabela de Contingência – exemplo 1 2 linhas 2 colunas Tabela 2 x 2
Dimensão de Tabela de Contingência – exemplo 2 Estudar a associação entre Hábito de Fumar (Fumo) e Hipertensão (HAS) Exposição: Fator de risco Tabela de contingência 3 linhas 2 colunas Tabela 3 x 2
Teste de Hipóteses Pergunta: Ser homem ou mulher terá chance diferente de ter hipertensão? Pergunta: Existe associação entre Sexo e Hipertensão? Hipótese nula(H0): Sexo e HAS são independentes (Não existe associação ) Hipótese alternativa(Ha): Sexo e HAS não são independentes (Existe associação)
As decisões Situação (população) H0 é verdadeira (não existe associação) H0 é falso (existe associação) Decisão Correta Erro H0 é verdadeira Tipo II () Decisão (amostra) (poder do teste=1-β) Decisão Correta H0 é falso Erro Tipo I ()
Como verificar a hipótese da existência de associação entre Fator em estudo e Doença? Observado Esperado E11 E12 E21 E22 Comparação entre Valor Observado e Valor esperado
Como verificar a hipótese da existência de associação entre Fator em estudo e Doença? Observado Observado (a) (b) (d) (c) Esperado (a+c) 50 x 33 (a+b) = E(a)=27,8% * 33 = E(b)=72,2% * 33 E(c )=27,8% * 147 E(d)=72,2%*147 n 180
Teste de Qui-Quadrado ( ) Observado – Esperado 2 Esperado 2obs= (Oij – Eij)2 Eij
Critério de Decisão 2obs 2obs 2obs 2crítico Ha H0 Não rejeito H0 Observado – Esperado ( ) 2 Esperado 2obs 2obs 2obs 2crítico Ha H0 Não rejeito H0 Rejeito H0 Se observado = esperado 2obs pórximo de 0 H0 verdadeiro Se observado <> esperado 2obs longe de 0 Ha verdadeiro
Como selecionar valor crítico (2crítico)? H0 Ha D0 Da Decisão Correta Erro II Erro I () Distribuição de Qui-Quadrado 2crítico p-valor: nível descritivo : Nível de significância H0 2crítico = 2 (Grau de liberdade; ) Grau de liberdade = (#linha-1) (#coluna-1) = Nível de significância
Exemplo Freqüência Observada Freqüência Esperada (a) (b) (d) (c) (a+c)(a+b) n a = (a+c)(c+d) c = (b+d)(c+d) d = = (50)(33) 180 = 9 (b+d)(a+b) b = (130)(33) = 24 (50)(147) = 41 (130)(147) = 106
Teste de Qui-Quadrado 2obs = 22.6 Casela 11 12 21 22 Observado (O) Esperado (E) O-E (O-E)2 (O-E)2/E a = 20 9 b = 13 24 c = 30 41 d = 117 106 Total = 180 180 11 -11 121 13.5 5.0 3.0 1.1 22.6 2obs = 22.6
Resultados Tomar decisão por Valor crítico: Pela tabela, 2crítico = 2 (g.l.; ) = 2 (1;5%) = 3,841 Como 2obs > 2crítico então rejeitamos H0 2obs = 22.6 Grau de liberdade=(2-1)x (2-1)=1 Tomar decisão por nível descritivo (p): 2obs = 22.6 Grau de liberdade=1 P=1,99485E-06 Como p < 0,05 então rejeitamos H0 Conclusão: Sexo e HAS não são independentes Existe associação entre Sexo e HAS
Vamos praticar? Exercícios
Comentários Frequencia esperada: 80% das caselas com FE>5, 100% com FE>1 Freqüência Observada Freqüência Esperada Teste Exato de Fisher
Comentários Existência de associação entre as variáveis não implica relação causal entre elas. No caso de tabelas com dimensão r x c, se tiver associação significante, pode ser feita comparação 2 a 2. Valor de c2 (ou p-valor) não indica a força da associação e sim a evidência sobre H0
Uso de EPIINFO Demonstração através de exemplos Ex 1: Sexo x HAS Ex 2: Fumo x HAS
Casos particulares Presença de variável ordinal em uma das categorias: C2 de tendência Dados pareados: Teste de McNemar
Uso de computador x Estatística Boa notícia: Todo mundo pode fazer análise estatística!!! Facilidade Rapidez Segurança Problema: Todo mundo pode fazer análise estatística!? Utilização de técnicas inadequadas Interpretação errada dos resultados Solução: Compreensão dos conceitos básicos da estatística, bem como as suposições necessárias para o seu uso de forma criteriosa
Relação Pesquisador x Estatístico Interdependência Trabalho de equipe Dependência Independência Utilize como consultório e não Pronto-socorro Diálogo contínuo com estatístico em todas etapas da pesquisa Dê feedback aos estatísticos Papel de professor
Lembrete A literatura médica: Check-list para ler e escrever um artigo na área médica
Referências Estatística Básica. Morettin, P. A. e Bussab, W. O. Editora Atual Noções de Probabilidade e Estatística. Magalhães, M.N. e Lima, A.C.P. EDUSP Practical Statistics for Medical Research. Altman, D.G. Chapman and Hall