INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011
Amostra Quero conhecer um atributo de uma população (alvo) Escolho um grupo para estudar (população em estudo) Deste grupo, tiro uma amostra Porque todo este trabalho???
Amostra Representar a população Precisão VARIABILIDADE equiprobabilidade Precisão influi no cálculo do tamanho da amostra VARIABILIDADE cada amostra dá um resultado!
Distribuição das médias amostrais Se cada amostra dá 1 resultado diferente… Repetir o processo de amostragem e estudar a distribuição dos resultados! Como será que esta distribuição se compara com a distribuição dos dados originais???? Teorema do Limite Central distribuição das médias amostrais tende à distribuição normal quando o N tende ao infinito, independente da distribuição original dos dados
Distribuição das médias amostrais A média é a mesma A variância é menor depende do tamanho da amostra!
Intervalo de confiança Intervalo que contém o parâmetro de interesse () com alto grau de certeza Intervalo de confiança de 95%: IC95%: média – 1,96 x e.p., média + 1,96 x e.p. baseado na distribuição normal
Intervalo de confiança de 95% 3100 3200 3300 95% das amostras
Exemplos PNASC Total Sum Mean Variance Std Dev Std Err 449 1420145 3162.906 245887.125 495.870 23.402 Minimum 25%ile Median 75%ile Maximum Mode 900.000 2900.000 3210.000 3475.000 4640.000 3280.000 Student's "t", testing whether mean differs from zero. T statistic = 135.158, df = 448 p-value = 0.00000 Calcular: IC 95% = 3162,9 – 1.96 x 23,4 -- 3162,9 + 1.96 x 23,4 IC 95% = 3117.036 -- 3208.764
Exemplos (Stata) . ci pnasc compr aigdubo banho gesta nprenat Variable | Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- pnasc | 449 3162.906 23.40156 3116.916 3208.897 compr | 445 48.46944 .1187009 48.23615 48.70272 aigdubo | 447 38.2081 .0722459 38.06611 38.35008 banho | 450 1.155556 .0301043 1.096393 1.214718 gesta | 450 2.324444 .0732 2.180587 2.468301 nprenat | 414 8.623188 .16236 8.304033 8.942343
Tabela 2 x 2 Associação entre 2 variáveis categóricas Comparar a ocorrência de uma variável binária (desfecho) entre as categorias de outra variável binária (exposição) Na tabela vai haver apenas 2 linhas e 2 colunas com dados As linhas e colunas correspondem às categorias de cada variável
Tabela 2 x 2 Por convenção as linhas correspondem a exposição e as colunas ao desfecho (Kirkwood) Mas nem todos os autores fazem desta forma... O importante é que os % demonstrados sejam da variável de exposição
Tabela 2×2 padrão
Exemplo de Tabela 2×2 Desfecho = chiado no peito (s/n) linha Exposição = mama no peito aos 12 meses (s/n) coluna
Teste do qui-quadrado Permite examinar se existe associação entre a variável da linha e a da coluna Em outras palavras....verifica se a distribuição dos indivíduos entre as categorias de uma variável é independente da sua distribuição entre as categorias da outra variável
Exemplo: qui-quadrado em tabela 2x2 Estudo realizado durante uma epidemia de influenza INFLUENZA TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460
Perguntas: Quantos indivíduos contraíram influenza? TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460 Quantos indivíduos contraíram influenza? Quantos indivíduos foram vacinados? R: 100 R: 240
Perguntas: INFLUENZA TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460 Que percentagem de indivíduos contraíram influenza dentre os vacinados? Que percentagem de indivíduos contraíram influenza dentre os que receberam placebo? R: 20/240 * 100 = 8,3% R: 280/220 * 100= 36,4%
Perguntas: O fato de vacinar, afeta a probabilidade dos indivíduos de contrair influenza? Aparentemente sim, mas é preciso testar estatisticamente para ver a probabilidade de as diferenças encontradas terem ocorrido ao acaso
Testar uma associação Teste de qui-quadrado (2) compara os valores observados em cada uma das 4 categorias da tabela 2 x 2 com os valores esperados se não existisse nenhuma diferença entre receber vacina ou placebo
Teste do qui-quadrado O valor esperado para a é:
Teste de qui-quadrado Globalmente 100/460 (0,22) contraíram influenza Se a vacina e placebo são igualmente efetivos, esperaríamos essa mesma proporção entre vacinados = 0,21739... * 240=52,2 placebo = 0,21739...... * 220=47,8
Teste qui-quadrado Valores esperados INFLUENZA TOTAL SIM NÃO VACINA 52,2 187,8 240 PLACEBO 47,8 172,2 220 100 360 460
Obtenção do valor do qui-quadrado (observados – esperados )² / esperados ...Isso para cada uma das 4 caselas da tabela de contingência Quanto maior a diferença entre valores observados e esperados, maior o valor de 2
Aplicando o teste do ² Para o teste ser válido: Valor esperado (E) 5 em todas as caselas Fórmula para cálculo na mão:
Aplicando o teste do ² Fórmula para cálculo na mão:
Aplicando o teste do ² Valor encontrado do ² = 53,09 Procurar a correspondência com valor-p na tabela de distribuição ² Para isso é necessário conhecer o nº de graus de liberdade (Linhas – 1)x (Colunas – 1) Tabela 2x2: (2-1)x(2-1) = 1 grau de liberdade
Observando a tabela do ² O valor calculado (53,09) é maior que o maior valor da primeira linha da tabela correspondente a 1G.L. (10,83) 10,83 é o ponto de probabilidade = 0,1% na distribuição ² com 1 G.L., logo, o valor-p para o teste é < 0,001
Conclusão do teste do ² Em nosso exemplo valor-p < 0,001 Existe uma probabilidade muito pequena de que a diferença entre os % de influenza encontrados no grupo de vacinados e no grupo de placebo possa ter sido obtida ao acaso (< 0,1%)
Correção de continuidade Teste ² pode ser melhorado usando a correção de continuidade de Yates: Esta quantidade tem distribuição ² com 1 grau de liberdade Neste caso o valor de 53,09 ficaria em 51,46
Correção de continuidade Correção de continuidade de Yates é útil se o tamanho amostral é <40 ou os números esperados são pequenos Se os números esperados são muito pequenos ou se o total geral da tabela <20 Teste exato O ² é válido quando N total > 40, independente dos valores esperados N total entre 20 e 40, sendo todos os valores esperados > 4
Teste exato de Fisher Se a aproximação pela ² não é boa Teste exato Usado quando os valores esperados são muito pequenos N total da tabela < 20, ou N total entre 20 e 40 e o menor dos 4 valores esperados é <5
Testes na prática Hoje o cálculo do teste exato é muito rápido, exceto para tabelas r x c onde r ou c >2 Conclusão: Aplicar sempre o teste exato na análise de tabelas 2 x 2
Teste do ² ou exato de Fisher? Pearson chi2(1) = 4,02 P = 0,0435 Fisher's exact P = 0,0964 Mortos Vivem Total ATB novo 10 ATB habitual 4 8 12 18 22
Teste do ² ou exato de Fisher? Pearson chi2(1) = 5,3 P = 0,021 Fisher's exact P = 0,024 Mortos Vivem Total ATB novo 650 350 1000 ATB habitual 600 400 1250 750 2000
Será que a proporção de BPN é Outro exemplo: BPN Será que a proporção de BPN é a mesma nos dois sexos? p1 = 50/500=0,10=10% p2 = 40/500 = 0,08=8%
Outro exemplo: BPN Hipóteses Ho: a proporção de BPN é a mesma nos dois sexos (hipótese de independência ou não associação) H1: a proporção de BPN não é a mesma nos dois sexos (hipótese de dependência ou associação)
Outro exemplo: BPN Comparar as freqüências observadas com as freqüências esperadas (E) sob a hipótese de nulidade Ho
Outro exemplo: BPN Será que as diferenças são suficientemente grandes para que se possa rejeitar a hipótese Ho? Calcular ² a partir da amostra: ² = 0,989 valor-p = 32% (> 5%) Não rejeitar H0 não existe associação entre sexo e BPN
Exemplo: tabela de resultados
Tabelas 2×k Consideramos um desfecho dicotômico Se as k categorias não são ordenadas testa-se associação usando ² geral
Exemplo Pearson ²(6) = 18,7; p = 0,005
Exemplo
Tabelas 2×k: categorias ordenadas Além de avaliar associação Avaliar se há uma tendência prevalências aumentam ou diminuem ² com k-1 gl é dividido parte devido à tendência (1 gl) resto Método de análise “muito mais poderoso”
Tendência linear z = 2,36; p = 0,02 Exemplo Pearson ²(3) = 6,24; p = 0,10 Tendência linear z = 2,36; p = 0,02
Idade x uso de medicamentos P < 0,001 para ambos os sexos (teste para tendência linear)
Dúvidas?