INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Qui-quadrado características gerais
Aprendizado de Máquina
Estimação de parâmetros
Introdução ao processamento de dados e à estatística - parte 02
CAPÍTULO 7 TESTE DE HIPÓTESE
PESQUISA DE MARKETING 1 Metodologia Planejamento Prof. Dr. Fauze Najib Mattar.
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Estatística Descritiva Aula 02
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 9 - Estimação de Parâmetros por Intervalo
Estatística 8 - Distribuições Amostrais
Eduardo S. Ponce Maranhão
Capítulo 6 Estimativas e Tamanho de Amostras
Capítulo 8 Inferências com Base em Duas Amostras
MB751 – Modelos de previsão
Qui-quadrado de Associação (entre duas variáveis)
APLICAÇÕES COM EXCEL: Distribuição Binomial
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Estatística Aplicada (Aula 4)
Distribuição de probabilidade
Distribuição de probabilidade
Estatística Descritiva
ESTATÍSTICA.
Avaliação de Testes Diagnósticos
J. Landeira-Fernandez Ética e Ciência
ESTATÍSTICA.
ESTATÍSTICA.
ME623 Planejamento e Pesquisa
Aula 0. Doces Lembranças de MAE0219
Aproximação da binomial pela normal
Estatística Descritiva (I)
ME623 Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Medidas de posição  Estudando as distribuições de  frequência,  percebe-se que existe uma  posição de  concentração dos valores, que podem estar mais concentrados no início, no meio ou no 
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Distribuição T - Student
Comparação de Sistemas Usando Dados de Amostras
Modelagem Estatística
O que é Estatística, afinal de contas?
Amostragem Pontos mais importantes:
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
Site: Estatística Prof. Edson Nemer Site:
Distribuição da Proporção Amostral
Estatística Aula 9 – 28/02/2011.
Site: Estatística Prof. Edson Nemer Site:
Inferência Estatística
Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais.
Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.
Medidas de Dispersão Aula 8.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
Noções de Inferência Estatística
Professor Antonio Carlos Coelho
Distribuição da Amostra
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Medidas de posição e de dispersão
INTERVALOS DE CONFIANÇA
- Testes Qui-quadrado - Aderência e Independência
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Critérios de Escolha dos Métodos Estatísticos
Transcrição da apresentação:

INTERVALOS DE CONFIANÇA E ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS Biotecnologia – UFPel 2011

Amostra Quero conhecer um atributo de uma população (alvo) Escolho um grupo para estudar (população em estudo) Deste grupo, tiro uma amostra Porque todo este trabalho???

Amostra Representar a população Precisão VARIABILIDADE equiprobabilidade Precisão influi no cálculo do tamanho da amostra VARIABILIDADE cada amostra dá um resultado!

Distribuição das médias amostrais Se cada amostra dá 1 resultado diferente… Repetir o processo de amostragem e estudar a distribuição dos resultados! Como será que esta distribuição se compara com a distribuição dos dados originais???? Teorema do Limite Central distribuição das médias amostrais tende à distribuição normal quando o N tende ao infinito, independente da distribuição original dos dados

Distribuição das médias amostrais A média é a mesma A variância é menor depende do tamanho da amostra!

Intervalo de confiança Intervalo que contém o parâmetro de interesse () com alto grau de certeza Intervalo de confiança de 95%: IC95%: média – 1,96 x e.p., média + 1,96 x e.p. baseado na distribuição normal

Intervalo de confiança de 95% 3100 3200 3300 95% das amostras

Exemplos PNASC Total Sum Mean Variance Std Dev Std Err 449 1420145 3162.906 245887.125 495.870 23.402 Minimum 25%ile Median 75%ile Maximum Mode 900.000 2900.000 3210.000 3475.000 4640.000 3280.000 Student's "t", testing whether mean differs from zero. T statistic = 135.158, df = 448 p-value = 0.00000 Calcular: IC 95% = 3162,9 – 1.96 x 23,4 -- 3162,9 + 1.96 x 23,4 IC 95% = 3117.036 -- 3208.764

Exemplos (Stata) . ci pnasc compr aigdubo banho gesta nprenat Variable | Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- pnasc | 449 3162.906 23.40156 3116.916 3208.897 compr | 445 48.46944 .1187009 48.23615 48.70272 aigdubo | 447 38.2081 .0722459 38.06611 38.35008 banho | 450 1.155556 .0301043 1.096393 1.214718 gesta | 450 2.324444 .0732 2.180587 2.468301 nprenat | 414 8.623188 .16236 8.304033 8.942343

Tabela 2 x 2 Associação entre 2 variáveis categóricas Comparar a ocorrência de uma variável binária (desfecho) entre as categorias de outra variável binária (exposição) Na tabela vai haver apenas 2 linhas e 2 colunas com dados As linhas e colunas correspondem às categorias de cada variável

Tabela 2 x 2 Por convenção as linhas correspondem a exposição e as colunas ao desfecho (Kirkwood) Mas nem todos os autores fazem desta forma... O importante é que os % demonstrados sejam da variável de exposição

Tabela 2×2 padrão

Exemplo de Tabela 2×2 Desfecho = chiado no peito (s/n)  linha Exposição = mama no peito aos 12 meses (s/n)  coluna

Teste do qui-quadrado Permite examinar se existe associação entre a variável da linha e a da coluna Em outras palavras....verifica se a distribuição dos indivíduos entre as categorias de uma variável é independente da sua distribuição entre as categorias da outra variável

Exemplo: qui-quadrado em tabela 2x2 Estudo realizado durante uma epidemia de influenza INFLUENZA TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460

Perguntas: Quantos indivíduos contraíram influenza? TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460 Quantos indivíduos contraíram influenza? Quantos indivíduos foram vacinados? R: 100 R: 240

Perguntas: INFLUENZA TOTAL SIM NÃO VACINA 20 (8,3%) 220 (91,7%) 240 PLACEBO 80 (36,4%) 140 (63,6%) 220 100 (21,7%) 360 (78,3%) 460 Que percentagem de indivíduos contraíram influenza dentre os vacinados? Que percentagem de indivíduos contraíram influenza dentre os que receberam placebo? R: 20/240 * 100 = 8,3% R: 280/220 * 100= 36,4%

Perguntas: O fato de vacinar, afeta a probabilidade dos indivíduos de contrair influenza? Aparentemente sim, mas é preciso testar estatisticamente para ver a probabilidade de as diferenças encontradas terem ocorrido ao acaso

Testar uma associação Teste de qui-quadrado (2) compara os valores observados em cada uma das 4 categorias da tabela 2 x 2 com os valores esperados se não existisse nenhuma diferença entre receber vacina ou placebo

Teste do qui-quadrado O valor esperado para a é:

Teste de qui-quadrado Globalmente 100/460 (0,22) contraíram influenza Se a vacina e placebo são igualmente efetivos, esperaríamos essa mesma proporção entre vacinados = 0,21739... * 240=52,2 placebo = 0,21739...... * 220=47,8

Teste qui-quadrado Valores esperados INFLUENZA TOTAL SIM NÃO VACINA 52,2 187,8 240 PLACEBO 47,8 172,2 220 100 360 460

Obtenção do valor do qui-quadrado (observados – esperados )² / esperados ...Isso para cada uma das 4 caselas da tabela de contingência Quanto maior a diferença entre valores observados e esperados, maior o valor de 2

Aplicando o teste do ²  Para o teste ser válido: Valor esperado (E)  5 em todas as caselas  Fórmula para cálculo na mão:

Aplicando o teste do ²  Fórmula para cálculo na mão:

Aplicando o teste do ² Valor encontrado do ² = 53,09 Procurar a correspondência com valor-p na tabela de distribuição ² Para isso é necessário conhecer o nº de graus de liberdade (Linhas – 1)x (Colunas – 1) Tabela 2x2: (2-1)x(2-1) = 1 grau de liberdade

Observando a tabela do ² O valor calculado (53,09) é maior que o maior valor da primeira linha da tabela correspondente a 1G.L. (10,83) 10,83 é o ponto de probabilidade = 0,1% na distribuição ² com 1 G.L., logo, o valor-p para o teste é < 0,001

Conclusão do teste do ² Em nosso exemplo  valor-p < 0,001 Existe uma probabilidade muito pequena de que a diferença entre os % de influenza encontrados no grupo de vacinados e no grupo de placebo possa ter sido obtida ao acaso (< 0,1%)

Correção de continuidade  Teste ² pode ser melhorado usando a correção de continuidade de Yates:  Esta quantidade tem distribuição ² com 1 grau de liberdade  Neste caso o valor de 53,09 ficaria em 51,46

Correção de continuidade Correção de continuidade de Yates é útil se o tamanho amostral é <40 ou os números esperados são pequenos Se os números esperados são muito pequenos ou se o total geral da tabela <20  Teste exato O ² é válido quando N total > 40, independente dos valores esperados N total entre 20 e 40, sendo todos os valores esperados > 4

Teste exato de Fisher Se a aproximação pela ² não é boa Teste exato Usado quando os valores esperados são muito pequenos N total da tabela < 20, ou N total entre 20 e 40 e o menor dos 4 valores esperados é <5

Testes na prática Hoje o cálculo do teste exato é muito rápido, exceto para tabelas r x c onde r ou c >2 Conclusão: Aplicar sempre o teste exato na análise de tabelas 2 x 2

Teste do ² ou exato de Fisher? Pearson chi2(1) = 4,02 P = 0,0435 Fisher's exact P = 0,0964 Mortos Vivem Total ATB novo 10 ATB habitual 4 8 12 18 22

Teste do ² ou exato de Fisher? Pearson chi2(1) = 5,3 P = 0,021 Fisher's exact P = 0,024 Mortos Vivem Total ATB novo 650 350 1000 ATB habitual 600 400 1250 750 2000

Será que a proporção de BPN é Outro exemplo: BPN Será que a proporção de BPN é a mesma nos dois sexos? p1 = 50/500=0,10=10% p2 = 40/500 = 0,08=8%

Outro exemplo: BPN  Hipóteses  Ho: a proporção de BPN é a mesma nos dois sexos (hipótese de independência ou não associação)  H1: a proporção de BPN não é a mesma nos dois sexos (hipótese de dependência ou associação)

Outro exemplo: BPN Comparar as freqüências observadas com as freqüências esperadas (E) sob a hipótese de nulidade Ho

Outro exemplo: BPN Será que as diferenças são suficientemente grandes para que se possa rejeitar a hipótese Ho? Calcular ² a partir da amostra: ² = 0,989  valor-p = 32% (> 5%) Não rejeitar H0  não existe associação entre sexo e BPN

Exemplo: tabela de resultados

Tabelas 2×k  Consideramos um desfecho dicotômico  Se as k categorias não são ordenadas  testa-se associação usando ² geral

Exemplo Pearson ²(6) = 18,7; p = 0,005

Exemplo

Tabelas 2×k: categorias ordenadas  Além de avaliar associação  Avaliar se há uma tendência  prevalências aumentam ou diminuem  ² com k-1 gl é dividido  parte devido à tendência (1 gl)  resto  Método de análise “muito mais poderoso”

Tendência linear z = 2,36; p = 0,02 Exemplo Pearson ²(3) = 6,24; p = 0,10 Tendência linear z = 2,36; p = 0,02

Idade x uso de medicamentos P < 0,001 para ambos os sexos (teste para tendência linear)

Dúvidas?