Teste Qui-quadrado Comparando proporções

Slides:



Advertisements
Apresentações semelhantes
Análise Estatística Testes de Hipóteses.
Advertisements

Teste das Mudanças ou das Proporções Pareadas McNemar
Qui-quadrado características gerais
Analise de Regressão Parte 2.
CAPÍTULO 7 TESTE DE HIPÓTESE
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
CAPÍTULO 7 TESTE DE HIPÓTESE
Prof. Marllus Gustavo Ferreira Passos das Neves
Prof. Marllus Gustavo Ferreira Passos das Neves
MB751 – Modelos de previsão
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Avaliação estatística dos mecanismos de codificação desenvolvidos
Erros no Teste de Hipóteses
Testes de Hipóteses Forma mais clássica de inferência estatística
Interfaces da Bioestatística na Pesquisa Clínica
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
J. Landeira-Fernandez Ética e Ciência
Análise de Variância (ANOVA)
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
TESTES DE HIPÓTESES Spencer Barbosa da Silva
Estatística e Probabilidade
Estatística e Probabilidade
ANOVA: Análise de Variância APLICAÇÃO.
Modelagem Estatística
Teste de Hipóteses para a média, caso da pequena amostra
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
Teste de Hipótese.
Análise de Incertezas Introdução.
Aula 11 - Teste de hipóteses, teste de uma proporção
COMPARAÇÃO DE DUAS POPULAÇÕES
Estatística e Probabilidade
Amostras pareadas / Independência com variâncias desconhecidas
Estatística Geral (Elementos de Probabilidade)
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
TESTE DE HIPÓTESES TESTE t STUDENT
Apresenta:.
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Regressão e Previsão Numérica.
análise dos estimadores
Calculando o número de observações (tamanho da amostra) Após a comparação de duas médias duas e somente duas afirmativas podem ser feitas: – 1. Rejeitamos.
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Calculando o número de observações (tamanho da amostra)
Inferência Estatística Básica
M ÉTODOS E STATÍSTICOS PARA E XATIDÃO DE M APEAMENTO E A VALIAÇÃO DE M ODELOS Camilo Daleles Rennó Referata Biodiversidade 8 novembro 2007.
Introdução a planejamento e otimização de experimentos
ANOVA.
Testes de Hipóteses.
Prof. Marllus Gustavo Ferreira Passos das Neves
Análise de Variância (ANOVA)
Análise de Associação: Tabelas de contingência
Teste Exato de Fisher Evelyn Souza Paloma Gerlach Ribas
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
INTERVALOS DE CONFIANÇA
Probabilidade Teste de hipóteses para duas médias:
NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional.
Métodos Estatísticos Aplicados às Ciências Biológicas - 9ª aula -
- Testes Qui-quadrado - Aderência e Independência
Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.
INFERÊNCIA PARA DUAS POPULAÇÕES
Prof. Miguel Angel Uribe Opazo
GESTÃO E GARANTIA DA QUALIDADE
Aderência à Distribuições de Probabilidade
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
UNIDADE : MEDIDADS DE ASSOCIAÇÃO E CORRELAÇÃO
Estudos observacionais de base individual ou analíticos:
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Teste de Hipótese Camilo Daleles Rennó
Transcrição da apresentação:

Teste Qui-quadrado Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

Exemplo Inicial: Igualdade de Proporções A administração de um hospital deseja verificar se luvas de três marcas (A, B e C) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A, 240 luvas da marca B e 300 luvas da marca C foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) e 177 luvas da marca C (40.0%) deixaram passar vírus quando submetidas à tensão. Os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as três marcas possuem a mesma permeabilidade? H0: PA = PB = PC = P Ha: ao menos uma das permeabilidades é diferente das outras

Teste de Igualdade de Proporções (mais de uma população) Tabela de valores observados Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 89 240 B 134 106 C 177 123 300 462 318 780 Tabela de Classificação Cruzada

Deixou passar vírus quando submetida à tensão? Construção do Teste H0: PA = PB = PC = P Ha: ao menos uma das permeabilidades é diferente das outras Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 89 240 B 134 106 C 177 123 300 462 318 780 Estimativa de P, a permeabilidade comum

Construção do Teste Valores esperados sob H0 Se H0 (PA = PB = PC = P) é verdadeira: quantas luvas que deixam passar o vírus deveríamos esperar dentre as luvas da marca A ? E dentre as luvas da marca B ? E da marca C ? Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 .................................... 89............................. 240 B 134..................................... 106............................... C 177..................................... 123............................... 300 462 318 780 (240x462/780=142.15) (240-142.15=97.85) (240x462/780=142.15) (240-142.15=97.85) (300x462/780=177.70) (300-177.70=122.30) Valores esperados sob H0

Deixou passar vírus quando submetida à tensão? Construção do Teste Note que os valores esperados sob H0 são calculados como uma função simples dos totais de linha, coluna e do total geral Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 .................................... 89............................. 240 B 134..................................... 106............................... C 177..................................... 123............................... 300 462 318 780 (240x462/780=142.15) (240x318/780=97.85) (240x462/780=142.15) (240x318/780=97.85) (300x462/780=177.70) (300x318/780=122.30)

Deixou passar vírus quando submetida à tensão? Construção do Teste Tabela de Valores Observados (esperados sob H0 entre parênteses) Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 (142.15) 89 (97.85) 240 B 134 (142.15) 106 (97.85) C 177 (177.70) 123 (122.30) 300 462 318 780 Estatística de Teste = “Observado – Esperado sob H0”

Deixou passar vírus quando submetida à tensão? Construção do Teste Tabela de Valores Observados (esperados sob H0 entre parênteses) Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 (142.15) 89 (97.85) 240 B 134 (142.15) 106 (97.85) C 177 (177.70) 123 (122.30) 300 462 318 780 2

Deixou passar vírus quando submetida à tensão? Construção do Teste Tabela de Valores Observados (esperados sob H0 entre parênteses) Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 (142.15) 89 (97.85) 240 B 134 (142.15) 106 (97.85) C 177 (177.70) 123 (122.30) 300 462 318 780 +

Valores críticos para X2 O valor de X2 é “grande” ou “pequeno” ? Valores de Referência para X2  Distribuição de Probabilidade de X2 Distribuição Qui-quadrado

Graus de Liberdade para o Teste Qui-Quadrado No caso do teste Qui-quadrado, os graus de liberdade da distribuição de referência equivalem ao número de caselas livres na tabela Exemplo: Tabela 2 x 2 Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 89 240 B 134 106 285 195 480 G.L. = (número de linhas -1) x (número de colunas -1)

Voltando ao exemplo inicial …. Tabela 3 x 2  G.l. = (3-1) x (2-1) = 2 x 1 = 2 O valor da estatística X2 deve ser comparado aos valores de distribuição Qui-quadrado com 2 graus de liberdade. Se α = 0.05, RR : X2 > χ20.05 ; 2 Percentil que deixa uma área de α=0.05 acima dele na distribuição Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)

Voltando ao exemplo inicial …. RR : X2 > 5.991 O valor da estatística observado de X2 foi 2.50. Como esse valor não pertence à região de valores críticos do teste qui-quadrado, a distância entre os valores observados e os valores esperados sob H0 foi considerada pequena. Assim, o experimento não mostrou evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais, a 5% de significância.

Se rejeitarmos a hipótese da homogeneidade das permeabilidades usando os dados deste experimento …. Qual será o risco de estarmos cometendo o erro tipo I ? Valor P = P[ obter um valor de X2 ainda “mais extremo” do que o valor observado ] X2obs Valor P Valor P = P[χ2gl> X2obs]

Voltando ao exemplo inicial …. Valor P = P[χ2gl> 2.50] Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50. 2.50 Valor P = P[χ2gl> 2.50] > 0.10 Conclusão: Os dados do experimento não mostraram evidências estatísticas suficientes para a rejeição da hipótese de que as permeabilidades das luvas das três marcas sejam iguais (valor P > 0.10).

Teste Qui-quadrado para homogeneidade de proporções H0: As proporções de sucesso são homogêneas para todas as populações Ha: Ao menos uma população tem proporção de sucesso diferente das demais Onde : Nc é o número total de caselas da tabela Oi é o valor observado na casela i, i=1,2,…, Nc Ei é o valor esperado na casela i. Valor P = P[χ2gl> X2obs], onde g.l. = (l-1) x (c-1)

Estatística X2 simplificada para o caso da Tabela 2x2 Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 a 89 b 240 (a+b) B 134 c 106 d 240 (c+d) 285 (a+c) 195 (b+d) 480 N

Resolvendo o exemplo apenas com luvas A e B …. Marca da luva Deixou passar vírus quando submetida à tensão? Total Sim Não A 151 a 89 b 240 (a+b) B 134 c 106 d 240 (c+d) 285 (a+c) 195 (b+d) 480 N

Teste Qui-quadrado de independência Um número arbitrário N de indivíduos são classificados segundo duas variáveis qualitativas (variável A e variável B) Variável A Variável B Total B1 B2 .... Bm A1 A2 A3 An N

Tabela de Classificação Cruzada Exemplo: associação entre grupo sanguíneo e presença de uma característica de interesse Tabela de Classificação Cruzada Grupo Sangüíneo Característica Total Presente Ausente A 32 47 79 B 8 19 27 AB 7 14 21 O 9 64 73 56 144 200 [Reis e Reis, 2000]

Nc é o número total de caselas da tabela H0: Variável A não está associada à Variável B (A e B são independentes) HA: Variável A está associada à Variável B (A e B não são independentes) Onde : Nc é o número total de caselas da tabela Oi é o valor observado na casela i, i=1,2,…, Nc Ei é o valor esperado na casela i. Valor P = P[χ2gl> X2obs], onde g.l. = (l-1) x (c-1)

“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh negativo” [Flerg et al, 2009]

H0:. acidente automobilístico NÃO está associado à H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh negativo HA: acidente automobilístico está associado à presença de toxoplasmose em pessoas com Rh negativo Toxoplasma Acidente ? Total Não Sim 526 14 540 170 11 181 696 25 721 Valor P = P[χ21> 4.92]

4.92 (0.025 < Valor P < 0.05) Ao nível de 5% de significância, há evidências estatísticas suficientes a favor da hipótese de associação entre acidente automobilístico e presença de toxoplasmose em pessoas com sangue Rh negativo (0.025 < Valor P < 0.05).

“Associação entre toxoplasmose e acidente de trânsito em pessoas com sangue Rh positivo” “Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”

H0:. acidente automobilístico NÃO está associado à H0: acidente automobilístico NÃO está associado à presença de toxoplasmose em pessoas com Rh positivo HA: acidente automobilístico está associado à presença de toxoplasmose em pessoas com Rh positivo Toxoplasma Acidente ? Total Não Sim 2391 69 2460 692 17 709 3083 86 3169 Valor P = P[χ21> 0.21]

0.21 (0.10 < Valor P < 0.90) Para pessoas com sangue Rh positivo, os dados amostrais não fornecem evidências estatísticas suficientes contra a hipótese de independência entre acidente automobilístico e presença de toxoplasmose (Valor P > 0.10).

Associação entre variáveis qualitativas Amostras Dependentes Exemplo inicial Em um estudo sobre tipos sanguíneos de casais, gostaria-se de verificar se existe associação entre o fator Rh do sangue das esposas e dos esposos. Para isto, 100 casais foram classificados quanto ao fator Rh dos esposos e das esposas. Esposa Esposo Total Rh+ Rh - a r a+r Rh- s b s+b a+s r+b 100

Teste Qui-quadrado de McNemar H0: não há associação entre o fator Rh dos membros do casal Ha: não há associação entre o fator Rh dos membros do casal Esposa Esposo Total Rh+ Rh - a r a+r Rh- s b s+b a+s r+b 100 Número de pares concordantes: a e b Número de pares discordantes: r e s tem distribuição

Valor P = P[ > ∞] = 0 Associação Positiva Perfeita Esposa Esposo Total Rh+ Rh - 60 Rh- 40 100 Valor P = P[ > ∞] = 0 Conclusão: rejeitar a hipótese de independência entre o fator Rh dos casais

Valor P = P[ > 0.0208] > 0.95 Não Associação Perfeita Esposa Esposo Total Rh+ Rh - 36 24 60 Rh- 16 40 100 Valor P = P[ > 0.0208] > 0.95 Conclusão: não rejeitar a hipótese de independência entre o fator Rh dos casais

Amostras Dependentes Um estudo investiga a associação entre infarto do miocárdio e a presença de diabetes entre os índios navajos americanos (Coulehan et al, 1986) Índios com episódios de infarto do miocárdio foram emparelhados com índios sem a doença (144 pares). Cada elemento do par foi investigado quanto à presença de diabetes. Sem infarto Com Infarto Total Diabético Nao-Diabético 9 37 46 Não-Diabético 16 82 98 25 119 144 [Coulehan et al,1986]

Para aprender Exercícios da Seção 12

Referências Bibliográficas Coulehan et al (1986) “Acute Myocardial Infarction Among Navajo Indians”, 1976-1983, American Journal of Public Health, pp 412-214 Flegr et al. (2009) “Increased incidence of traffic accidents in Toxoplasma-infected military drivers and protective effect RhD molecule revealed by a large-scale prospective cohort study”, BMC Infectious Diseases, vol. 9, n. 72. Reis, E. A.; Reis, I.A. (2000) “Exercícios Resolvidos em Introdução à Bioestatística”, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br