Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula

The means of the baseline and spirometry variables for the different groups of exposure were compared by a one-way analysis of variance. When residual diagnostic tools suggested coarse deviations from the model assumptions, the analysis was complemented by a Kruskal-Wallis test. Motivação

Na análise estatística de dados podemos optar por: Métodos paramétricos : fazem suposições sobre a distribuição de probabilidade da variável analisada Se a suposição é válida OK Se a suposição não é válida a análise pode levar a respostas inválidas

Métodos não paramétricos : são livres de suposições Esses métodos atribuem “ranks” às observações Exemplo Considere a variável PM 2,5 no banco de dados Espirometria

Quando há duas ou mais observações idênticas, a média dos ranks é atribuída a cada uma das observações empatadas. Por exemplo, considere os valores da idade dos 22 guardas florestais (banco de dados Espirometria) Quais seriam os ranks?

O primeiro passo é ordenar os valores, do menor para o maior, e então atribuir os ranks Em uma amostra de tamanho n, a soma dos ranks é igual a n (n+1)/2

Os métodos apresentados a seguir são adequados a variáveis contínuas. Neste caso, é menos provável a ocorrência de empates. Se ocorrerem empates, é necessário fazer modificações na estatística de teste. Os métodos podem ser aplicados a variáveis discretas, quando a ocorrência de empates é mais frequente, porém sempre fazendo as correções apropriadas

Comparação de 2 grupos – amostras independentes Teste de Mann-Whitney-Wilcoxon H0: as distribuições da variável resposta nos dois grupos são iguais Mann-Whitney e Wilcoxon deduziram testes equivalentes para a hipótese H1: as distribuições da variável resposta nos dois grupos não são iguais

T = soma dos ranks no menor grupo são atribuídos ranks a todas as observações como se fosse uma única amostra calcular a soma dos ranks em cada grupo Tamanhos das amostras: n 1 e n 2 Estatística para o teste de Wilcoxon

Estatística para o teste de Mann-Whitney U = n1 n2 + 0,5 n1 (n1 + 1) - T Para amostras pequenas, há tabelas com a distribuição exata da estatística do teste quando H0 é verdadeira.

Para amostras grandes (10 ou mais em cada grupo) : Se H0 é verdadeira, T tem distribuição aproximadamente normal: média = desvio padrão = e são os tamanhos das amostras nos grupos maior e menor, respectivamente

Regra de decisão Rejeitamos H 0 se T é menor que o quantil de ordem  /2, ou maior que o quantil de ordem 1-  /2 da distribuição Normal com média  T e desvio padrão  T Hipóteses alternativas unilaterais...

Exemplo Em um estudo realizado para avaliar o efeito do tabagismo nos padrões de sono foram considerados dois grupos de indivíduos: Fumantes e Não fumantes. A variável observada foi o tempo, em minutos, que se leva para dormir. Hipóteses H0: o tempo para dormir nos fumantes tende a ser igual ao dos não fumantes H1: o tempo para dormir nos fumantes tende a ser maior que nos não fumantes

Amostra ordenada e ranks

Resumo descritivo do tempo até dormir (min) nos grupos de fumantes e não fumantes Variable N Mean StDev Minimum Median Maximum IQR Fumantes 10 51,19 15,99 21,20 52,40 79,00 19,10 Não fumantes 15 27,47 8,13 13,90 27,20 52,60 5,70 Box-plot do tempo em cada grupo

T=188 p<0,001 (teste unilateral)

Comparação de 2 grupos – amostras emparelhadas Teste de Wilcoxon para amostras emparelhadas H 0 : a mediana da diferença da variável resposta nos dois grupos é igual a zero H 1 : a mediana da diferença da variável resposta nos dois grupos é diferente de zero É considerada como variável resposta a diferença entre as observações em um mesmo par pode ser unilateral

Observação: este teste supõe que a distribuição da diferença é simétrica Podem ser necessárias transformações nos dados

Procedimento: calcular a diferença entre os pares de observações atribuir ranks ao valor absoluto das diferenças (omitir as diferenças nulas) calcular as somas dos ranks correspondentes às diferenças positivas esta soma é a estatística do teste

Para valores maiores de n: Se H 0 é verdadeira, a estatística do teste tem distribuição normal: média = n (n+1)/4 variância = n (n+1) (2n+1)/24 Para n<25, há tabelas que fornecem o p-valor aproximado correspondente ao valor observado da estatística do teste Observação: quando ocorrem empates são necessários ajustes na estatística do teste

Exemplo (Bussab e Morettin (2013) – Estatística Básica) Os dados referem-se a medidas de placa bacteriana em crianças em idade pré-escolar, antes e depois do uso de uma escova experimental Hipóteses: H 0 : a mediana da diferença é igual a zero H 1 : a mediana da diferença é maior que zero

Resumo descritivo da diferença Variable N Mean StDev Minimum Median Maximum IQR Diferença 26 1,366 0,750 0,180 1,210 2,830 1,180

Ranks do valor absoluto da diferença: todas as diferença são positivas

Estatística do teste = soma dos ranks = 351 média = n (n+1)/4 = 26. 27/4 = 175,5 variância = n (n+1) (2n+1) / 24 = 1550,25 Desvio padrão = 39,37 p<0,001

Wilcoxon Signed Rank Test: Diferença Test of median = 0,000000 versus median > 0,000000 N for Wilcoxon Estimated N Test Statistic P Median Diferença 26 26 351,0 0,000 1,325

Comparação de k grupos – amostras independentes Teste de Kruskal-Wallis H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : Pelo menos uma das populações tende a ter maiores valores de observações do que pelo menos uma das demais Teste de Kruskal-Wallis : extensão do teste de Mann- Whitney

ni observações em cada um dos k grupos Número total de observações : N=ni x k Atribuir ranks de 1 a N às observações sem considerar a divisão em grupos Notação: : média dos ranks das observações no grupo i : média de todos os ranks = (N + 1)/2

Estatística para o teste Se H o é verdadeira, H tem distribuição Qui-Quadrado com (k-1) graus de liberdade Rejeitamos H 0 se o valor da estatística é maior que o valor crítico

Exemplo Considere o banco de dados Espirometria. Comparar os três grupos definidos pela exposição quanto à CVF predita Descriptive Statistics: cvfpred exposição N Mean StDev Minimum Median Maximum IQR 0 15 94,86 9,26 73,95 94,02 107,59 12,96 1 76 94,02 13,08 48,10 94,94 121,42 16,40 2 10 87,38 17,85 70,64 83,50 131,85 17,24

kruskal.test(cvfpred ~ exposição, data=Espiro_curso) Kruskal-Wallis rank sum test data: cvfpred by exposição Kruskal-Wallis chi-squared = 5.1472, df = 2, p-value = 0.07626 Valor crítico = 5,99

Média dos ranks no i-ésimo grupo Para comparar os grupos i e j: Média dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os grupos. A hipótese de igualdade de distribuições nos grupo i e j é rejeitada se

Comparação de k grupos – amostras pareadas Teste de Friedman H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : a distribuição da variável resposta não é a mesma nos k grupos

Nível 1Nível 2... Nível k Fator indivíduo 1 indivíduo 2 indivíduo n...... x x... x Estrutura geral dos dados Blocos

Procedimento: Ordenamos as k observações da menor para a maior de forma separada em cada um dos n blocos e atribuímos os ranks {1, 2,..., k} para cada uma das observações em um mesmo bloco R i = Soma dos ranks no nível i

Estatística para o teste Se H 0 é verdadeira, H tem distribuição Qui-Quadrado com k-1 graus de liberdade. Rejeitamos H 0 para valores grandes de H

Exemplo ( Altman, 1999) Vazamento de quatro tipos diferentes de roupa de imersão (g)

Descriptive Statistics: Vazamento Variable Tratamento N Mean StDev Minimum Median Maximum Vazamento A 8 198,0 103,1 28,0 190,0 332,0 B 8 283,0 127,3 132,0 285,0 526,0 C 8 202,8 178,9 0,0 167,0 458,0 D 8 45,8 31,6 6,0 32,0 90,0

> friedman.test(Vazamento~Tratamento|Sujeito, data = Vazamento) Friedman rank sum test data: Vazamento and Tratamento and Sujeito Friedman chi-squared = 12.45, df = 3, p-value = 0.00599

Soma dos ranks no i-ésimo grupo Para comparar as distribuições da variável resposta nos níveis i e j: Soma dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os níveis do fator. A hipótese de igualdade de distribuições nos níveis i e j é rejeitada se

No exemplo Número de comparações = g = 6 B=z (1-  /2g) = 2,63

Não há diferença significativa entre as distribuições do vazamento nos tratamentos C e D Não há diferença significativa entre as distribuições do vazamento nos tratamentos A, B e C O vazamento nos tratamentos A e B tende a ser maior do que no D

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Apresentações semelhantes

Apresentação em tema: "Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Apresentações semelhantes

Apresentação em tema: "Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback