A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Apresentações semelhantes


Apresentação em tema: "Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula."— Transcrição da apresentação:

1 Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula

2 The means of the baseline and spirometry variables for the different groups of exposure were compared by a one-way analysis of variance. When residual diagnostic tools suggested coarse deviations from the model assumptions, the analysis was complemented by a Kruskal-Wallis test. Motivação

3 Na análise estatística de dados podemos optar por: Métodos paramétricos : fazem suposições sobre a distribuição de probabilidade da variável analisada Se a suposição é válida OK Se a suposição não é válida a análise pode levar a respostas inválidas

4 Métodos não paramétricos : são livres de suposições Esses métodos atribuem “ranks” às observações Exemplo Considere a variável PM 2,5 no banco de dados Espirometria

5 Quando há duas ou mais observações idênticas, a média dos ranks é atribuída a cada uma das observações empatadas. Por exemplo, considere os valores da idade dos 22 guardas florestais (banco de dados Espirometria) Quais seriam os ranks?

6 O primeiro passo é ordenar os valores, do menor para o maior, e então atribuir os ranks Em uma amostra de tamanho n, a soma dos ranks é igual a n (n+1)/2

7 Os métodos apresentados a seguir são adequados a variáveis contínuas. Neste caso, é menos provável a ocorrência de empates. Se ocorrerem empates, é necessário fazer modificações na estatística de teste. Os métodos podem ser aplicados a variáveis discretas, quando a ocorrência de empates é mais frequente, porém sempre fazendo as correções apropriadas

8 Comparação de 2 grupos – amostras independentes Teste de Mann-Whitney-Wilcoxon H0: as distribuições da variável resposta nos dois grupos são iguais Mann-Whitney e Wilcoxon deduziram testes equivalentes para a hipótese H1: as distribuições da variável resposta nos dois grupos não são iguais

9 T = soma dos ranks no menor grupo são atribuídos ranks a todas as observações como se fosse uma única amostra calcular a soma dos ranks em cada grupo Tamanhos das amostras: n 1 e n 2 Estatística para o teste de Wilcoxon

10 Estatística para o teste de Mann-Whitney U = n1 n2 + 0,5 n1 (n1 + 1) - T Para amostras pequenas, há tabelas com a distribuição exata da estatística do teste quando H0 é verdadeira.

11 Para amostras grandes (10 ou mais em cada grupo) : Se H0 é verdadeira, T tem distribuição aproximadamente normal: média = desvio padrão = e são os tamanhos das amostras nos grupos maior e menor, respectivamente

12 Regra de decisão Rejeitamos H 0 se T é menor que o quantil de ordem  /2, ou maior que o quantil de ordem 1-  /2 da distribuição Normal com média  T e desvio padrão  T Hipóteses alternativas unilaterais...

13 Exemplo Em um estudo realizado para avaliar o efeito do tabagismo nos padrões de sono foram considerados dois grupos de indivíduos: Fumantes e Não fumantes. A variável observada foi o tempo, em minutos, que se leva para dormir. Hipóteses H0: o tempo para dormir nos fumantes tende a ser igual ao dos não fumantes H1: o tempo para dormir nos fumantes tende a ser maior que nos não fumantes

14 Amostra ordenada e ranks

15 Resumo descritivo do tempo até dormir (min) nos grupos de fumantes e não fumantes Variable N Mean StDev Minimum Median Maximum IQR Fumantes 10 51,19 15,99 21,20 52,40 79,00 19,10 Não fumantes 15 27,47 8,13 13,90 27,20 52,60 5,70 Box-plot do tempo em cada grupo

16

17 T=188 p<0,001 (teste unilateral)

18 Comparação de 2 grupos – amostras emparelhadas Teste de Wilcoxon para amostras emparelhadas H 0 : a mediana da diferença da variável resposta nos dois grupos é igual a zero H 1 : a mediana da diferença da variável resposta nos dois grupos é diferente de zero É considerada como variável resposta a diferença entre as observações em um mesmo par pode ser unilateral

19 Observação: este teste supõe que a distribuição da diferença é simétrica Podem ser necessárias transformações nos dados

20 Procedimento: calcular a diferença entre os pares de observações atribuir ranks ao valor absoluto das diferenças (omitir as diferenças nulas) calcular as somas dos ranks correspondentes às diferenças positivas esta soma é a estatística do teste

21 Para valores maiores de n: Se H 0 é verdadeira, a estatística do teste tem distribuição normal: média = n (n+1)/4 variância = n (n+1) (2n+1)/24 Para n<25, há tabelas que fornecem o p-valor aproximado correspondente ao valor observado da estatística do teste Observação: quando ocorrem empates são necessários ajustes na estatística do teste

22 Exemplo (Bussab e Morettin (2013) – Estatística Básica) Os dados referem-se a medidas de placa bacteriana em crianças em idade pré-escolar, antes e depois do uso de uma escova experimental Hipóteses: H 0 : a mediana da diferença é igual a zero H 1 : a mediana da diferença é maior que zero

23

24 Resumo descritivo da diferença Variable N Mean StDev Minimum Median Maximum IQR Diferença 26 1,366 0,750 0,180 1,210 2,830 1,180

25 Ranks do valor absoluto da diferença: todas as diferença são positivas

26 Estatística do teste = soma dos ranks = 351 média = n (n+1)/4 = 26. 27/4 = 175,5 variância = n (n+1) (2n+1) / 24 = 1550,25 Desvio padrão = 39,37 p<0,001

27 Wilcoxon Signed Rank Test: Diferença Test of median = 0,000000 versus median > 0,000000 N for Wilcoxon Estimated N Test Statistic P Median Diferença 26 26 351,0 0,000 1,325

28 Comparação de k grupos – amostras independentes Teste de Kruskal-Wallis H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : Pelo menos uma das populações tende a ter maiores valores de observações do que pelo menos uma das demais Teste de Kruskal-Wallis : extensão do teste de Mann- Whitney

29 ni observações em cada um dos k grupos Número total de observações : N=ni x k Atribuir ranks de 1 a N às observações sem considerar a divisão em grupos Notação: : média dos ranks das observações no grupo i : média de todos os ranks = (N + 1)/2

30 Estatística para o teste Se H o é verdadeira, H tem distribuição Qui-Quadrado com (k-1) graus de liberdade Rejeitamos H 0 se o valor da estatística é maior que o valor crítico

31

32 Exemplo Considere o banco de dados Espirometria. Comparar os três grupos definidos pela exposição quanto à CVF predita Descriptive Statistics: cvfpred exposição N Mean StDev Minimum Median Maximum IQR 0 15 94,86 9,26 73,95 94,02 107,59 12,96 1 76 94,02 13,08 48,10 94,94 121,42 16,40 2 10 87,38 17,85 70,64 83,50 131,85 17,24

33

34

35 kruskal.test(cvfpred ~ exposição, data=Espiro_curso) Kruskal-Wallis rank sum test data: cvfpred by exposição Kruskal-Wallis chi-squared = 5.1472, df = 2, p-value = 0.07626 Valor crítico = 5,99

36 Média dos ranks no i-ésimo grupo Para comparar os grupos i e j: Média dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os grupos. A hipótese de igualdade de distribuições nos grupo i e j é rejeitada se

37 Comparação de k grupos – amostras pareadas Teste de Friedman H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : a distribuição da variável resposta não é a mesma nos k grupos

38 Nível 1Nível 2... Nível k Fator indivíduo 1 indivíduo 2 indivíduo n...... x x... x Estrutura geral dos dados Blocos

39 Procedimento: Ordenamos as k observações da menor para a maior de forma separada em cada um dos n blocos e atribuímos os ranks {1, 2,..., k} para cada uma das observações em um mesmo bloco R i = Soma dos ranks no nível i

40 Estatística para o teste Se H 0 é verdadeira, H tem distribuição Qui-Quadrado com k-1 graus de liberdade. Rejeitamos H 0 para valores grandes de H

41 Exemplo ( Altman, 1999) Vazamento de quatro tipos diferentes de roupa de imersão (g)

42 Descriptive Statistics: Vazamento Variable Tratamento N Mean StDev Minimum Median Maximum Vazamento A 8 198,0 103,1 28,0 190,0 332,0 B 8 283,0 127,3 132,0 285,0 526,0 C 8 202,8 178,9 0,0 167,0 458,0 D 8 45,8 31,6 6,0 32,0 90,0

43 Ranks

44 > friedman.test(Vazamento~Tratamento|Sujeito, data = Vazamento) Friedman rank sum test data: Vazamento and Tratamento and Sujeito Friedman chi-squared = 12.45, df = 3, p-value = 0.00599

45 Soma dos ranks no i-ésimo grupo Para comparar as distribuições da variável resposta nos níveis i e j: Soma dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os níveis do fator. A hipótese de igualdade de distribuições nos níveis i e j é rejeitada se

46 No exemplo Número de comparações = g = 6 B=z (1-  /2g) = 2,63

47 Não há diferença significativa entre as distribuições do vazamento nos tratamentos C e D Não há diferença significativa entre as distribuições do vazamento nos tratamentos A, B e C O vazamento nos tratamentos A e B tende a ser maior do que no D


Carregar ppt "Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula."

Apresentações semelhantes


Anúncios Google