Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouPedro Bento Franco Alterado mais de 8 anos atrás
1
Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula
2
The means of the baseline and spirometry variables for the different groups of exposure were compared by a one-way analysis of variance. When residual diagnostic tools suggested coarse deviations from the model assumptions, the analysis was complemented by a Kruskal-Wallis test. Motivação
3
Na análise estatística de dados podemos optar por: Métodos paramétricos : fazem suposições sobre a distribuição de probabilidade da variável analisada Se a suposição é válida OK Se a suposição não é válida a análise pode levar a respostas inválidas
4
Métodos não paramétricos : são livres de suposições Esses métodos atribuem “ranks” às observações Exemplo Considere a variável PM 2,5 no banco de dados Espirometria
5
Quando há duas ou mais observações idênticas, a média dos ranks é atribuída a cada uma das observações empatadas. Por exemplo, considere os valores da idade dos 22 guardas florestais (banco de dados Espirometria) Quais seriam os ranks?
6
O primeiro passo é ordenar os valores, do menor para o maior, e então atribuir os ranks Em uma amostra de tamanho n, a soma dos ranks é igual a n (n+1)/2
7
Os métodos apresentados a seguir são adequados a variáveis contínuas. Neste caso, é menos provável a ocorrência de empates. Se ocorrerem empates, é necessário fazer modificações na estatística de teste. Os métodos podem ser aplicados a variáveis discretas, quando a ocorrência de empates é mais frequente, porém sempre fazendo as correções apropriadas
8
Comparação de 2 grupos – amostras independentes Teste de Mann-Whitney-Wilcoxon H0: as distribuições da variável resposta nos dois grupos são iguais Mann-Whitney e Wilcoxon deduziram testes equivalentes para a hipótese H1: as distribuições da variável resposta nos dois grupos não são iguais
9
T = soma dos ranks no menor grupo são atribuídos ranks a todas as observações como se fosse uma única amostra calcular a soma dos ranks em cada grupo Tamanhos das amostras: n 1 e n 2 Estatística para o teste de Wilcoxon
10
Estatística para o teste de Mann-Whitney U = n1 n2 + 0,5 n1 (n1 + 1) - T Para amostras pequenas, há tabelas com a distribuição exata da estatística do teste quando H0 é verdadeira.
11
Para amostras grandes (10 ou mais em cada grupo) : Se H0 é verdadeira, T tem distribuição aproximadamente normal: média = desvio padrão = e são os tamanhos das amostras nos grupos maior e menor, respectivamente
12
Regra de decisão Rejeitamos H 0 se T é menor que o quantil de ordem /2, ou maior que o quantil de ordem 1- /2 da distribuição Normal com média T e desvio padrão T Hipóteses alternativas unilaterais...
13
Exemplo Em um estudo realizado para avaliar o efeito do tabagismo nos padrões de sono foram considerados dois grupos de indivíduos: Fumantes e Não fumantes. A variável observada foi o tempo, em minutos, que se leva para dormir. Hipóteses H0: o tempo para dormir nos fumantes tende a ser igual ao dos não fumantes H1: o tempo para dormir nos fumantes tende a ser maior que nos não fumantes
14
Amostra ordenada e ranks
15
Resumo descritivo do tempo até dormir (min) nos grupos de fumantes e não fumantes Variable N Mean StDev Minimum Median Maximum IQR Fumantes 10 51,19 15,99 21,20 52,40 79,00 19,10 Não fumantes 15 27,47 8,13 13,90 27,20 52,60 5,70 Box-plot do tempo em cada grupo
17
T=188 p<0,001 (teste unilateral)
18
Comparação de 2 grupos – amostras emparelhadas Teste de Wilcoxon para amostras emparelhadas H 0 : a mediana da diferença da variável resposta nos dois grupos é igual a zero H 1 : a mediana da diferença da variável resposta nos dois grupos é diferente de zero É considerada como variável resposta a diferença entre as observações em um mesmo par pode ser unilateral
19
Observação: este teste supõe que a distribuição da diferença é simétrica Podem ser necessárias transformações nos dados
20
Procedimento: calcular a diferença entre os pares de observações atribuir ranks ao valor absoluto das diferenças (omitir as diferenças nulas) calcular as somas dos ranks correspondentes às diferenças positivas esta soma é a estatística do teste
21
Para valores maiores de n: Se H 0 é verdadeira, a estatística do teste tem distribuição normal: média = n (n+1)/4 variância = n (n+1) (2n+1)/24 Para n<25, há tabelas que fornecem o p-valor aproximado correspondente ao valor observado da estatística do teste Observação: quando ocorrem empates são necessários ajustes na estatística do teste
22
Exemplo (Bussab e Morettin (2013) – Estatística Básica) Os dados referem-se a medidas de placa bacteriana em crianças em idade pré-escolar, antes e depois do uso de uma escova experimental Hipóteses: H 0 : a mediana da diferença é igual a zero H 1 : a mediana da diferença é maior que zero
24
Resumo descritivo da diferença Variable N Mean StDev Minimum Median Maximum IQR Diferença 26 1,366 0,750 0,180 1,210 2,830 1,180
25
Ranks do valor absoluto da diferença: todas as diferença são positivas
26
Estatística do teste = soma dos ranks = 351 média = n (n+1)/4 = 26. 27/4 = 175,5 variância = n (n+1) (2n+1) / 24 = 1550,25 Desvio padrão = 39,37 p<0,001
27
Wilcoxon Signed Rank Test: Diferença Test of median = 0,000000 versus median > 0,000000 N for Wilcoxon Estimated N Test Statistic P Median Diferença 26 26 351,0 0,000 1,325
28
Comparação de k grupos – amostras independentes Teste de Kruskal-Wallis H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : Pelo menos uma das populações tende a ter maiores valores de observações do que pelo menos uma das demais Teste de Kruskal-Wallis : extensão do teste de Mann- Whitney
29
ni observações em cada um dos k grupos Número total de observações : N=ni x k Atribuir ranks de 1 a N às observações sem considerar a divisão em grupos Notação: : média dos ranks das observações no grupo i : média de todos os ranks = (N + 1)/2
30
Estatística para o teste Se H o é verdadeira, H tem distribuição Qui-Quadrado com (k-1) graus de liberdade Rejeitamos H 0 se o valor da estatística é maior que o valor crítico
32
Exemplo Considere o banco de dados Espirometria. Comparar os três grupos definidos pela exposição quanto à CVF predita Descriptive Statistics: cvfpred exposição N Mean StDev Minimum Median Maximum IQR 0 15 94,86 9,26 73,95 94,02 107,59 12,96 1 76 94,02 13,08 48,10 94,94 121,42 16,40 2 10 87,38 17,85 70,64 83,50 131,85 17,24
35
kruskal.test(cvfpred ~ exposição, data=Espiro_curso) Kruskal-Wallis rank sum test data: cvfpred by exposição Kruskal-Wallis chi-squared = 5.1472, df = 2, p-value = 0.07626 Valor crítico = 5,99
36
Média dos ranks no i-ésimo grupo Para comparar os grupos i e j: Média dos ranks no j-ésimo grupo B=z (1- /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os grupos. A hipótese de igualdade de distribuições nos grupo i e j é rejeitada se
37
Comparação de k grupos – amostras pareadas Teste de Friedman H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : a distribuição da variável resposta não é a mesma nos k grupos
38
Nível 1Nível 2... Nível k Fator indivíduo 1 indivíduo 2 indivíduo n...... x x... x Estrutura geral dos dados Blocos
39
Procedimento: Ordenamos as k observações da menor para a maior de forma separada em cada um dos n blocos e atribuímos os ranks {1, 2,..., k} para cada uma das observações em um mesmo bloco R i = Soma dos ranks no nível i
40
Estatística para o teste Se H 0 é verdadeira, H tem distribuição Qui-Quadrado com k-1 graus de liberdade. Rejeitamos H 0 para valores grandes de H
41
Exemplo ( Altman, 1999) Vazamento de quatro tipos diferentes de roupa de imersão (g)
42
Descriptive Statistics: Vazamento Variable Tratamento N Mean StDev Minimum Median Maximum Vazamento A 8 198,0 103,1 28,0 190,0 332,0 B 8 283,0 127,3 132,0 285,0 526,0 C 8 202,8 178,9 0,0 167,0 458,0 D 8 45,8 31,6 6,0 32,0 90,0
43
Ranks
44
> friedman.test(Vazamento~Tratamento|Sujeito, data = Vazamento) Friedman rank sum test data: Vazamento and Tratamento and Sujeito Friedman chi-squared = 12.45, df = 3, p-value = 0.00599
45
Soma dos ranks no i-ésimo grupo Para comparar as distribuições da variável resposta nos níveis i e j: Soma dos ranks no j-ésimo grupo B=z (1- /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os níveis do fator. A hipótese de igualdade de distribuições nos níveis i e j é rejeitada se
46
No exemplo Número de comparações = g = 6 B=z (1- /2g) = 2,63
47
Não há diferença significativa entre as distribuições do vazamento nos tratamentos C e D Não há diferença significativa entre as distribuições do vazamento nos tratamentos A, B e C O vazamento nos tratamentos A e B tende a ser maior do que no D
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.