Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Slides:



Advertisements
Apresentações semelhantes
Análise Estatística Testes de Hipóteses.
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.
Analise de Regressão Parte 2.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
CAPÍTULO 7 TESTE DE HIPÓTESE
Prof. Marllus Gustavo Ferreira Passos das Neves
MANOVA Análise de variância multivariada
Análise de Medidas Repetidas: Áreas de Uso
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Avaliação estatística dos mecanismos de codificação desenvolvidos
Kruskal-Wallis Test Ex: Pesos em Kg de 3 grupos de indivíduos de grupos étnicos diferentes (caucasianos, latinos e asiáticos). Grupo 1: 72; 75; 73; 67;
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
Objetivo Definições Cálculo do teste Exemplo Comentários Bibliografia
Análise de Variância (ANOVA)
Análise da Regressão múltipla: Inferência Revisão da graduação
Estatística e Probabilidade
ANOVA: Análise de Variância APLICAÇÃO.
TESTES NÃO PARAMÉTRICOS TESTE DE MANN- WHITNEY
Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos
Exercício - 1. Criar no SPSS o banco de dados com as informações fornecidas 2. Salvar o banco com o nome atividade física na pasta pos pilates 3.
Aula 5 - Método experimental ou de seleção aleatória
Aula 11 - Teste de hipóteses, teste de uma proporção
Aplicações Estatísticas uma rápida abordagem
COMPARAÇÃO DE DUAS POPULAÇÕES
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 6 Prof. Cristina Ortiz Valete.
Estatística e Probabilidade
Teste de Hipóteses Pontos mais importantes: -objectivo
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó
Professor Antonio Carlos Coelho
Apresenta:.
Especialização em Pesquisa Clínica Módulo 3 – Epidemiologia e Bioestatística Daniel Kashiwamura Scheffer 1o. Semestre – 2009.
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
análise dos estimadores
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Estimativas de grandezas cap 2. e cap 3 Média Desvio Padrão e Variância Definições importantes Distribuição Normal Teorema do limite central Hipóteses.
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
Aula 4 – Estatística- Conceitos básicos
Introdução a planejamento e otimização de experimentos
Metodologia da Pesquisa em Ensino de Ciências I
ME623A Planejamento e Pesquisa
Teste de hipóteses Aula 06 Prof. Christopher Freire Souza
INTRODUÇÃO À BIOESTATÍSTICA PROFESSORA: Carolina Peixinho
Testes de Hipóteses.
Análise de Variância (ANOVA)
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Probabilidade Teste de hipóteses para duas médias:
Métodos Estatísticos Aplicados às Ciências Biológicas - 9ª aula -
- Testes Qui-quadrado - Aderência e Independência
Métodos Estatísticos Aplicados às Ciências Biológicas - 11ª aula -
Estimação: Estimativa Pontual Estimativa Intervalar
Métodos Estatísticos Aplicados às Ciências Biológicas - 8ª aula -
Métodos Estatísticos Aplicados às Ciências Biológicas 8ª aula - Prática.
Testes de Hipóteses.
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
AULA 2 Prof. Dr. Márcio A. Fiori -
SPSS Guia Prático para Pesquisadores
GESTÃO E GARANTIA DA QUALIDADE
Testes de significância e análise Parte 1 The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
AULA 11 – REGRESSÃO Parte I
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Teste de Hipótese Camilo Daleles Rennó
Critérios de Escolha dos Métodos Estatísticos
Transcrição da apresentação:

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula

The means of the baseline and spirometry variables for the different groups of exposure were compared by a one-way analysis of variance. When residual diagnostic tools suggested coarse deviations from the model assumptions, the analysis was complemented by a Kruskal-Wallis test. Motivação

Na análise estatística de dados podemos optar por: Métodos paramétricos : fazem suposições sobre a distribuição de probabilidade da variável analisada Se a suposição é válida OK Se a suposição não é válida a análise pode levar a respostas inválidas

Métodos não paramétricos : são livres de suposições Esses métodos atribuem “ranks” às observações Exemplo Considere a variável PM 2,5 no banco de dados Espirometria

Quando há duas ou mais observações idênticas, a média dos ranks é atribuída a cada uma das observações empatadas. Por exemplo, considere os valores da idade dos 22 guardas florestais (banco de dados Espirometria) Quais seriam os ranks?

O primeiro passo é ordenar os valores, do menor para o maior, e então atribuir os ranks Em uma amostra de tamanho n, a soma dos ranks é igual a n (n+1)/2

Os métodos apresentados a seguir são adequados a variáveis contínuas. Neste caso, é menos provável a ocorrência de empates. Se ocorrerem empates, é necessário fazer modificações na estatística de teste. Os métodos podem ser aplicados a variáveis discretas, quando a ocorrência de empates é mais frequente, porém sempre fazendo as correções apropriadas

Comparação de 2 grupos – amostras independentes Teste de Mann-Whitney-Wilcoxon H0: as distribuições da variável resposta nos dois grupos são iguais Mann-Whitney e Wilcoxon deduziram testes equivalentes para a hipótese H1: as distribuições da variável resposta nos dois grupos não são iguais

T = soma dos ranks no menor grupo são atribuídos ranks a todas as observações como se fosse uma única amostra calcular a soma dos ranks em cada grupo Tamanhos das amostras: n 1 e n 2 Estatística para o teste de Wilcoxon

Estatística para o teste de Mann-Whitney U = n1 n2 + 0,5 n1 (n1 + 1) - T Para amostras pequenas, há tabelas com a distribuição exata da estatística do teste quando H0 é verdadeira.

Para amostras grandes (10 ou mais em cada grupo) : Se H0 é verdadeira, T tem distribuição aproximadamente normal: média = desvio padrão = e são os tamanhos das amostras nos grupos maior e menor, respectivamente

Regra de decisão Rejeitamos H 0 se T é menor que o quantil de ordem  /2, ou maior que o quantil de ordem 1-  /2 da distribuição Normal com média  T e desvio padrão  T Hipóteses alternativas unilaterais...

Exemplo Em um estudo realizado para avaliar o efeito do tabagismo nos padrões de sono foram considerados dois grupos de indivíduos: Fumantes e Não fumantes. A variável observada foi o tempo, em minutos, que se leva para dormir. Hipóteses H0: o tempo para dormir nos fumantes tende a ser igual ao dos não fumantes H1: o tempo para dormir nos fumantes tende a ser maior que nos não fumantes

Amostra ordenada e ranks

Resumo descritivo do tempo até dormir (min) nos grupos de fumantes e não fumantes Variable N Mean StDev Minimum Median Maximum IQR Fumantes 10 51,19 15,99 21,20 52,40 79,00 19,10 Não fumantes 15 27,47 8,13 13,90 27,20 52,60 5,70 Box-plot do tempo em cada grupo

T=188 p<0,001 (teste unilateral)

Comparação de 2 grupos – amostras emparelhadas Teste de Wilcoxon para amostras emparelhadas H 0 : a mediana da diferença da variável resposta nos dois grupos é igual a zero H 1 : a mediana da diferença da variável resposta nos dois grupos é diferente de zero É considerada como variável resposta a diferença entre as observações em um mesmo par pode ser unilateral

Observação: este teste supõe que a distribuição da diferença é simétrica Podem ser necessárias transformações nos dados

Procedimento: calcular a diferença entre os pares de observações atribuir ranks ao valor absoluto das diferenças (omitir as diferenças nulas) calcular as somas dos ranks correspondentes às diferenças positivas esta soma é a estatística do teste

Para valores maiores de n: Se H 0 é verdadeira, a estatística do teste tem distribuição normal: média = n (n+1)/4 variância = n (n+1) (2n+1)/24 Para n<25, há tabelas que fornecem o p-valor aproximado correspondente ao valor observado da estatística do teste Observação: quando ocorrem empates são necessários ajustes na estatística do teste

Exemplo (Bussab e Morettin (2013) – Estatística Básica) Os dados referem-se a medidas de placa bacteriana em crianças em idade pré-escolar, antes e depois do uso de uma escova experimental Hipóteses: H 0 : a mediana da diferença é igual a zero H 1 : a mediana da diferença é maior que zero

Resumo descritivo da diferença Variable N Mean StDev Minimum Median Maximum IQR Diferença 26 1,366 0,750 0,180 1,210 2,830 1,180

Ranks do valor absoluto da diferença: todas as diferença são positivas

Estatística do teste = soma dos ranks = 351 média = n (n+1)/4 = /4 = 175,5 variância = n (n+1) (2n+1) / 24 = 1550,25 Desvio padrão = 39,37 p<0,001

Wilcoxon Signed Rank Test: Diferença Test of median = 0, versus median > 0, N for Wilcoxon Estimated N Test Statistic P Median Diferença ,0 0,000 1,325

Comparação de k grupos – amostras independentes Teste de Kruskal-Wallis H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : Pelo menos uma das populações tende a ter maiores valores de observações do que pelo menos uma das demais Teste de Kruskal-Wallis : extensão do teste de Mann- Whitney

ni observações em cada um dos k grupos Número total de observações : N=ni x k Atribuir ranks de 1 a N às observações sem considerar a divisão em grupos Notação: : média dos ranks das observações no grupo i : média de todos os ranks = (N + 1)/2

Estatística para o teste Se H o é verdadeira, H tem distribuição Qui-Quadrado com (k-1) graus de liberdade Rejeitamos H 0 se o valor da estatística é maior que o valor crítico

Exemplo Considere o banco de dados Espirometria. Comparar os três grupos definidos pela exposição quanto à CVF predita Descriptive Statistics: cvfpred exposição N Mean StDev Minimum Median Maximum IQR ,86 9,26 73,95 94,02 107,59 12, ,02 13,08 48,10 94,94 121,42 16, ,38 17,85 70,64 83,50 131,85 17,24

kruskal.test(cvfpred ~ exposição, data=Espiro_curso) Kruskal-Wallis rank sum test data: cvfpred by exposição Kruskal-Wallis chi-squared = , df = 2, p-value = Valor crítico = 5,99

Média dos ranks no i-ésimo grupo Para comparar os grupos i e j: Média dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os grupos. A hipótese de igualdade de distribuições nos grupo i e j é rejeitada se

Comparação de k grupos – amostras pareadas Teste de Friedman H 0 : as distribuições da variável resposta é a mesma nos k grupos H 1 : a distribuição da variável resposta não é a mesma nos k grupos

Nível 1Nível 2... Nível k Fator indivíduo 1 indivíduo 2 indivíduo n x x... x Estrutura geral dos dados Blocos

Procedimento: Ordenamos as k observações da menor para a maior de forma separada em cada um dos n blocos e atribuímos os ranks {1, 2,..., k} para cada uma das observações em um mesmo bloco R i = Soma dos ranks no nível i

Estatística para o teste Se H 0 é verdadeira, H tem distribuição Qui-Quadrado com k-1 graus de liberdade. Rejeitamos H 0 para valores grandes de H

Exemplo ( Altman, 1999) Vazamento de quatro tipos diferentes de roupa de imersão (g)

Descriptive Statistics: Vazamento Variable Tratamento N Mean StDev Minimum Median Maximum Vazamento A 8 198,0 103,1 28,0 190,0 332,0 B 8 283,0 127,3 132,0 285,0 526,0 C 8 202,8 178,9 0,0 167,0 458,0 D 8 45,8 31,6 6,0 32,0 90,0

Ranks

> friedman.test(Vazamento~Tratamento|Sujeito, data = Vazamento) Friedman rank sum test data: Vazamento and Tratamento and Sujeito Friedman chi-squared = 12.45, df = 3, p-value =

Soma dos ranks no i-ésimo grupo Para comparar as distribuições da variável resposta nos níveis i e j: Soma dos ranks no j-ésimo grupo B=z (1-  /2g) g= número de comparações Se H0 é rejeitada, é necessário localizar as diferenças entre os níveis do fator. A hipótese de igualdade de distribuições nos níveis i e j é rejeitada se

No exemplo Número de comparações = g = 6 B=z (1-  /2g) = 2,63

Não há diferença significativa entre as distribuições do vazamento nos tratamentos C e D Não há diferença significativa entre as distribuições do vazamento nos tratamentos A, B e C O vazamento nos tratamentos A e B tende a ser maior do que no D