A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

INTRODUÇÃO AO R E ESTATÍSTICA BÁSICA:

Apresentações semelhantes


Apresentação em tema: "INTRODUÇÃO AO R E ESTATÍSTICA BÁSICA:"— Transcrição da apresentação:

1 INTRODUÇÃO AO R E ESTATÍSTICA BÁSICA:
3 PRÁTICO: TESTE T E ANOVA LUIS ANUNCIAÇÃO (PUC-RIO) anovabr.com

2 AGENDA/OBJETIVOS Teste T ANOVA Post-hoc Tamanho do efeito

3 Teste T: Motivação / Pressupostos
Verificar se a média de uma característica é diferente entre dois grupos (de indivíduos) Dados aleatórios independentes e identicamente distribuídos (iid) VD contínua que segue uma distribuição normal VI fator com até dois grupos Variância homogênea (homocedasticidade)

4 Família GLM Regressão VI contínua ou não ANOVA 3 ou + grupos TESTE T

5 Tipos de Teste T Para 2 amostras independentes (independent sample / between samples) Verificar a diferença na pontuação de uma escala de Alteração na percepção corporal em função do sexo Para amostras pareadas (paired sample) Verificar a eficácia de um determinado tratamento em um mesmo grupo e em dois momentos diferentes Para uma única amostra (one sample) Verificar se uma determinada pessoa tem a inteligência (medida em QI) diferente do esperado (μ = 100)

6 Concepção matemática 𝑇= 𝑥 1 − 𝑥 2 𝑆𝑝 1 𝑛1 + 1 𝑛 𝑆𝑝= 𝑛1−1 𝑆 𝑛2−1 𝑆 2 2 𝑛1+𝑛2 −2 df: n-2 2 amostras 𝑇= 𝑑 𝑆𝐷 𝑛 :: 𝑑 = 𝑖=1 𝑛 𝑋1−𝑋2 𝑛 :: 𝑆 2 = 𝑖=1 𝑛 𝑑 𝑖 − 𝑑 2 𝑛− df: n-1 Amostras pareadas 𝑇= 𝑥 − 𝜇 0 𝑠 𝑛 df: n-1 1 amostra / média

7 Teste T H0: μ1 = μ2=0 Ha: μ1 ≠ μ2 ↓ valor de |T| ↑ valor de P T = 0.43

8 Teste T H0: μ1 = μ2=0 Ha: μ1 ≠ μ2 ↑ valor de |T| ↓ valor de P T = 156

9 Tamanho do efeito Nome dado a família de índices que mensuram a magnitude ou importância da diferença ou do efeito de um determinado tratamento de forma (mais) independente do tamanho amostral. Família d de Cohen D r r e R2 g de Hedges η2 e ω 2 Δ de Glass

10 Tamanho do efeito Pequeno 0.2 0.1 Médio 0.5 0.3 Grande 0.8 0.5
𝑇= 𝑥 1 − 𝑥 2 𝑆𝑝 1 𝑛1 + 1 𝑛 𝑆𝑝= 𝑛1−1 𝑆 𝑛2−1 𝑆 2 2 𝑛1+𝑛2 −2 df: n-2

11 DPLYR dados_brasil %>% group_by(mulheres) %>%
summarise_at(vars(bsq_soma),funs(mean, sd))

12 GGPLOT2 ggplot(dados_brasil, ) x=as.factor(mulheres)
aes( , ) ggplot(dados_brasil, ) x=as.factor(mulheres) y=bsq_soma, fill=as.factor(mulheres) + geom_boxplot()

13 t.test e cohen.d t.test( , ) bsq_soma ~ mulheres
alternative = c("two.sided"), data=dados_brasil ~ VI binária , VI numérica (sem agrupamento) library("effsize") cohen.d ( , ) bsq_soma ~ factor(mulheres) data=dados_brasil

14 ANOVA: Motivação / Pressupostos
Verificar se a média de uma característica entre mais do que dois grupos (de indivíduos) é diferente Dados aleatórios independentes e identicamente distribuídos (iid) VD contínua que segue uma distribuição normal VI fator com grupos > 2 Variância homogênea (homocedasticidade)

15 Múltiplas comparações
Normalmente, a pergunta que fazemos não é “Será que uma das médias é diferente?!”; mas sim, Qual grupo difere de qual grupo!? VD VI Depressão Jovens Adultos Idosos 1x2 1x3 2x3

16 Múltiplas comparações
Leve Moderada Grave VD VI Depressão Jovens Adultos Idosos 1x2 1x3 2x3

17 Múltiplas comparações
Poder computacional Family-Wise Error Rate (FWER) – Erro do tipo 1 1-(1-α)c 𝑐= 𝐾(𝐾−1) 2

18 Múltiplas comparações
Family-Wise Error Rate (FWER) – Erro do tipo 1 1-(1-α)c 𝑐= 𝐾(𝐾−1) 2 Grupos α

19 Múltiplas comparações
Normalmente, a pergunta que fazemos não é “Será que uma das médias é diferente?!”; mas sim, Qual grupo difere de qual grupo!? Antigamente, a ANOVA era uma requisito antes de se realizar as múltiplas comparações. Se ela fosse significativa, procedíamos às múltiplas comparações (chamadas de Post-hoc). Se não fosse significativa, pararíamos. Ou seja, ANOVA é um teste exploratório. Porém, desde que se ajuste os resultados das comparações, é possível fazer isso independente de uma ANOVA. Em outras palavras, os Post-hoc e a ANOVA não são necessariamente associados/dependentes.

20 ANOVA H0: μ1 = μ2 = μ3 , ... , = μi Ha: Pelo menos uma é diferente
↓ valor de F ↑  valor de P F = 0.54 P = 0.6

21 ANOVA H0: μ1 = μ2 = μ3 , ... , = μi Ha: Pelo menos uma é diferente
↑ valor de F ↓ valor de P F = 156 P =

22 ANOVA – Post hoc

23 DPLYR dados_brasil <- dados_brasil %>%
mutate(imc_classificacao = if_else( imc < 18.5,"Abaixo", if_else(imc >= 18.5 & imc <= 24.9, "Normal", Acima")))

24 aov.test aov(bsq_soma ~ imc_classificacao, data=dados_brasil, na.action=na.omit) %>% summary() pairwise.t.test( , ) dados_brasil$bsq_soma,dados_brasil$imc_classificacao p.adj = "bonf"

25 GGPLOT2 dados_brasil %>% filter(!is.na(imc_classificacao)) %>%
aes(x=imc_classificacao, y=bsq_soma)) + geom_boxplot()

26 LAB

27 REVISÃO

28 Revisão Teste T e ANOVA trabalham em função da média
ANOVA é um teste exploratório Comparações pareadas devem ser feitas ajustando os resultados Enquanto a significância tem decisões “binárias”, o tamanho do efeito é contínuo

29 SINTAXE

30 REVISÃO # Estatistica no R - Aula 3 (Teste T e ANOVA) # Luis Anunciacao (Psicometria, PUC-Rio/University of Oregon) # library("tidyverse") #carregar pacote library("effsize") #Verificar medias dados_brasil %>% group_by(mulheres) %>% summarise_at(vars(bsq_soma),funs(mean, sd)) ggplot(dados_brasil, aes(x=as.factor(mulheres), y=bsq_soma, fill=as.factor(mulheres))) + geom_boxplot() + labs(title="Resultado do BSQ em função do sexo", x="Sexo", fill="Mulheres?") #Teste T #Ambiente R-Base t.test(bsq_soma ~ mulheres, alternative = c("two.sided"), data=dados_brasil) #Tamanho do efeito cohen.d(bsq_soma ~ factor(mulheres), data=dados_brasil) #ANOVA #adicionar classificação do imc dados_brasil <- dados_brasil %>% mutate(imc_classificacao = if_else(imc < 18.5,"Abaixo", if_else(imc >= 18.5 & imc <= 24.9, "Normal","Acima"))) #Realizar ANOVA (one way, 1 VI) aov(bsq_soma ~ imc_classificacao, data=dados_brasil, na.action=na.omit) %>% summary() pairwise.t.test(dados_brasil$bsq_soma,dados_brasil$imc_classificacao, p.adj = "bonf") #ajuste bonferroni pairwise.t.test(dados_brasil$bsq_soma,dados_brasil$imc_classificacao, p.adj = "none") #sem ajuste dados_brasil %>% filter(!is.na(imc_classificacao)) %>% ggplot(., aes(x=imc_classificacao, y=bsq_soma)) + geom_boxplot() # Luis Anunciacao, 2017 # This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. #


Carregar ppt "INTRODUÇÃO AO R E ESTATÍSTICA BÁSICA:"

Apresentações semelhantes


Anúncios Google