Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouLuís Lencastre Caiado Alterado mais de 6 anos atrás
1
Conceitos básicos em análise de dados categóricos
Rafaela Helbing
2
Agenda 1. Introdução - Exemplos de aplicação 2. Estudo Coorte
- Conceitos básicos 2. Estudo Coorte 3. Regressão Logística
3
Aplicações - Área Clínica: Análise da ocorrência ou não de determinada doença. - Seguros: Análise de risco de clientes. - Financeira: Segmentação de grupos de risco para crédito. Importante: Variável Resposta: Categórica (distribuições discretas de probabilidade – Binomial, Poisson...) Variáveis Explicativas: Contínuas ou Categóricas.
4
Características Variáveis Categóricas
Dicotômicas ou binárias: Apenas 2 categorias. Politômicas: Mais de 2 categorias. Ordinais: Apresentam categorias ordenadas (baixo, médio, alto). Nominais: Não apresentam categorias ordenadas (gênero, cor dos olhos).
5
Estudo coorte Sadios Doentes Sadios Doentes Amostra População Expostos
Não Expostos Doentes Longitudinal
6
Exemplo coorte Odds ou Chance:
Exposição/ Resp SIM NAO Totais Exposto 80 20 100 N Exposto 25 75 105 95 200 Odds ou Chance: (Prob. evento ocorrer) / (Prob. evento não ocorrer) Odds Ratio: Odds exposto/ Odds N exposto Risco Relativo: (Prob. do evento ocorrer exposto) / (Prob. do evento ocorrer N exposto)
7
Aplicação EM R dados<-matrix(c(80,25,20,75),nc=2) head(dados)
p11<-(dados[1,1]/(sum(dados[1,]))) p21<-(dados[2,1]/(sum(dados[2,]))) RR<-p11/p21 OR<-(dados[1,1]*dados[2,2])/(dados[1,2]*dados[2,1]) fisher.test(dados)
8
interpretação prática
Se OR= 1: A chance de resposta positiva não difere entre expostos e não expostos. Se OR>1: A chance de resposta positiva e maior entre expostos. Se OR<1: A chance de resposta positiva e maior entre N expostos.
9
MODELO REGRESSÃO LOGÍSTICA
Variável Resposta: Variável categórica usualmente binária. Variáveis Explicativas: Variáveis mistas, contínuas ou categóricas, Para categóricas a inclusão é feita por meio de variáveis dummy.
10
Fonte: Hosmer e Lemeshow (1989)
Exemplo regressão logística Estudo sobre doença coronária, para cada faixa etária foram coletadas as frequências de indivíduos com e sem a doença: IDADE/Resp SIM NAO Totais 1 9 10 ... ... 60 -69 8 2 43 57 100 Fonte: Hosmer e Lemeshow (1989)
11
Exemplo regressão logística
resim<-c(1,2,3,5,6,5,13,8) resnao<-c(9,13,9,10,7,3,4,2) idade<-c(25,32,38,43,47,53,57,65) dados<-cbind(resim,resnao,idade) dados dados<-as.data.frame(dados) attach(dados) ajust<-glm(as.matrix(dados[,c(1,2)])~idade,family=binomial(link="logit"),data=dados)
12
Exemplo regressão logística
summary(ajust) Residual deviance: on 6 degrees of freedom cbind(ajust$fitted.values,ajust$y)
13
Exemplo regressão logística
### analise de resíduos par(mfrow=c(1,2)) plot(rpears, ylab="resíduos Pearson", pch=16, ylim=c(-2,2)) abline(h=0,lty=3) plot(dev, ylab="resíduos deviance", pch=16, ylim=c(-2,2)) abline(h=0,lty=3) ### Verificando Ajuste require(Epi) dados1<-read.table("~/Desktop/coronaria_linha.txt",h=T) head(dados1) ROC(form=y~idade,plot="ROC",data=dados1) - SENSIBILIDADE: TAXA DE VERDADEIROS POSITIVOS - ESPECIFICIDADE: TAVA DE VERDADEIROS NEGATIVOS
14
Interpretação prática
### INTERPRETACAO PRATICA OR <-(exp(0.1058*(65 -26))) [1] Podemos assim concluir que a odds de doença coronária entre indivíduos com 65 anos de idade é 61,9 vezes a dos indivı́duos com 26 anos.
15
referência bibliográfica
- Hosmer, D.W; Lemeshow, S (2000). Applied Logistic Regression. New York: John Wiley & Sons. - Giolo, S.R (2012). Introdução à análise de Dados categóricos com Aplicações. Material didático, 190p.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.