A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Conceitos básicos em análise de dados categóricos

Apresentações semelhantes


Apresentação em tema: "Conceitos básicos em análise de dados categóricos"— Transcrição da apresentação:

1 Conceitos básicos em análise de dados categóricos
Rafaela Helbing

2 Agenda 1. Introdução - Exemplos de aplicação 2. Estudo Coorte
- Conceitos básicos 2. Estudo Coorte 3. Regressão Logística

3 Aplicações - Área Clínica: Análise da ocorrência ou não de determinada doença. - Seguros: Análise de risco de clientes. - Financeira: Segmentação de grupos de risco para crédito. Importante:  Variável Resposta: Categórica (distribuições discretas de probabilidade – Binomial, Poisson...)  Variáveis Explicativas: Contínuas ou Categóricas.

4 Características Variáveis Categóricas
Dicotômicas ou binárias: Apenas 2 categorias. Politômicas: Mais de 2 categorias. Ordinais: Apresentam categorias ordenadas (baixo, médio, alto). Nominais: Não apresentam categorias ordenadas (gênero, cor dos olhos).   

5 Estudo coorte Sadios Doentes Sadios Doentes Amostra População Expostos
Não Expostos Doentes Longitudinal

6 Exemplo coorte Odds ou Chance:
Exposição/ Resp SIM NAO Totais Exposto 80 20 100 N Exposto 25 75 105 95 200 Odds ou Chance:  (Prob. evento ocorrer) / (Prob. evento não ocorrer) Odds Ratio:   Odds exposto/ Odds N exposto Risco Relativo:  (Prob. do evento ocorrer exposto) /  (Prob. do evento ocorrer N exposto)   

7 Aplicação EM R dados<-matrix(c(80,25,20,75),nc=2) head(dados)
p11<-(dados[1,1]/(sum(dados[1,]))) p21<-(dados[2,1]/(sum(dados[2,]))) RR<-p11/p21 OR<-(dados[1,1]*dados[2,2])/(dados[1,2]*dados[2,1]) fisher.test(dados)  

8 interpretação prática
Se OR= 1: A chance de resposta positiva não difere entre expostos e não expostos. Se OR>1: A chance de resposta positiva e maior entre expostos. Se OR<1: A chance de resposta positiva e maior entre N expostos.

9 MODELO REGRESSÃO LOGÍSTICA
Variável Resposta:  Variável categórica usualmente binária.  Variáveis Explicativas: Variáveis mistas, contínuas ou categóricas, Para categóricas a inclusão é feita por meio de variáveis dummy.

10 Fonte: Hosmer e Lemeshow (1989)
Exemplo regressão logística Estudo sobre doença coronária, para cada faixa etária foram coletadas as frequências de indivíduos com e sem a doença: IDADE/Resp SIM NAO Totais 1 9 10 ...  ... 60 -69 8 2 43 57 100 Fonte: Hosmer e Lemeshow (1989)

11 Exemplo regressão logística
resim<-c(1,2,3,5,6,5,13,8) resnao<-c(9,13,9,10,7,3,4,2) idade<-c(25,32,38,43,47,53,57,65) dados<-cbind(resim,resnao,idade) dados dados<-as.data.frame(dados) attach(dados) ajust<-glm(as.matrix(dados[,c(1,2)])~idade,family=binomial(link="logit"),data=dados)

12 Exemplo regressão logística
summary(ajust) Residual deviance:    on 6  degrees of freedom cbind(ajust$fitted.values,ajust$y)

13 Exemplo regressão logística
### analise de resíduos par(mfrow=c(1,2)) plot(rpears, ylab="resíduos Pearson", pch=16, ylim=c(-2,2)) abline(h=0,lty=3)     plot(dev, ylab="resíduos deviance", pch=16, ylim=c(-2,2)) abline(h=0,lty=3) ### Verificando Ajuste require(Epi) dados1<-read.table("~/Desktop/coronaria_linha.txt",h=T) head(dados1) ROC(form=y~idade,plot="ROC",data=dados1) - SENSIBILIDADE: TAXA DE VERDADEIROS POSITIVOS - ESPECIFICIDADE: TAVA DE VERDADEIROS NEGATIVOS

14 Interpretação prática
### INTERPRETACAO PRATICA OR <-(exp(0.1058*(65 -26))) [1] Podemos assim concluir que a odds de doença coronária entre indivíduos com 65 anos de idade é 61,9 vezes a dos indivı́duos com 26 anos.

15 referência bibliográfica
- Hosmer, D.W; Lemeshow, S (2000). Applied Logistic Regression. New York: John Wiley & Sons.  - Giolo, S.R (2012). Introdução à análise de Dados categóricos com Aplicações. Material didático, 190p.


Carregar ppt "Conceitos básicos em análise de dados categóricos"

Apresentações semelhantes


Anúncios Google