A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Projeto Linguagem R Heart Disease

Apresentações semelhantes


Apresentação em tema: "Projeto Linguagem R Heart Disease"— Transcrição da apresentação:

1 Projeto Linguagem R Heart Disease
Grupo: Alberto de Oliveira Martins Igor Ryan Bernardo Santos João Carlos Procópio Florêncio Maria Marcela Soares de Meira Lins

2 Introdução Doenças como infarto se propagam de modo assintomático
Dados da Organização Mundial de Saúde (OMS) estima 17,5 milhões de mortes por ano devido a problemas cardiovasculares Doenças como infarto se propagam de modo assintomático Impacto pode ser visualizado através de Estatística Descritiva

3 Dados de estudo Dados de pacientes internados nos hospitais de Cleveland, Ohio, USA Uso de fatores de risco para estudo: Taxa de Colesterol (em mg/dl) Pressão Sanguínea em Repouso Freqüência cardíaca máxima do paciente quando submetido a esforço físico Pico da depressão ST induzida pelo exercício Idade do paciente

4 Histogramas Gráficos usados para estimativas
Obtenção de classes usa métodos conceituais, porém não são precisos: Fórmula de Sturges: K = log n Fórmula de Freedman-Diaconis(Fórmula de FD) IQR é o intervalo entre o 1º quartil e o 3º quartil n é o tamanho da amostra.

5 Histogramas – Descrição das variáveis
CHOL: Colesterol mg/dl Considerado o fator de risco mais devastador das doenças cardiovasculares Atinge cada vez mais pessoas mais jovens, mesmo crianças Fator ocasiona cerca de 4,4 milhões de mortes por ano Média: Desvio Padrão: Mediana: 241 Moda: 197, 204, 234

6 Histogramas – Descrição das variáveis
Método de Sturges Mostra gráfico mais normalizado Positivamente desviado Método de Freedman-Diaconis (FD) Gráfico ligeiramente menos normalizado que o anterior Possui mais classes, trazendo mais detalhes

7 Histogramas – Descrição das variáveis
TRESTBPS: Pressão Sanguínea em Repouso Pressão exercida pelo sangue nos vasos sanguíneos Taxas elevadas de pressão podem danificar ou romper os vasos Variável aleatória contínua Média: Desvio Padrão: Mediana: 130 Moda: 120

8 Histogramas – Descrição das variáveis
Método de Sturges Mostra gráfico mais normalizado Positivamente desviado Método de Freedman-Diaconis (FD) Apresenta diversos picos no gráfico Histograma não recomendado se critérios de normalidade gráfica forem recomendados

9 Histogramas – Descrição das variáveis
OLDPEAK: Depressão ST Se refere a depressões anormais encontradas no eletrocardiograma É frequente sinal de isquemia no miocárdio Variável aleatória contínua Média: Desvio Padrão: Mediana: 0,8 Moda: 0,0

10 Histogramas – Descrição das variáveis
Método de Sturges Mostra gráfico mais normalizado Positivamente desviado Método de Freedman-Diaconis (FD) Apresenta diversos picos no gráfico Histograma não recomendado se critérios de normalidade gráfica forem recomendados

11 Histogramas – Descrição das variáveis
THALACH: Frequência cardíaca máxima alcançada Frequência cardíaca máxima alcançada durante esforço físico Pessoas com que atingem maior frequência cadíaca durante esforço físico indica sedentarismo Variável aleatória contínua Média: Desvio Padrão: Mediana: 153 Moda: 162

12 Histogramas – Descrição das variáveis
Método de Sturges Mostra gráfico mais normalizado Positivamente desviado Método de Freedman-Diaconis (FD) Apresenta diversos picos no gráfico Histograma não recomendado se critérios de normalidade gráfica forem recomendados

13 Histogramas – Descrição das variáveis
AGE: Idade Idade do paciente no momento da pesquisa Pessoas com idade mais avançadas tem maior risco de ter problemas do coração Variável aleatória discreta Média: Desvio Padrão: Mediana: 56 Moda: 58

14 Histogramas – Descrição das variáveis
Método de Sturges Mostra gráfico mais normalizado Positivamente desviado Método de Freedman-Diaconis (FD) Apresenta diversos picos no gráfico Histograma não recomendado se critérios de normalidade gráfica forem recomendados

15 Testes de Hipótese Sabe-se que homens costumam ter maior probabilidade infarto do que as mulheres. Acredita-se, então, que a probabilidade dos infartos nos homens esteja ligado a pressão alta em repouso. Prove por teste de hipótese com nível de significância de 95% e 99% que homens têm pressão sanguínea maior que o das mulheres.

16 Testes de Hipótese Dados: N: 33 indivíduos tanto para a amostra de homens quanto para a de mulheres. Hipótese Nula: Homens possuem pressão sanguínea mais elevada que mulheres.

17 Testes de Hipótese Os dados gerados em R para nível de significância = .05: Welch Two Sample t-test data: pre and premu t = , df = , p-value = alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: sample estimates: mean of x mean of y

18 Testes de Hipótese Para nível de significância = .01
Welch Two Sample t-test data: pre and premu t = , df = , p-value = alternative hypothesis: true difference in means is not equal to 99 percent confidence interval: sample estimates: mean of x mean of y

19 Testes de Hipótese Estima-se que a média de nível de colesterol da população mundial é de 235mg/dL com desvio padrão de 40mg/dL. Teste a hipótese de que esta é uma amostra representativa da população mundial com nível de significância de 95%.

20 Testes de Hipótese Dados: μ = 235,0 mg/dL x = 245.3824 mg/dL
N = 34 indivíduos Hipótese Nula: A média de colesterol dos individuas da amostra é igual a média dos indivíduos da população.

21 Testes de Hipótese data: c t = 1.3729, df = 33, p-value = 0.1790
alternative hypothesis: true mean is not equal to 235 95 percent confidence interval: sample estimates: mean of x


Carregar ppt "Projeto Linguagem R Heart Disease"

Apresentações semelhantes


Anúncios Google