A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno

Apresentações semelhantes


Apresentação em tema: "Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno"— Transcrição da apresentação:

1 Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno
Departamento de Medicina Preventiva UNIFESP - EPM

2 Questão de investigação (Hipótese)
Estratégia Objetivos Tipo de estudo Amostra Coleta de dados Análise dos dados Tipo de variávels Conclusões Observação

3 INFERÊNCIA ESTATÍSTICA

4 Distrito do Sacomã 372 óbitos por doenças do aparelho circulatório (DAC) Sexo Masculino Feminino Total N (%) 202 (54,3%) 170 (45,7%) 372 (100%) Idade média (anos) 65,2 72,8 68,7 Idade mediana (anos) 68,0 75,0 71,0 Desvio padrão (anos) 14,2 14,7 14,9

5 3 amostras dos óbitos por DAC (n=100)
Distrito do Sacomã 3 amostras dos óbitos por DAC (n=100) Sexo Masculino Feminino Total Amostra 1, N (%) 44 (44%) 56 (56%) 100 (100%) Idade média (anos) 64,4 72,1 68,7 Idade mediana (anos) 68,0 75,5 72,0 Desvio padrão (anos) 12,8 16,4 15,3 Amostra 2, N (%) 61 (61%) 39 (39%) 67,8 74,5 70,4 70,0 80,0 71,0 12,3 14,0 13,3 Amostra 3, N (%) 64,1 74,7 68,2 66,0 79,0 13,9 16,2 15,6

6 Sabendo-se que, no Sacomã, a idade média dos sujeitos que morreram por DAC é igual a 68,7 anos, deseja-se saber se a idade média encontada entre aqueles da amostra 2 (70,4 anos; dp=13,3 anos) é semelhante àquela da população do Sacomã.

7 Qual é a variável? Idade Qual a distribuição de probabilidades que pode ser utilizada para responder a pergunta?

8 =68,7 Mediana=71 =14,9

9 A DISTRIBUIÇÃO NORMAL

10

11 A distribuição normal média e o desvio padrão [x ~ N(μ, σ2)]
 unimodal, simétrica, e o seu valor de máxima freqüência (moda) coincide com o valor da média e da mediana   campo de variação: de - ∞ a + ∞ a área sob a curva normal vale 1, sendo a freqüência total sob a curva igual a 100%. Assim, a curva normal é uma distribuição que possibilita determinar probabilidades associadas a todos os pontos da linha de base 

12 População

13 Qual é a probabilidade de um indivíduo (óbito), escolhido ao acaso, ter valor de idade entre 68,7 e 74,7 anos? =68,7 ? =14,9

14 Qual é a probabilidade de um indivíduo (óbito), escolhido ao acaso, ter valor de idade entre 68,7 e 74,7 anos? Se a média=68,7 e x=74,7 então =68,7 ? =14,9 Assim, se Z = 0,40, temos, a partir da Tabela (Distribuição de Z) que essa probabilidade é igual a 15,54%

15 Distribuição de Z - curva normal padrão - ( = 0;  = 1).
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

16 Amostras

17 Teorema Central do Limite
Para amostras grandes a distribuição das médias amostrais será aproximadamente normal tenderá a uma distribuição normal à medida que o tamanho de amostra aumentar

18

19 Distribuição das médias das amostras

20 Distribuição das médias das amostras

21 Média: Variância: DESVIO PADRÃO E ERRO PADRÃO

22 De volta ao exemplo ….

23 O valor de Z é grande ou pequeno?
Sabendo-se que, no Sacomã, a idade média dos sujeitos que morreram por DAC é igual a 68,7 anos, deseja-se saber se a idade média encontada entre aqueles da amostra 2 (70,4 anos; dp=13,3 anos) é semelhante àquela da população do Sacomã. ? Qual a decisão? O valor de Z é grande ou pequeno?

24 Teste de Hipóteses Regra de decisão
Tem-se sempre duas hipóteses, H0 , que é a hipótese nula e a hipótese alternativa e H1 ou HA Tipos de erro: Erro Tipo I (α) Erro Tipo II (β)

25 Decisão Verdade H0 HA Decisão correta (1-) coeficiente de confiança
Erro tipo I () nível de significância Erro tipo II () (1-) poder do teste

26 Teste de uma média Amostra: População: H0:  = 0 (= 68,7 anos)
média = 70,4 anos s = 13,3 anos n = 100 População: 0 = 68,7 anos H0:  = 0 (= 68,7 anos) HA:  ≠ (>) 0  =0,05 (5%) Zcrítico = 1,64 (1,96) Se Z > Zcrítico rejeita-se H0 (Z < Zcrítico) – Aceita-se H0 p = 0,3997 (nivel descritivo do teste)

27 Distribuição de Z - curva normal padrão - ( = 0;  = 1).
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

28 Se n < 30 distribuição t de Student
depende do grau de liberdade da amostra (gl = n-1) com amostras de tamanho ≥ 30, os valores de "z" e de "t" levam praticamente aos mesmos resultados

29 Distribuição de t de Student
gl\ 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001 01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619 02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598 03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924 04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 05 0,132 0,267 0,408 0,559 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 3,499 5,408 08 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781 10 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587 11 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073 16 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,257 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,127 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,391 0,533 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850 21 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 22 0,256 0,390 0,858 1,321 1,717 2,074 2,508 2,819 3,792 23 0,685 1,060 1,319 1,714 2,069 2,500 2,807 3,767 24 0,531 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745 25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726 26 1,315 1,706 2,056 2,479 2,779 27 0,389 1,057 1,314 1,703 2,052 2,473 2,771 3,690 28 0,530 0,683 1,056 1,313 1,701 2,048 2,467 2,763 3,674 29 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659 30 1,310 1,697 2,042 2,457 2,750 3,646 40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551 60 0,254 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460 120 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373 i 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,291

30 Exercício Em indivíduos normais quanto à visão, a pressão intra-ocular é uma variável aleatória normalmente distribuída com média 20 mmHg. Um médico oftalmologista, querendo por à prova a sua hipótese de que o glaucoma causa um aumento tencional, mediu as pressões de 100 pacientes com glaucoma, obtendo uma média igual a 24 mmHg e variância 4 mmHg. O cientista deve ou não manter sua hipótese, ao nível de significância α = 0,005?  = 0,005 H0:  = 20 mmHg HA:  > 20 mmHg  =0,005 (0,5%), Zcrítico = 2,58 Z > Zcrítico Rejeita-se H0

31 TESTE DE HIPÓTESES PARA UMA PROPORÇÃO

32 Sabendo-se que, no Sacomã, a porcentagem de mulheres que morreram por DAC é 45,7%, deseja-se saber se, na amostra 1 (56%), esse valor é semelhante.

33 Qual é a variável? Proporção de mulheres (Número de mulheres) Qual a distribuição de probabilidades que pode ser utilizada para responder a pergunta?

34 DISTRIBUIÇÃO BINOMIAL

35 Coeficientes binomiais
(triângulo de Pascal)

36 Seja E um experimento com apenas 2 resultados mutuamente excludentes possíveis: S (sucesso) e F (fracasso) Seja p a probabilidade de ocorrência de S e q a probabilidade de ocorrência de F Se o experimento E for repetido N vezes de forma independente, em cada vez mantendo-se o mesmo valor de p e de q a probabilidade de ocorrer X = x (número de sucessos) é dada por

37 n e p caracterizam a distribuição binomial e são chamados parâmetros da distribuição

38 Variável aleatória: proporção de sucessos (p)
Média (proporção esperada de sucessos) = p Variância = Variável aleatória: número de sucessos Média (número esperado de sucessos) = np Variância = npq

39 Distribuição Binomial
p n x 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95 1 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000 0,4500 0,4000 0,3500 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 2 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2025 0,1600 0,1225 0,0900 0,0625 0,0400 0,0225 0,0100 0,0025 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 3 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 0,0911 0,0640 0,0429 0,0270 0,0156 0,0080 0,0034 0,0010 0,0001 0,1354 0,2430 0,3251 0,3840 0,4410 0,4436 0,4320 0,4084 0,3341 0,2880 0,2389 0,1890 0,1406 0,0960 0,0574 0,0071 4 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0410 0,0256 0,0150 0,0081 0,0039 0,0016 0,0005 0,0000 0,1715 0,2916 0,3685 0,4116 0,3845 0,3456 0,2995 0,2005 0,1536 0,1115 0,0756 0,0469 0,0115 0,0036 0,0135 0,0486 0,0975 0,2109 0,2646 0,3105 0,3675 5 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,0185 0,0102 0,0053 0,0024 0,0003 0,2036 0,3281 0,3915 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 0,1128 0,0768 0,0488 0,0284 0,0146 0,0064 0,0022 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3369 0,3125 0,2757 0,2304 0,1811 0,1323 0,0879 0,0512 0,0244 0,0011 6 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0083 0,0041 0,0018 0,0007 0,0002 0,2321 0,3543 0,3993 0,3932 0,3560 0,2437 0,1866 0,1359 0,0938 0,0609 0,0369 0,0205 0,0044 0,0015 0,0004 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 0,1861 0,0951 0,0595 0,0330 0,0154 0,0055 0,0012 0,0021 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 7 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 0,0037 0,0006 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 0,0320 0,0172 0,0084 0,0013 0,0406 0,1240 0,2753 0,3177 0,2985 0,2613 0,2140 0,1641 0,1172 0,0774 0,0466 0,0250 0,0043 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 0,2388 0,1935 0,1442 0,0972 0,0577 0,0287 0,0109 0,0026

40 Do Teorema Central do Limite ...

41

42 De volta ao exemplo ...

43 Como Z > Zcrítico rejeita-se H0
Sabendo-se que, no Sacomã, a porcentagem de mulheres que morreram por DAC é 45,7%, deseja-se saber se, na amostra 1 (56%), esse valor é semelhante. Amostra: n = 100 p = 56% (56) População: p = 45,7% H0:  = 0 (46%) HA:  ≠ 0  =0,05 (5%) Média = np = (100 x 0,46)= 46 (no. esperado de ♀ na amostra) Desvio padrão = Zcrítico = 1,64 Como Z > Zcrítico rejeita-se H0

44 Outro exemplo

45 Deseja-se saber se a eficácia de um novo medicamento (droga nova, DN) é superior ao medicamento tradicional (droga atual, DA) utilizado no tratamento de uma determinada doença. Sabe-se que a eficácia da DA é de 50%. A nova droga foi utilizada em 10 pacientes (n = 10) e 9 se curaram. Pode- se concluir que a nova droga tem maior eficiência que a tradicional? H0: DN = DA H1: DN > DA  = 5%

46 Sob H0 (n=10 e p=0,5) X (número de curas) P (X=x) 0,001 1 0,010 2
0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 7 8 9 10

47 X (número de curas) P (X=x) 0,001 Área de aceitação de H0 1- = 94,5% 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 7 8 Área de rejeição de H0  = 5,5% 9 10

48 Qui-quadrado

49 Teste não paramétrico (não depende dos parâmetros populacionais, como média e variância)
Comparar proporções (divergências entre as freqüências observadas e esperadas para um certo evento) Pode-se dizer que dois grupos se comportam de forma semelhante se as diferenças entre as freqüências observadas e as esperadas em cada categoria forem muito pequenas, ou seja, próximas a zero

50 Pressuposições os grupos são independentes, seleção aleatória
as observações devem ser contagens cada observação pertence a uma e somente uma categoria e a amostra deve ser relativamente grande (pelo menos 5 observações em cada célula)

51 Resposta ao teste sorológico
Exemplo Resposta ao teste sorológico Positiva Negativa Total Idade N % 0 a 10 anos 25 35,7 45 64,3 70 100 11 a 18 anos 15 37,5 62,5 40 19 a 30 anos 10 25,0 30 75,0 50 33,3 66,7 150

52 H0: não existe associação entre as variáveis H1: existe associação entre as variáveis : 5%
Tabela esperada Resposta ao teste Idade Positiva Negativa Total 0 a 10 anos 23,3 46,7 70 11 a 18 anos 13,3 26,7 40 19 a 30 anos 13,4 26,6 50 100 150 2 crítico para 2 graus de liberdade = 5,991

53

54 Distribuição de Qui quadrado - 2
GL\P 0,99 0, , , , , , , ,l0 0, , ,0l 0,00l 0l , , ,0l6 0, ,l48 0,455 l,074 l, , ,84l 5,4l2 6,635 l0,827 02 0, l03 0,2ll 0, ,7l3 1, , , , , , , ,815 03 0, , , , , , , , , , , , ,266 04 0, , , , , , , , , , , , ,467 05 0, , , , , , , , , , , , ,515 06 0, , , , , , , , , , , , ,457 07 1, , , , , , , , , , , , ,322 08 1, , , , , , , , , , , , ,125 09 2, , , , , , , , , , , , ,877 10 2, , , , , , , , , , , , ,588 11 3, , , , ,l48 l0,34l l2,899 l4,63l l7,275 l9, ,6l8 24,725 3l,264 l2 3,57l 5, , , ,034 ll,340 l4,0ll l5,8l2 l8,549 2l, , ,2l7 32,909 13 4,l07 5, , , ,926 l2,340 l5,ll9 l6,985 l9,8l2 22, , , ,528 14 4, , , ,467 l0,821 l3,339 l6,222 l8,l5l 21, , , ,l4l 36,123 15 5, ,26l 8,547 l0,307 ll,721 l4,339 l7,322 l9, , , , , ,697 16 5, , ,312 ll,l52 l2,624 l5,338 l8,4l8 20, , , , , ,252 17 6, ,672 l0,085 l2,002 l3,531 l6,338 l9, , , , , ,790 18 7,0l5 9,390 l0,865 l2,857 l4,440 l7, ,60l 22, , , , , ,312 19 7,633 l0,ll7 ll,651 l3,7l6 l5,532 l8, , , , ,l44 33, ,l9l 43,820 20 8,260 l0,85l l2,443 l4,572 l6,266 l9, , , ,4l2 31,4l0 35, , ,315

55 Exercício Com os dados da Tabela, verifique se existe associação entre as variáveis. O hábito de beber é causa da doença? Condição Hábito de beber Doente Não doente Total Sim 40 80 Não 20 100 120 60 140 200

56


Carregar ppt "Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno"

Apresentações semelhantes


Anúncios Google