DISTRIBUIÇÃO NORMAL ou DE GAUSS

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Introdução ao processamento de dados e à estatística - parte 02
Algoritmos para Geração de Variáveis Aleatórias
Estatística amintas paiva afonso.
DISTRIBUIÇÃO NORMAL. O histograma por densidade é o seguinte: Exemplo : Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma.
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Bioestatística Profª. Janaína Jaeger
Capítulo 5 A Distribuição Normal de Probabilidade
Capítulo 7 Teste de Hipóteses
APLICAÇÕES COM EXCEL: Distribuição Binomial
QUESTÕES de 01 a 03 INSTRUÇÃO: Para responder a essas questões, identifique as afirmativas verdadeiras e, em seguida, marque na Folha de Respostas a alternativa.
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 5)
Estatística Aplicada (Aula 4)
Distribuição de probabilidade
Distribuição de probabilidade
Estatística Descritiva
ESTATÍSTICA.
Estatística e Probabilidade
ESTATÍSTICA.
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
ESTATÍSTICA.
ESTATÍSTICA.
ME623A Planejamento e Pesquisa
DISTRIBUIÇÃO NORMAL GAUSS ou LAPLACE CECILIA Q. ROKEMBACH
Distribuições Contínuas de Probabilidade
Distribuições Contínuas de Probabilidade
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
ESTATÍSTICA.
TESTES DE HIPÓTESES Spencer Barbosa da Silva
Estatística e Probabilidade
Revisão.
Exemplo 2: Lançamento de 4 moedas Considerando a quantidade de
Quais são, suas médias, medianas e modas?
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
Medidas de Dispersão ou de Variabilidade:
Distribuições de probabilidades referentes a variáveis contínuas e suas aplicações As variáveis contínuas podem assumir qualquer valor dentro de um intervalo.
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
TEORIA CINÉTICA DOS GASES Moléculas que colidem com a parede é
Aula 08 Medidas de posição - Prof. Diovani Milhorim
Estatística – Unidade 2.
ESTATÍSTICA.
Distribuição T - Student
Erros e variáveis aleatórias
Modelagem Estatística
AULA DE ESTATÍSTICA PROFESSOR RODRIGÃO.
distribuições normais
ESTATÍSTICA.
Site: Estatística Prof. Edson Nemer Site:
INTRODUÇÃO À ESTATÍSTICA APLICADA
ANÁLISE ESTATÍSTICA II
Estatística Inferencial (cap. 7 Martins)
ANÁLISE ESTATÍSTICA II
Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT
Aula 5 - Método experimental ou de seleção aleatória
Medidas de Dispersão Aula 8.
Noções de Inferência Estatística
Aula 14: Distribuição normal Prof. Diovani Milhorim
DISTRIBUIÇÃO NORMAL.
INFERÊNCIA ESTATÍSTICA PROPORÇÃO POPULACIONAL p
Distribuição Normal de Probabilidade
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
ANÁLISE DE DADOS EM BIOLOGIA
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Transcrição da apresentação:

DISTRIBUIÇÃO NORMAL ou DE GAUSS

Aderência à Distribuição Normal ou de Gauss PQNQC: Por que é importante que as variáveis possam ser descritas por uma distribuição normal?

Aderência à Distribuição Normal ou de Gauss Motivo é simples: Se as variáveis respeitam uma distribuição normal, pode-se aplicar a grande maioria dos testes e métodos estatísticos conhecidos.  tem-se maior facilidade!

Distribuição Normal ou de Gauss Muitas variáveis biológicas apresentam uma distribuição equilibrada, em que os valores centrais são mais freqüentes e os extremos, mais raros, sendo os valores muito baixos tão pouco freqüentes quanto os muito altos Tabela 09.01. Taxa de hemoglobina em 560 homens normais. Hemoglobina (g/100 mL) fi 12,5 |- 13,5 0,01 13,5 |- 14,5 0,06 14,5 |- 15,5 0,24 15,5 |- 16,5 0,38 16,5 |- 17,5 0,23 17,5 |- 18,5 0,07 18,5 |- 19,5

Distribuição Normal ou de Gauss Figura 09.01. Taxa de hemoglobina em 560 homens normais.

Medidas de tendência central e distribuições de freqüências Distribuição Simétrica Média, mediana e moda Distribuição com Assimetria Negativa moda mediana média Distribuição com Assimetria Positiva média mediana moda

Regra Empírica Cerca de 68% da área está a um desvio padrão da média. Cerca de 95% da área está a dois desvios padrão. Cerca de 99,7% da área está a três desvios padrão da média.

Propriedades ou características da curva normal Tem forma de sino Simétrica em relação à perpendicular que passa pela média (µ) A média, a mediana e a moda são coincidentes A curva tem dois pontos de inflexão, um desvio-padrão () acima e abaixo da média A área sob a curva totaliza 1 ou 100% Aproximadamente 68% (2/3) dos valores de x situam-se entre os pontos (µ-) e (µ+) Aproximadamente 95% dos valores de x estão entre (µ-2) e (µ+2) Aproximadamente 99,7% dos valores de x estão entre (µ-3) e (µ+3) Figura 09.02. Curva normal. A área hachurada está compreendida entre µ- e µ+ e corresponde a aproximadamente 68% da área total que fica abaixo da curva normal.

PROPRIEDADES 68% dos valores de X encontram-se entre os pontos ( - ) e (+). 95,5% dos valores de X encontram-se entre os pontos ( - 2) e (+2). 99,7% dos valores de X encontram-se entre os pontos ( - 3) e (+3).

Propriedades ou características da curva normal Utilidade Considere que a glicemia tenha distribuição normal, com média igual a 90 mg e desvio-padrão 5 mg na população de pessoas sadias. Pode-se concluir que: Aproximadamente 2/3 (68%) da população de indivíduos sadios possuem valores de glicemia entre (µ-) = 90-5 = 85 mg e (µ+) = 90+5 = 95 mg Grande parte (95%) das pessoas sadias tem glicemia entre (µ-2) = 90-2(5) = 80 e (µ+2) = 90+2(5) = 100 mg Praticamente todos (99,7%) os indivíduos da população tem valores entre (µ-3) = 75 e (µ+3) = 105 mg A probabilidade de que uma pessoa saudável tenha um valor de glicemia em jejum entre 90 (µ) e 95 (µ+) é de aproximadamente 0,34

A distância entre a média e um ponto qualquer é dado em número de desvios padrões (z) Normal padronizada Normal não padronizada z = x - µ  µ x 0 z P

Curva normal padronizada ou curva normal reduzida Propriedades da curva normal obtidas a partir da curva normal padronizada ou reduzida µ = 0 e  = 1 as áreas desta curva estão tabeladas z = nome da variável tabelada Quando z = 1 (z = ) a área entre este valor e a média é 0,3413 ou 34,13% A área entre z = -1 e z = +1 é 0,6826

Curva normal padronizada ou curva normal reduzida Exemplo 1. Qual a área correspondente a valores de z acima de 2,3? A curva toda tem área = 1, portanto a área a direita de zero é 0,5 Na tabela da curva normal, verifica-se que a área entre z = 0 e z = 2,3 é 0,4893 A área à direita de 2,3, portanto, é 0,5 – 0,4893 = 0,0107

Curva normal padronizada ou curva normal reduzida Exemplo 2. Qual a área compreendida entre z = -1,5 e z = 1? Segundo a tabela da curva normal, a área entre z = 0 e z = -1,5 é 0,4332 A área entre z = 0 e z = 1 é 0,3413 Portanto a área desejada é 0,4332 + 0,3413 = 0,7745

Transformação de uma variável x em z As variáveis observadas na prática (x) apresentam valores cujas áreas não estão tabeladas Os valores de x podem ser transformados na variável z, para obtenção das áreas na tabela da curva normal onde µ e  são a média e o desvio-padrão populacionais para a variável x

Volta

Distribuição Normal Padrão - + z z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4975 0,4976 0,4977 0,4978 0,4979 0,4980 0,4981 2,9 0,4982 0,4983 0,4984 0,4985 0,4986 3,0 0,4987 0,4988 0,4989 0,4990

Obtenção de uma área compreendida entre dois valores de x Exemplo 4. Um treinador deseja selecionar, dentre os jovens que estão prestando serviço militar no quartel Q, aqueles com uma estatura de no mínimo 180 cm, para formar um time de basquete. Que percentagem é esperada de jogadores em potencial, sabendo-se que a estatura tem distribuição normal e, nesses jovens, a média é 175 cm, e o desvio-padrão, 6 cm? Desenhar a curva normal, hachurando-se a área de interesse Transformar a variável estatura (x) na variável padronizada z

Obtenção de uma área compreendida entre dois valores de x Exemplo 4 Para x = 175, z = (x - µ)/ = (175-175)/6 = 0 Para x = 180, z = (180 – 175)/6 = 0,83 Verifica-se na tabela de distribuição da normal que a área entre z = 0 e z = 0,83 é 0,2967 e a área além de 0,83 é (0,5 – 0,2967) = 0,2033 Portanto, 20,33% dessa população são constituídos de indivíduos com estatura igual ou superior a 180 cm. Se 140 jovens estão prestando serviço militar no quartel Q, o número esperado de rapazes que pode ser convidado para participar do time de basquete é 20,33% de 140  0,2033 x 140 = 28,46, isto é, 28 jovens

Obtenção dos valores de x que limitam uma área conhecida Exemplo 5. Um pesquisador quer selecionar 10% de indivíduos que emergem primeiro da pupa, de uma população de moscas. Sabendo que o tempo médio de emergência é de 273 horas com desvio-padrão de 20 horas, qual o tempo-limite a partir do qual os indivíduos que emergem não interessam mais ao pesquisador?

Obtenção dos valores de x que limitam uma área conhecida Exemplo 5. A tabela de distribuição da normal mostra que z = -1,28 é o valor que separa uma área caudal correspondente a 0,10 da área e outra, adjacente a média, de 0,40 Transformando-se z em x, obter-se-á o tempo de desenvolvimento que limita uma área caudal de 10% à esquerda da curva de tempos de emergência Da fórmula de transformação (z = (x - µ)/), obtem-se que: -1,28 = (x-273)/20  -25,6 = x – 273  x = -25,6 + 273  x = 247,4  247h Ou seja, os indivíduos que levarem mais de 247 horas para emergirem serão descartados

Significância estatística de um desvio Os desvios da média que se encontram próximos da média populacional são considerados estatisticamente não significativos Fica estabelecido um intervalo ao redor da média, denominado intervalo de desvios não significativos, que corresponde a 95% dos valores da população – este valor é arbitrário e denomina-se área ou região de não significância (C) Os valores que ficarem fora do intervalo dos desvios não-significativos são considerados desvios significativos A letra  indica a região de significância ou nível de significância Os valores de  mais utilizados são  = 0,05,  = 0,01 e  = 0,001

Significância estatística de um desvio

Decisão sobre a significância estatística de um desvio entre a média amostral (x) e a média populacional (µ) Seqüência de procedimentos para se determinar a significância de um desvio Escolher inicialmente o critério ou o nível de significância desejado (por exemplo,  = 0,05) Obter o valor crítico de z da tabela (neste caso, z = z0,05 = 1,96) Calcular o afastamento entre a média amostral (x) e a média populacional (µ), ou seja x - µ, em erros-padrão, usando a fórmula: Regra de decisão Se |zcalc| < z, o desvio é dito “não-significativo” Se |zcalc|  z, o desvio é dito “significativo”

Decisão sobre a significância estatística de um desvio entre a média amostral (x) e a média populacional (µ) Exemplo 6 Um pesquisador verificou a pressão arterial de cinco executivos do sexo masculino, na faixa de 40 a 44 anos, escolhidos aleatoriamente, obtendo: 135; 143; 149; 128 e 158 mmHg média amostral = 142,6 mmHg Serão os dados suficientes para afirmar que os executivos apresentam pressão arterial sistólica diferente daquela observada na população de homens com essa idade? Na revisão de literatura, o pesquisador, verificou que, nessa população e faixa etária, a média de pressão arterial é 129 mmHg, com desvio-padrão de 15 mmHg

Decisão sobre a significância estatística de um desvio entre a média amostral (x) e a média populacional (µ) Exemplo 6 Dado que x = 142,6; µ = 129,0;  = 15; n = 5 e z = 1,96: Como zcalc = 2,03 > z0,05 = 1,96 Portanto, conclui-se que, para o critério escolhido, a média obtida dos cinco executivos (142,6) desvia-se significativamente da média da população de homens da mesma faixa etária, estando mais elevada

Decisão sobre a significância estatística de um desvio entre a média amostral (x) e a média populacional (µ) Exemplo 7 Considere a alcalinidade média do rio Caí como sendo de 19,6 mg de CaCO3/L, com desvio-padrão de 7,7 mg/L Você coletou 16 amostras de água e obteve uma média de 16,2 mg/L Esta média indica que houve alteração significativa na alcalinidade do rio?

Decisão sobre a significância estatística de um desvio entre a média amostral (x) e a média populacional (µ) Exemplo 7 Considerando  = 0,05, aplica-se a fórmula: Como |-1,77| < z0,05 = 1,96, conclui-se que não há evidências suficientes para se afirmar que houve alteração na alcalinidade deste rio, para  = 0,05

X: tempo gasto no exame vestibular  X ~ N(120; 152) Exemplo: O tempo gasto no exame vestibular de uma universidade tem distribuição Normal, com média 120 min e desvio padrão 15 min. a) Sorteando um aluno ao acaso, qual é a probabilidade que ele termine o exame antes de 100 minutos? X: tempo gasto no exame vestibular  X ~ N(120; 152) Z . Tabela

b) Qual deve ser o tempo de prova de modo a permitir que 95% dos vestibulandos terminem no prazo estipulado? X: tempo gasto no exame vestibular  X ~ N(120; 152) . Z z = ? tal que A(z) = 0,95. Pela tabela z = 1,64. x = 120 +1,64 15 x = 144,6 min. Tabela

c) Qual é o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame? X: tempo gasto no exame vestibular  X ~ N(120, 152) . Z z = ? tal que A(z) = 0,90 Pela tabela, z = 1,28.  x1= 120 - 1, 28  15  x1 = 100,8 min.  x2 = 120 +1,28  15  x2 = 139,2 min. Tabela