Bioestatística Profª. Janaína Jaeger

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Aprendizado de Máquina
Estatística amintas paiva afonso.
DISTRIBUIÇÃO NORMAL. O histograma por densidade é o seguinte: Exemplo : Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma.
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Amostragem: noções básicas Metodologia Científica
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 5 A Distribuição Normal de Probabilidade
Capítulo 6 Estimativas e Tamanho de Amostras
Capítulo 7 Teste de Hipóteses
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 4)
Distribuição de probabilidade
Distribuição de probabilidade
Intervalo de Confiança para a média da população
Estatística Descritiva
DISTRIBUIÇÃO NORMAL ou DE GAUSS
Estatística e Probabilidade
ESTATÍSTICA.
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
ESTATÍSTICA.
ME623A Planejamento e Pesquisa
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
Estatística e Probabilidade
Distribuições de probabilidades referentes a variáveis contínuas e suas aplicações As variáveis contínuas podem assumir qualquer valor dentro de um intervalo.
DISTRIBUIÇÕES AMOSTRAIS
Distribuição T - Student
Modelagem Estatística
AULA DE ESTATÍSTICA PROFESSOR RODRIGÃO.
Amostragem Pontos mais importantes:
distribuições normais
Site: Estatística Prof. Edson Nemer Site:
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT
Inferência Estatística
Teste de Hipótese.
Introdução à Estatística
Medidas de Dispersão Aula 8.
Noções de Inferência Estatística
Aula 11 - Teste de hipóteses, teste de uma proporção
COMPARAÇÃO DE DUAS POPULAÇÕES
Estatística Aplicada Aula 8
Aula 14: Distribuição normal Prof. Diovani Milhorim
DISTRIBUIÇÃO NORMAL.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
Testes de Hipóteses.
Distribuição Normal de Probabilidade
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
ANÁLISE DE DADOS EM BIOLOGIA
SPSS Guia Prático para Pesquisadores
VARIÁVEL ALEATÓRIA Profa. Ana Clara Guedes. Tomemos o exemplo da variável “peso ao nascer”. A variabilidade dos pesos ao nascer de meninos, com mesma.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Distribuição Amostral 3 Miguel Angel Uribe Opazo.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Transcrição da apresentação:

Bioestatística Profª. Janaína Jaeger Distribuição Amostral das Médias Bioestatística Profª. Janaína Jaeger

Investigações sobre problemas biológicos sempre envolvem mais do que um indivíduo (com exceção dos relatos de casos clínicos); Motivo: fenômenos biológicos → resultados que variam; Ao comparar resultados obtidos em situações diferentes, os pesquisadores desejam considerar a variabilidade entre observações; Para se conhecer a variabilidade de uma característica → se mede mais do que uma unidade experimental ; AMOSTRAS (grupo de indivíduos); Variáveis quantitativas: média e desvio padrão são importantes para elaborar conclusões.

- Problema típico: avaliar se um determinado conjunto de dados difere de um padrão tomado como referência. Ex: Considere a alcalinidade média no rio Jacuí como sendo de 19,6 mg de CaCO3/L (medida em 1992). Se em uma amostra recente (medida em 2011) de 16 observações a média for 16,2 mg, estará ela indicando que a alcalinidade no rio se modificou? - Pontos a considerar: Padrão tomado como referência: 19,6 mg Diferença entre as médias (2011 – 1992): 16,2 – 19,6 = - 3,4 mg Pergunta: a diferença obtida (- 3,4 mg) pode ser atribuída a uma diminuição real na alcalinidade ou a um erro aleatório, já que a média 16,2 mg está baseada em uma amostra de apenas 16 dados?

DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS (DAM) Para decidir sobre a significância estatística da diferença entre uma média amostral (16,2 mg) e o parâmetro tomado como referência (19,6 mg), é necessário saber como é o comportamento aleatório das médias amostrais, isto é, como é a sua distribuição probabilística: DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS (DAM)

DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS (DAM) Imagine uma população hipotética de 4 valores: x = 10 20 30 40 Média = 10 + 20 + 30 + 40 / 4 = 100 / 4 = 25

Retire agora dessa população todas as amostras aleatórias possíveis de 2 elementos: Valores Média da Amostra 1 (10, 10) 10 2 (10, 20) 15 3 (10, 30) 20 4 (10, 40) 25 5 (20, 10) 6 (20, 20) 7 (20, 30) 8 (20, 40) 30 9 (30, 10) (30, 20) 11 (30, 30) 12 (30, 40) 35 13 (40, 10) 14 (40, 20) (40, 30) 16 (40, 40) 40 16 amostras possíveis

A) Distribuição de frequência dos valores de x em uma população de 4 valores igualmente prováveis; B) Distribuição de frequência das médias de 2 elementos obtidas dessa população quanto maior a amostra, mais próximo da normalidade se distribui a curva representando a média de todas as amostras possíveis, retiradas aleatoriamente de uma população.

Curva Normal ou de Gauss Apesar dos 4 valores de x serem igualmente frequentes (fr = 0,25 para cada um) na população original, as médias amostrais com valor próximo de 25 são mais comuns do que as médias mais extremas; Quando as amostras são grandes, as médias de todas as amostras possíveis, de igual tamanho e retiradas aleatoriamente de uma população, distribuem-se segundo uma curva normal = Teorema do Limite Central. Curva Normal ou de Gauss

Propriedades da curva de Gauss Forma de sino, com caudas que jamais tocam o eixo x (valores de x podem variar de -  a + ). Na prática, no entanto, utiliza-se a curva normal com limites finitos; A curva é simétrica em relação à perpendicular que passa pela média (); A média, a mediana e a moda são coincidentes; A curva tem dois pontos de inflexão, que correspondem a valores de x situados, respectivamente, à distância de um desvio padrão () acima e abaixo da média; A área sob a curva totaliza 1 ou 100%; Aproximadamente 68% (2/3) dos valores de x situam-se entre os pontos ( - ) e ( + ); Aproximadamente 95% dos valores estão entre ( - 2) e ( + 2); Aproximadamente 99,7% dos valores estão entre ( - 3) e ( + 3).

TRANSFORMAÇÃO DE UMA VARIÁVEL X EM Z As variáveis na prática (x) apresentam valores cujas áreas não estão tabeladas; Os valores de x podem ser transformados na variável z e então as áreas desejadas podem ser obtidas da tabela de curva normal: z = x -   Z pode ser interpretado como: o número de desvios padrão envolvidos no afastamento de um determinado valor de x em relação à média.

Exemplo 1: Um treinador deseja selecionar, dentre os jovens que estão prestando serviço militar no quartel, aqueles com estatura, no mínimo de 180cm, para formar um time de basquete. Que percentagem é esperada de jogadores em potencial, sabendo-se que a estatura tem distribuição normal e, nesses jovens, a média é 175cm e o desvio padrão 6cm?

Exemplo 2: No estudo de genética do desenvolvimento da mosca das frutas, um procedimento importante consiste em criar uma população de indivíduos precoces para o desenvolvimento. O tempo decorrido entre a ovoposição e a emergência do adulto é, em média, 273 horas, com desvio padrão de 20 horas. Suponha que um geneticista deseje selecionar 10% da população, correspondendo aos indivíduos que emergem primeiro, para desenvolver uma população precoce. Qual o tempo limite a partir do qual os indivíduos que nascem não interessam mais ao pesquisador?

CARACTERÍSTICAS DA DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS DAM (1) Se a variável x tem distribuição normal, as médias de todas as amostras aleatórias de igual tamanho, originárias dessa população, distribuem-se também segundo uma curva de Gauss. Se a distribuição de x não for gaussiana, são necessárias amostras grandes para que a DAM seja uma distribuição normal; (2) A distribuição amostral das médias tem centro em  (isto é, na média da população amostrada). A variabilidade é expressa pelo desvio padrão das médias ou erro padrão da média, σ (média). O erro padrão é obtido pela fórmula:

CARACTERÍSTICAS DA DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS DAM (3) Como a distribuição amostral das médias é uma curva normal, a área total sob a DAM é 1 Aproximadamente 68% das médias estão entre m – EP amostral e m + EP amostral. Aproximadamente 95% das médias estão entre m – 2EP amostrais e m + 2EP amostrais.

SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO Vamos supor que se esteja estudando a variável “estatura” em universitárias gaúchas e a média seja de 170 cm; 175 cm? Essa pessoa é maior que a média????? Tem uma diferença significativa entre 175 cm e 170 cm????? 175 cm é estatisticamente diferente de 170cm????? Um critério científico para o estabelecimento de uma diferença não pode ser uma questão de opinião, mas um critério objetivo! Qual o critério estatístico utilizado?????

Critério estatístico Um critério estatístico pressupõe que: A distribuição de valores seja Gaussiana; Os valores desviantes sejam uma fração pequena da população e que esta fração seja determinada a priori. Atitude razoável: considerar como estatisticamente não-significativos os desvios apresentados por valores ao redor da média populacional: 95% dos valores ao redor da média são considerados desvios não-significativos (47,5% acima e abaixo); Valores fora da área de desvios não significativos (5%) são considerados desvios significativos (2,5% acima e abaixo) → α (região ou nível de significância do teste).

C = 1 - a Critério estatístico Os valores de α mais usados em ciências biológicas e da saúde são: α = 0,05 ; C = 0,95 α = 0,01 ; C = 0,99 α = 0,001 ; C = 0,999

Exemplo 3: Certo pesquisador mediu a pressão arterial de cinco executivos do sexo masculino, na faixa de 40 a 44 anos, escolhidos aleatoriamente, e obteve os valores 135; 143; 149; 128 e 158 mmHg. A média observada nessa amostra foi 142,6 mmHg. A média da pressão arterial sistólica populacional é 129 mmHg e o desvio padrão é 15 mmHg. Serão esses dados suficientes para afirmar que os executivos apresentam pressão arterial sistólica diferente daquela observada na população de homens com essa idade? O intervalo  ± 1,96 x (erro padrão da média amostral) determina uma região de 95% de desvios não significativos e 5% de desvios significativos. O intervalo  ± 2,58 x (erro padrão da média amostral) determina uma região de 99% de desvios não significativos e 1% de desvios significativos.

Nesse caso, o nível de significância escolhido foi α = 5% Como se calcula o erro padrão da média amostral????? O erro padrão para a pressão sistólica, referente a amostra com n=5 retirada aleatoriamente da população de homens com 40 – 44 anos é: Os limites do intervalo de não-significância, portanto, são:  - 1,96  (x) = 129 – 1,96(6,7) = 129 – 13,1 = 115,9 (limite inferior do intervalo)  + 1,96  (x) = 129 + 1,96(6,7) = 129 + 13,1 = 142,1 (limite superior do intervalo)

142,6 mmHg está acima do limite superior (142,1 mmHg) Assim, as médias amostrais com valores entre 115,9 e 142,1 mmHg não apresentam desvios significativos em relação à média populacional. Médias com valores fora desse intervalo desviam-se significativamente de  = 129. 142,6 mmHg está acima do limite superior (142,1 mmHg) A média obtida nos 5 executivos é estatisticamente diferente da média da população de homens da mesma faixa etária, ou seja, é mais elevada!

Uma forma alternativa para decidir sobre a significância de um desvio Ao invés de calcular os limites inferior e superior, esta forma alternativa calcula o desvio em unidades de erros padrão e depois compara o valor obtido com o número crítico de erros padrão escolhido ???????????

Escolher inicialmente o critério, ou o nível de significância desejado (por exemplo, α = 0,05); Obter o valor crítico de z da tabela (nesse caso, zα = z0,05 = 1,96); Calcular o afastamento entre x e , em erros padrão: A média amostral está a 2,03 erros padrão acima de . Regra de decisão: Conclusão: A média da amostra de executivos desvia-se significativamente (para mais) da média de adultos dessa faixa etária, para α = 0,05.

Nunca esquecer… a conclusão “a pressão arterial está aumentada nos executivos” tem uma probabilidade de erro que é igual ao tamanho da região de significância (0,05), ou seja, existe 5% de probabilidade que os estudantes de 20 a 25 anos NÃO tenham a pressão maior que a média da população (simples acaso).

Afinal, a alcalinidade do Rio Jacuí está ou não alterada? m = 19,6 mg de CaCO3/L σ = 7,7 mg/L Média amostral = 16,2 mg/L Amostra com 16 valores (n) a = 0,05