A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula 5 Bioestatística. Estatísticas para uma variável.

Apresentações semelhantes


Apresentação em tema: "Aula 5 Bioestatística. Estatísticas para uma variável."— Transcrição da apresentação:

1 Aula 5 Bioestatística

2 Estatísticas para uma variável

3 Estatísticas Estatísticas são funções de uma amostra. De um modo geral, uma estatística boa deve representar alguma característica da variável em estudo. Estatísticas também são conhecidas pelo nome de “estimadores”. Vamos estudar dois grupos de estatísticas: Medidas de Tendência Central Medidas de Dispersão

4 Medidas de Tendência Central São estatísticas que visam representar um indivíduo típico da população, ou um resultado típico do fenômeno aleatório estudado. As estatísticas de tendência central mais utilizadas são: média, mediana e moda.

5 Média Aritmética A média aritmética calcula o baricentro (ponto de equilíbrio) do gráfico de barras ou do histograma. Em muitas ocasiões, o baricentro está na região com maior concentração de dados, fazendo com que a média seja um bom candidato para representar os dados. É comum denotar a média aritmética dos valores de uma amostra por média amostral.

6 Média Aritmética: Dados Brutos Para calcular a média: Passo 1 – Some todos os valores da amostra. Passo 2 – Divida o valor encontrado no Passo 1 pelo tamanho da amostra. O resultado será a média da amostra.

7 Exemplo 1.: Cálculo da Média Considere a amostra: 1,1,2,4,4,6. Somando todos os valores: 1+1+2+4+4+6 = 18 Dividindo pelo tamanho da amostra: 18/6 = 3. Portanto, a média amostral é igual a 3.

8 Exemplo 2: Média e Histograma

9 Média Aritmética: Tabela de Frequências Passo 0. Construa uma tabela de frequências dessa forma: Passo 1. Para cada coluna, multiplique a primeira linha pela segunda. Passo 2. Some os resultados obtidos no Passo 1. Tal soma será o valor da média amostral Resultados x1x2...xd Freq. relativa f1f2...fd Resultados x1x2...xd Freq. relativa f1f2...fd Produto x1 f1x2 f2...xd fd

10 Média Aritmética: Tabela de Frequências No caso de variáveis contínuas em um tabela de frequências, só teremos o valor aproximado da média.

11 Média Aritmética: Tabela de Frequências Passo 0. Construa uma tabela de frequências: Passo 1. Adicione uma linha com os pontos médios de cada intervalo. Passo 2. Para cada coluna, multiplique a primeira linha pela segunda. Some o resultado. Int. dos Resultados[ a1, b1 )[ a2, b2 )... [ ad, bd ) Freq. relativa f1f2...fd Int. dos Resultados[ a1, b1 )[ a2, b2 )... [ ad, bd ) Pontos Médios( a1 + b1 )/2( a2 + b2 )/2( ad + bd )/2 Freq. relativa f1f2...fd

12 Exemplo: CVF Sem Amiloride Média real: 3.371357 Média pela tabela: 3,2857 IntervaloPonto Médio Freq. Absoluta Freq. Relativa Produto [1,2)1.511/141.5*1/14 [2,3)2.555/142.5*5/14 [3,4)3.555/143.5*5/14 [4,5)4.522/144.5*2/14 [5,6)5.511/145.5*1/14 Total3,2857

13 Mediana Organize todos os valores da amostra, do menor ao maior (esse procedimento chama-se rol). O valor da amostra que está no meio dos dados organizados chama-se mediana. Motivação: 50% dos dados estão abaixo e acima deste valor.

14 Exemplo 1:Tamanho da Amostra Ímpar Dados organizados: 1,1,1,1,2,2,3,3,3,4,4,5,5,5,5 O valor da mediana é 3

15 Exemplo 2:Tamanho da Amostra Par Dados organizados: 1,1,1,1,2,2,3,4,4,4,4,5,5,5 O valor da mediana está entre 3 e 4. É comum tomar a mediana como sendo a média dos dois valores: (3+4)/2 = 7/2 = 3,5.

16 Moda A moda amostral é o valor que mais repetiu na amostra. Intuição: o valor que mais repete em uma amostra possui a maior frequência relativa. Assim, é esperado que este valor seja mais frequente que os demais. É uma estatística fácil de utilizar em dados discretos ou categóricos.

17 Exemplo Amostra: 1,1,1,1,2,2,3,3,3,3,3 Moda: 3 Amostra: 1,1,2,3,4,5,5 Modas: 1 e 5.

18 Qual delas utilizar? A média é influenciada por valores extremos. Considere a amostra: 1,1,1,1,1,100. A média é igual a (1+1+1+1+1+100)/5 = 21 O valor 21 não parece um bom candidato para representar um valor típico da variável. De fato, nenhum valor da amostra se aproximou do valor 21. Neste exemplo, a mediana e a moda são iguais a 1, um valor que é razoável para descrever a maior parte dos dados.

19 Qual delas Usar? Considere a amostra: 1,1,1,1,1,10,10,10,10,10. A média é igual a 5/10 + 50/10 =5,5. A mediana é igual a (1 + 10)/2 = 5,5. A moda é igual a 1 e 10. Neste caso, a moda representa melhor os dados.

20 Medidas de Dispersão Medidas de dispersão são estatísticas que tentar explicar o grau de espalhamento dos dados. Dados com baixa dispersão tendem a possuir valores próximos entre si, enquanto que dados mais dispersos apresentam maior variabilidade. As principais medidas de dispersão são amplitude, desvio-padrão e o coeficiente de variação.

21 Amplitude É uma medida simples de calcular, mas com pouca aplicação prática. Para calcular a amplitude, faça: Passo 1. Encontre o mínimo (m) e o máximo (M) da amostra. Passo 2. A amplitude é igual a M – m

22 Amplitude Exemplo 1: Amostra: 1,2,2,2,3,3,4,5,8,9,9,10,10 Mínimo (m) = 1; Máximo (M) = 10 Amplitude: 10-1 =9 Exemplo 2: Amostra: 1,1,1,2,2,2,3,3,3,3,3,4,4 Mínimo (m) = 1; Máximo (M) = 4 Amplitude: 4 – 1 = 3 Logo, parece existir evidências de que os dados do exemplo 2 estão menos dispersos que os do exemplo 1.

23 Desvio-Padrão É a medida de dispersão mais utilizada. Mede o quão próximo os dados estão da média amostral. Média

24 Desvio-Padrão Cálculo da variância: Passo 1. Subtraia cada valor da amostra pela média amostral. Passo 2. Eleve ao quadrado cada termo obtido. Passo 3. Some todos os valores obtidos. Divida esse valor por (tamanho da amostra -1). Esse resultado é denominado variância. Cálculo do desvio-padrão Passo Único. Tire a raiz quadrada do desvio- padrão.

25 Exemplo Amostra: 1,1,1,1,2,2,3,3,4 Média: 2

26 Exemplo Variância: (1+1+1+1+0+0+1+1+4)/9 =10/8 Cada valor menos a médiaQuadrado dos valores 1 – 2 = –11 1 1 1 2 – 2 = 00 0 3 – 2 = 11 1 4 – 2 = 24

27 Exemplo Desvio-padrão: 1,11 Isto quer dizer que não ficaremos surpresos em observar valores entre 2-1,11 = 0,89 e 2+1,11= 3,11

28 Chute do Desvio-Padrão Essa não é uma regra, mas funciona em muitos casos. 65% dos dados estão entre Média +/- Desvio-padrão 95% dos dados estão entre Média +/- 2*Desvio- padrão 99% dos dados estão entre Média +/- 3*Desvio- padrão

29 Coeficiente de Variação O desvio-padrão depende da unidade de medida, fazendo com que sua interpretação seja subjetiva. Exemplo: um desvio padrão de 10 metros pode ser considerado pequeno: Se a média for de 5m, então um desvio-padrão de 10m é indica grande variabilidade. Se a média for de 5Km, então um desvio de 10m indica um pequena variação.

30 Coeficiente de Variação O Coeficiente de Variação visa retirar o efeito da unidade de medida. Ele é calculado da seguinte forma: Quanto menor for o coeficiente de variação, menor será a variabilidade. Passo 1: Calcule a média e o desvio-padrão. Passo 2: Divida o desvio-padrão pela média.

31 Percentis O Percentil p é o valor da amostra que deixa abaixo dele 100p% dos dados. Por exemplo, o percentil ½ deixa abaixo dele 100/2% = 50% dos dados (ou seja, ele é a mediana). Eles são úteis para comparar amostras: amostras com os mesmos percentis podem ser provenientes da mesma distribuição de probabilidades.

32 Quartis Os percentis ¼, ½ e ¾ recebem os nomes 1º, 2º e 3º quartil, respectivamente e são denotados por Q1, Q2 e Q3 Eles representam os 25%, 50% e 75% dos dados acumulados. O intervalo [Q1,Q3] contém 50% dos dados. É um intervalo importante por contém a mediana e, em geral, a média também. Assim, esse intervalo pode conter os 50% indivíduos mais representativos da amostra.

33 Exemplo: Organize a sua amostra em ordem crescente. Ex: 1,1,1,1,2,2,3,3,4 Faça a seguinte tabela com os dados ordenados

34 Exemplo Amostra Ordenada OrdemOrdem/nPercentis 111/9=0,1111% 122/9=0,2222% 133/9=0,3333% 144/9=0,4444% 255/9=0,5555% 266/9=0,6666% 377/9=0,7777% 388/9=0,8888% 499/9=0,9999%

35 Exemplo Pela tabela anterior temos: Q1 = 1, Q2 = 2, Q3 = 3. Assim, o intervalo [Q1,Q3] contém 50% dos dados, além que conter a mediana.

36 Box-plots Box-plots, (caixas de bigodes, em português de Portugal) são representações gráficas construídas a partir dos quartis com o intuito de simplificar a visualização dos dados. Ele é construído a partir de uma caixa com extremos [Q1,Q3]. Dentro da caixa, uma linha marca Q2. Duas linhas saem da caixa (os bigodes). Pontos que passam destas linhas são considerados atípicos para uma distribuição normal.

37 Box-plot: Agressões Clique para editar os estilos do texto mestre Segundo nível Terceiro nível Quarto nível Quinto nível


Carregar ppt "Aula 5 Bioestatística. Estatísticas para uma variável."

Apresentações semelhantes


Anúncios Google