A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Descritiva

Apresentações semelhantes


Apresentação em tema: "Estatística Descritiva"— Transcrição da apresentação:

1 Estatística Descritiva
Bioestatística Dep. Biologia Universidade dos Açores 2002 © Luís Silva

2 Distribuições de frequência
Distribuição de Frequências (Dados Nominais) Uma distribuição de frequências contabiliza o número de ocorrências para cada valor tomado pela variável (frequência absoluta). Quando em percentagem (frequências relativas), permite comparar amostras de diferentes dimensões.

3 Distribuições de frequência
Gráfico de sectores (Dados Nominais) Gráfico de barras (Dados Nominais) Número de lagoas (%) 10 20 30 40 50 60 70 80 90 Peixes Tritão Aves Vertebrados Os dados em escala nominal podem ser resumidos em tabelas de frequências relativas ou absolutas, ou ainda em gráficos de sectores ou de barras. As barras estão separadas, evidenciando a natureza qualitativa dos dados.

4 Distribuições de frequência
Gráfico de Barras (Dados Nominais) Percentagem de alunos

5 Distribuições de frequência
Gráfico de Barras (Dados Ordinais) Os dados em escala ordinal podem ser resumidos em tabelas ou em gráficos de sectores ou de barras. Quando o número de valores que a variável pode assumir é elevado, não é aconselhável a utilização de gráficos e sectores, pois perdem legibilidade

6 Distribuições de frequência
Escala de Rácios: Dados Discretos (Plantas de Rumex sp. em pastagens, amostras de 1 metro quadrado) Número de plantas por amostra 5 10 15 20 25 1 2 3 4 6 7 8 9 11 12 13 14 Número de amostras (%) Os dados discretos na escala de rácios devem ser representados por gráficos de barras. As barras estão separadas, evidenciando a natureza discreta, descontínua dos dados.

7 Distribuições de frequência
Dados Contínuos Os dados contínuos na escala de rácios devem ser representados em histogramas. Os dados são agrupados em classes com uma amplitude pré-definida. Nos histogramas as barras referentes às várias classes encontra-se justapostas, dando a ideia de continuidade. Exemplo: comprimentos de tritão de crista. 11,000 12,000 0,000 13,000 4 0,050 14,000 11 0,138 15,000 43 0,538 16,000 14 0,175 17,000 8 0,100 18,000 Total 80 1,000 De (=) Até (<) Freq. Abs. Freq. Rel. Distribuição de frequências para as fêmeas 10 20 30 40 50 60 Percentagem de fêmeas 11 12 13 14 15 16 17 18 Comprimento total (cm)

8 Distribuições de frequência
Dados Contínuos (Pesos de uma turma de alunos de Bioestatística) Histograma A utilização de frequências absolutas pode dificultar a comparação dos gráficos, quando as amostras a comparar (neste caso alunos e alunas) não têm a mesma dimensão.

9 Distribuições de frequência
Dados Contínuos (Envergadura de uma turma de alunos de Bioestatística) Os dados contínuos também podem ser representados por Polígonos de Frequências. Os pontos médios das classes são unidos por segmentos de recta. Permitem uma representação simultânea de duas amostras, que não é tão legível no caso dos histogramas

10 Frequências acumuladas
As frequências acumuladas (absolutas ou relativas) são calculadas por adição sucessiva dos termos de uma distribuição de frequências. Indicam a frequência das observações com valores iguais ou inferiores a xi. Exemplo: percentagem de alunos com até 170 cm de estatura.

11 Escala de intervalos Distribuições circulares. Estes dados sofrem um transformação em graus. Calcula-se o ângulo médio e a variância angular. Depois, transformam-se esses dados na unidade inicial. Por exemplo, transformam-se horas em graus (24h = 360º), realizam-se os cálculos e, no final, transforma-se o ângulo médio e o desvio padrão angular em horas. Apresentam-se em histogramas circulares.

12 Medidas de tendência central
As medidas de tendência central ou de posição indicam o centro de gravidade da distribuição, a posição da distribuição ao longo do eixo, ou um ponto de acumulação de dados.

13 Medidas de tendência central
Média Aritmética Mais utilizada Fórmula para o parâmetro N S (xi) i=1 m = ————— Fórmula para o estimador n _ i=1 x = ————— Média Aritmética O caso de dados repetidos k S fa(xi) . xi i=1 m = ————— N m = S fr(xi) . xi Onde k é o número de valores diferentes.    No caso da média, a fórmula para o parâmetro (m) e para o estimador (x) é a mesma. _

14 Medidas de tendência central
Moda O valor mais frequente num conjunto de dados. Pode haver mais do que uma moda - distribuições multimodais. Definição mais geral: um ponto de relativa concentração de dados. Expressa menos informação do que a média. Aplica-se a todos os tipos de dados.

15 Medidas de tendência central
Mediana O valor central de um conjunto ordenado de dados - existem 50% das observações abaixo e acima da mediana. Exemplo M = x(n+1)/2 = x 5 = 4 M = x(n+1)/2 = x 5,5 = (3+4)/2=3,5 Expressa menos informação do que a média. Não é tão afectada pelos valores extremos Pode-se usar para dados em escala ordinal ou em escala de rácios. 

16 Medidas de tendência central
Mediana Quando há dados com o mesmo valor, pode ser impossível aplicar esta definição de mediana. Exemplo M = x(n+1)/2 = x 6 = 4, mas acima do 4 há apenas três observações. Assim, uma definição mais geral é considerar a mediana como o ponto da distribuição, abaixo ou acima do qual se encontram, no máximo, 50% das observações.

17 Medidas de tendência central
Outros quantis Quartis: divisão da distribuição em quatro partes. Q1= X (n+1)/4 Octis: divisão da distribuição em oito partes. Q1= X (n+1)/8 Percentis: divisão da distribuição em cem partes. LD50, LC50: dose ou concentração letal para 50% da amostra. GT 25, GT50, GT75: tempo de germinação para 25, 50 ou 75% da amostra de sementes.

18 Medidas de dispersão As medidas de dispersão fornecem informação acerca da variabilidade dos dados, indicando se existe uma concentração dos dados em volta da média ou se, pelo contrário, os dados se distribuem ao longo de uma curva relativamente ampla, com valores extremos bem distanciados da média.

19 Medidas de dispersão S |xi-m| i=1 = ————— Amplitude = Máximo - Mínimo
É uma medida algo grosseira que leva, em geral, a uma subestimação da amplitude na população. É utilizada em Taxonomia. Aplica-se aos dados nas escalas ordinal, por intervalos e de rácios. Surgiu a ideia de calcular a soma dos desvios das observações em relação à média Desvio Médio = N S |xi-m| i=1 = ————— Pouco utilizado 

20 Medidas de dispersão Variância S (xi - m )2 i=1 s2 = —————
Surge a ideia de elevar os desvios ao quadrado: Variância População - parâmetro - s2 N S (xi - m )2 i=1 s2 = ————— Amostra - estimador - s2 n _ S (xi - x )2 n-1

21 Medidas de dispersão [ S xi ]2 i=n S (xi 2) - ———— ———————— n-1
Fórmula para cálculo rápido: n [ S xi ]2 i=n S (xi 2) - ———— ———————— n-1 Soma de quadrados (SS)   n [ S xi ]2 i=n S(xi 2) - ———— n Graus de liberdade = n-1 Na variância a fórmula para calcular o parâmetro (s2) é diferente da utilizada para o cálculo do estimador (s2).    Se há dados repetidos: n [ S fa(xi).xi ]2 i=n S fa(xi).xi ———— ——————————— n-1

22 Medidas de dispersão Desvio padrão s ou s Coeficiente de variação
Raiz quadrada positiva da variância. Tem a vantagem de se encontrar nas mesmas unidades da média, enquanto que a variância tem as unidades da média ao quadrado.  Coeficiente de variação Medida de variabilidade ou dispersão relativa. CV = (s / x) . 100 Permite comparar espécies diferentes quanto à variabilidade. _


Carregar ppt "Estatística Descritiva"

Apresentações semelhantes


Anúncios Google