A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Estatística Descritiva 2002 © Luís Silva Bioestatística Dep. Biologia Universidade dos Açores www.uac.pt.

Apresentações semelhantes


Apresentação em tema: "1 Estatística Descritiva 2002 © Luís Silva Bioestatística Dep. Biologia Universidade dos Açores www.uac.pt."— Transcrição da apresentação:

1 1 Estatística Descritiva 2002 © Luís Silva Bioestatística Dep. Biologia Universidade dos Açores

2 2 Distribuições de frequência Distribuição de Frequências (Dados Nominais) Uma distribuição de frequências contabiliza o número de ocorrências para cada valor tomado pela variável (frequência absoluta). Quando em percentagem (frequências relativas), permite comparar amostras de diferentes dimensões.

3 3 Distribuições de frequência Gráfico de sectores (Dados Nominais) Os dados em escala nominal podem ser resumidos em tabelas de frequências relativas ou absolutas, ou ainda em gráficos de sectores ou de barras. As barras estão separadas, evidenciando a natureza qualitativa dos dados. Gráfico de barras (Dados Nominais) Número de lagoas (%) PeixesRãTritãoAves Vertebrados

4 4 Distribuições de frequência Gráfico de Barras (Dados Nominais) Percentagem de alunos

5 5 Distribuições de frequência Gráfico de Barras (Dados Ordinais) Os dados em escala ordinal podem ser resumidos em tabelas ou em gráficos de sectores ou de barras. Quando o número de valores que a variável pode assumir é elevado, não é aconselhável a utilização de gráficos e sectores, pois perdem legibilidade

6 6 Escala de Rácios: Dados Discretos (Plantas de Rumex sp. em pastagens, amostras de 1 metro quadrado) Número de plantas por amostra Número de amostras (%) Os dados discretos na escala de rácios devem ser representados por gráficos de barras. As barras estão separadas, evidenciando a natureza discreta, descontínua dos dados. Distribuições de frequência

7 7 Dados Contínuos Os dados contínuos na escala de rácios devem ser representados em histogramas. Os dados são agrupados em classes com uma amplitude pré-definida. Nos histogramas as barras referentes às várias classes encontra-se justapostas, dando a ideia de continuidade. Exemplo: comprimentos de tritão de crista. 11,00012,00000,000 12,00013,00040,050 13,00014,000110,138 14,00015,000430,538 15,00016,000140,175 16,00017,00080,100 17,00018,00000,000 Total801,000 De (=)Até (<)Freq. Abs.Freq. Rel. Distribuição de frequências para as fêmeas Percentagem de fêmeas Comprimento total (cm) Distribuições de frequência

8 8 Dados Contínuos (Pesos de uma turma de alunos de Bioestatística)Histograma A utilização de frequências absolutas pode dificultar a comparação dos gráficos, quando as amostras a comparar (neste caso alunos e alunas) não têm a mesma dimensão. Distribuições de frequência

9 9 Dados Contínuos (Envergadura de uma turma de alunos de Bioestatística) Os dados contínuos também podem ser representados por Polígonos de Frequências. Os pontos médios das classes são unidos por segmentos de recta. Permitem uma representação simultânea de duas amostras, que não é tão legível no caso dos histogramas Distribuições de frequência

10 10 Frequências acumuladas As frequências acumuladas (absolutas ou relativas) são calculadas por adição sucessiva dos termos de uma distribuição de frequências. Indicam a frequência das observações com valores iguais ou inferiores a x i. Exemplo: percentagem de alunos com até 170 cm de estatura.

11 11 Escala de intervalos Distribuições circulares. Estes dados sofrem um transformação em graus. Calcula- se o ângulo médio e a variância angular. Depois, transformam-se esses dados na unidade inicial. Por exemplo, transformam-se horas em graus (24h = 360º), realizam-se os cálculos e, no final, transforma-se o ângulo médio e o desvio padrão angular em horas. Apresentam-se em histogramas circulares.

12 12 Medidas de tendência central As medidas de tendência central ou de posição indicam o centro de gravidade da distribuição, a posição da distribuição ao longo do eixo, ou um ponto de acumulação de dados.

13 13 Medidas de tendência central Média Aritmética Mais utilizada Fórmula para o parâmetro N (x i ) i=1 = N Fórmula para o estimador n (x i ) _ i=1 x = n Média Aritmética O caso de dados repetidos k f a (x i ). x i i=1 = N k = f r (x i ). x i i=1 Onde k é o número de valores diferentes. No caso da média, a fórmula para o parâmetro ( ) e para o estimador ( x ) é a mesma. _

14 14 Moda O valor mais frequente num conjunto de dados. Pode haver mais do que uma moda - distribuições multimodais. Definição mais geral: um ponto de relativa concentração de dados. Expressa menos informação do que a média. Aplica-se a todos os tipos de dados. Medidas de tendência central

15 15 Mediana O valor central de um conjunto ordenado de dados - existem 50% das observações abaixo e acima da mediana. Exemplo M = x (n+1)/2 = x 5 = 4 Exemplo M = x (n+1)/2 = x 5,5 = (3+4)/2=3,5 Expressa menos informação do que a média. Não é tão afectada pelos valores extremos Pode-se usar para dados em escala ordinal ou em escala de rácios. Medidas de tendência central

16 16 Mediana Quando há dados com o mesmo valor, pode ser impossível aplicar esta definição de mediana. Exemplo M = x (n+1)/2 = x 6 = 4, mas acima do 4 há apenas três observações. Assim, uma definição mais geral é considerar a mediana como o ponto da distribuição, abaixo ou acima do qual se encontram, no máximo, 50% das observações. Medidas de tendência central

17 17 Outros quantis Quartis: divisão da distribuição em quatro partes. Q1= X (n+1)/4 Octis: divisão da distribuição em oito partes. Q1= X (n+1)/8 Percentis: divisão da distribuição em cem partes. LD50, LC50: dose ou concentração letal para 50% da amostra. GT 25, GT50, GT75: tempo de germinação para 25, 50 ou 75% da amostra de sementes. Medidas de tendência central

18 18 Medidas de dispersão As medidas de dispersão fornecem informação acerca da variabilidade dos dados, indicando se existe uma concentração dos dados em volta da média ou se, pelo contrário, os dados se distribuem ao longo de uma curva relativamente ampla, com valores extremos bem distanciados da média.

19 19 Medidas de dispersão Amplitude = Máximo - Mínimo É uma medida algo grosseira que leva, em geral, a uma subestimação da amplitude na população. É utilizada em Taxonomia. Aplica-se aos dados nas escalas ordinal, por intervalos e de rácios. Surgiu a ideia de calcular a soma dos desvios das observações em relação à média Desvio Médio = N |x i - | i=1 = N Pouco utilizado

20 20 Medidas de dispersão Surge a ideia de elevar os desvios ao quadrado: Variância População - parâmetro - 2 N (x i - ) 2 i=1 2 = N Amostra - estimador - s 2 n _ (x i - x ) 2 i=1 s 2 = n-1

21 21 Medidas de dispersão Fórmula para cálculo rápido: n [ x i ] 2 i=n (x i 2 ) - n n-1 Soma de quadrados (SS) n [ x i ] 2 i=n (x i 2 ) - n Graus de liberdade = n-1 Na variância a fórmula para calcular o parâmetro ( 2 ) é diferente da utilizada para o cálculo do estimador (s 2 ). Se há dados repetidos: n [ fa x i ).x i ] 2 i=n fa x i ).x i 2 - n n-1

22 22 Medidas de dispersão Desvio padrão ou s Raiz quadrada positiva da variância. Tem a vantagem de se encontrar nas mesmas unidades da média, enquanto que a variância tem as unidades da média ao quadrado. Coeficiente de variação Medida de variabilidade ou dispersão relativa. CV = (s / x). 100 Permite comparar espécies diferentes quanto à variabilidade. _


Carregar ppt "1 Estatística Descritiva 2002 © Luís Silva Bioestatística Dep. Biologia Universidade dos Açores www.uac.pt."

Apresentações semelhantes


Anúncios Google