A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Descritiva

Apresentações semelhantes


Apresentação em tema: "Estatística Descritiva"— Transcrição da apresentação:

1 Estatística Descritiva

2 Estatística Descritiva
Também chamada de Análise Exploratória de Dados Etapa inicial da análise utilizada para descrever os dados coletados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística.

3 Exemplo: Estudo sobre Idade (anos) Dados (n=165):
É preciso resumir de alguma forma

4 Estatística Descritiva
Após a coleta das observações: Primeira Etapa Resumo dos Dados = Estatística Descritiva

5 Conceitos básicos Variável é uma característica de interesse a ser medida em cada unidade amostral.

6 Tipos de variável

7 Exemplos de variáveis qualitativa nominal: sexo, carreira, região onde mora, portador de diabetes qualitativa ordinal: grau de instrução, nível de renda, grau de evolução de uma doença quantitativa discreta: número de filhos, número de acidentes em um mês quantitativa contínua: peso, altura, pressão sangüínea sistólica, tempo de vida útil

8 Distribuição de freqüências
Distribuição de freqüências de uma variável é uma lista de valores individuais ou intervalos de valores que a variável pode assumir, com as respectivas freqüências de ocorrência. Tipos de freqüência: Freqüência absoluta Freqüência relativa

9 Distribuição de freqüências
Exemplo (variável contínua):

10 Histograma com as 10 classes da distribuição de freqüências original

11 com 5 classes

12 2 classes !

13 20 classes

14 40 classes

15 88 classsssses

16 Produção de Aço em Março/2008 nas 300 siderúrgicas de Freedonia (em milhões de toneladas)
[1] [11] [21] [31] [41] [51] [61] [71] [81] [91] [101] [111] [121] [131] [141] [151] [161] [171] [181] [191] [201] [211] [221] [231] [241] [251] [261] [271] [281] [291]

17 Para construir o boxplot
Min, Q1 , Mediana , Q3 , Max

18 O Boxplot

19 Mediana = 7 Primeiro Quartil = 4.5 Terceiro Quartil = 9.5 IQ = 5 4.5 – 1.5 (5) = - 3 (5) = 17 8 pontos maiores que 17 ( a partir de 16.61)

20 Histograma com 12 classes de mesma amplitude.

21 Média = 7.5 Mediana = 7 Variância = 14.37 Desvio-padrão = 3.79

22 Variáveis Quantitativas
Medidas de Posição: Mínimo, Máximo, Moda, Média, Mediana, Percentis, Quartis Medidas de Dispersão: Amplitude, Intervalo Interquartil, Variância, Desvio Padrão, Coeficiente de Variação.

23 Medidas de Posição Máximo (max): a maior observação
Mínimo (min): a menor observação Moda (mo): é o valor (ou atributo) que ocorre com maior freqüência Dados: 4, 5, 4, 6, 5, 8, 4 max = 8 min = 4 mo = 4

24 Medidas de Posição Média Dados: 2, 5, 3, 7, 8

25 Medidas de Posição Mediana Posição da mediana: (n+1) / 2
A Mediana é o valor que ocupa a posição central de um conjunto de n dados ordenados. Posição da mediana: (n+1) / 2

26 Mediana n = 5 (ímpar) (5+1)/2 = 3 => Md = 6 Ordenados: 2 3 6 7 8
n = 6 (par) (6+1)/2 = 3,5 Md = (4+6)/2 = 5

27 Medidas de Posição Percentis:
O percentil de ordem px100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição p x (n+1) do conjunto de dados ordenados. Casos Particulares: Percentil 50 = Mediana ou segundo quartil (Md) Percentil 25 = Primeiro quartil (Q1) Percentil 75 = Terceiro quartil (Q3)

28 Quartis Dados: 4, 7, 8, 1, 3, 10, 2, 13, 5, 5, 8 => n = 11
Ordenados: 1, 2, 3, 4, 5, 5, 7, 8, 8, 10, 13 Q1 = 3 Md = 5 Q3 = 8 Dados: 15, 5, 3, 8, 10, 2, 7, 11, => n = 9 Ordenados: 2, 3, 5, 7, 8, 10, 11, 12, 15 Q1 = 4,5 Md = 8 Q3 = 11,25

29 Medidas Resumo Exemplo: Considere as notas de um teste de 3 grupos de alunos Grupo 1: 3,4,5,6,7 Grupo 2: 1,3,5,7,9 Grupo 3: 5,5,5,5,5

30 Medidas de Dispersão Finalidade: Encontrar um valor que resuma a variabilidade do conjunto de dados Amplitude (A): A = máx - min Para os grupos anteriores: Grupo 1: A = 4 Grupo 2: A = 8 Grupo 3: A = 0

31 Medidas de Dispersão Intervalo Interquartil: É a diferença entre o terceiro quartil e o primeiro quartil, ou seja d = Q3 – Q1 Dados: 15, 5, 3, 8, 10, 2, 7, 11, 12 Ordenados: 2, 3, 5, 7, 8, 10, 11, 12, 15 Q1 = 4,5 Q3 = 11,25 d = Q3 – Q1 = 11,25 – 4,5 = 6,75

32 Medidas de Dispersão Variância Desvio Padrão

33 Medidas de Dispersão Cálculo da variância para os grupos Grupo 1:

34 Medidas de Dispersão Fórmula alternativa para cálculo da variância
Grupo 1:

35 Medidas de Dispersão Coeficiente de Variação
é uma medida de dispersão relativa elimina o efeito da magnitude dos dados exprime a variabilidade em relação à média

36 Tipos de gráficos Dados unidimensionais: Gráfico de pizza
Gráfico de barras Histograma Boxplot

37 Gráfico de pizza

38 Gráfico de Barras

39 Histograma Agrupar os dados em intervalos de classes (distribuição de freqüências) Bases iguais: construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à freqüência da classe (f) Bases diferentes: base igual ao tamanho da classe e área do retângulo igual à freqüência relativa da classe (fr) A altura será dada por: h = fr / base (densidade da freqüência)

40 Histograma Exemplo com classes iguais
Distribuição de notas finais na disciplina de Noções de Estatística

41 Histograma Exemplo com classes desiguais Dados de vacinação infantil

42 Box Plot

43 Box Plot Exemplo: Tempo de sobrevivência (dias)
Dados ordenados (n=36):


Carregar ppt "Estatística Descritiva"

Apresentações semelhantes


Anúncios Google