A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Descritiva (II)

Apresentações semelhantes


Apresentação em tema: "Estatística Descritiva (II)"— Transcrição da apresentação:

1 Estatística Descritiva (II)

2 Arquivo PULSE do Minitab
Refere-se a um experimento feito por alunos. Cada um deles registrou sua altura, peso, sexo, hábito de fumar e nível de atividade física. Depois, todos eles jogaram moedas e aqueles que tiraram “CARA” fizeram corrida estacionária por 1 minuto, registrando a pulsação antes de correr e a pulsação depois de correr. Os demais registraram a pulsação após 1 minuto, mesmo sem ter corrido.

3 Informações do arquivo PULSE MTB > INFO
Information of the worksheet Column Count Name C Pulse1 C Pulse2 C Ran fez corrida não fez corrida C Smokes 1- fuma não fuma C Sex masculino feminino C Height C Weight C Activity não tem leve 2- moderada 3- intensa

4 Planilha (parcial) Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity , , , , , , , ,

5 Variáveis qualitativas Variáveis quantitativas
Ran Smokes Sex Activity Nominal Ordinal Variáveis qualitativas Pulse 1 Pulse 2 Height Weight Discreta Contínua Variáveis quantitativas

6 Variáveis Quantitativas
Medidas de posição Medidas de dispersão - Média (x) Mediana (md) Quartis (Q1, Q3) Máximo (máx) Mínimo (min) Variância (s2) Desvio padrão (s) Intervalo-interquartil (Q3 – Q1) Coeficiente de variação (CV)

7 MTB > describe c1 c6 c7 Descriptive Statistics
Variable N Mean Median Tr Mean StDev SE Mean Pulse , , , ,15 Height , , , ,382 Weight , , , ,48 Variable Min Max Q Q3 Pulse Height Weight ,5 CV 11,01/72,87=0,15 3,659/68,717=0,05 23,74/145,15=0,16

8 Alguns comentários: 50% dos indivíduos tem pulsação menor ou igual a 71 batimentos por minuto; 25% dos indivíduos tem altura igual ou menor a 66 pés; 75% dos indivíduos tem peso igual ou menor a 156,5 libras; a variável com menor dispersão em relação à média é a altura; Pulsação e peso apresentam dispersão em relação à média praticamente iguais e o triplo da dispersão da altura.

9 MTB > describe c1; SUBC > by c3. Variable Ran N Mean Median Tr Mean StDev SE Mean Pulse , , , ,93 , , , ,43 Variable Ran Min Max Q1 Q3 Pulse MTB > describe c2; SUBC > by c3. Variable Ran N Mean Median Tr Mean StDev SE Mean Pulse , , , ,20 , , , ,32 Variable Ran Min Max Q1 Q3 Pulse

10 Alguns comentários: Com relação às medidas de posição, os dois grupos “antes de correr” têm praticamente os mesmos valores; O grupo que correu (Ran=2) tem média de Pulse2 maior que o grupo que não correu (Ran=1). Com relação às medidas de dispersão, os dois grupos antes da corrida apresentam valores semelhantes; O grupo que correu apresenta um desvio padrão aproximadamente igual ao dobro do que o grupo que não correu.

11 Descrevendo a pulsação em repouso segundo o sexo MTB > DESCRIBE C1; SUBC> BY C5.
Variable Sex N Mean Median TrMean StDev SE Mean Pulse , ,27 9,95 1, , ,65 11,62 1,96 Variable Sex Min Max Q1 Q3 Pulse

12 Os dados também podem ser resumidos construindo-se uma tabela de distribuição de freqüências .
Distribuição de freqüências de uma variável é uma lista dos valores individuais ou dos intervalos de valores que a variável pode assumir, com as respectivas freqüências de ocorrência.

13 Não há perda de informação No arquivo PULSE MTB > tally c1
Summary Statistics for Discrete Variables Pulse1 Count Percent ,09 ,17 ,26 ,35 ,09 ,78 ,35 ,43 ,96 ,52 ,52 ,43 ,43 ,43 ,26 ,26 ,35 ,09 ,09 ,26 ,35 ,17 ,09 ,17 ,09 N= Não há perda de informação

14 Informações mais resumidas
Alternativa: construir intervalos de classe Classe de pulsação frequência 48 |- 54 54 |- 60 60 |- 66 66 |- 72 72 |- 78 78 |- 84 84 |- 90 90 |- 96 96 |- 102 1 5 18 22 16 11 9 7 3 Informações mais resumidas Perda de informação

15 Distribuição de freqüência para altura
Exemplo 2: Variável: altura ( height) Construir intervalos de classe contínua Classes de altura f fr 60,25 |- 61,75 61,75 |- 63,25 63,25 |- 64,75 64,75 |- 66,25 66,25 |- 67,75 67,75 |- 69,25 69,25 |- 70,75 70,75 |- 72,25 72,25 |- 73,75 73,75 |- 75,25 Total 1 10 2 13 7 20 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,163 0,098 0,087 Distribuição de freqüência para altura ( arquivo PULSE)

16 Variáveis Quantitativas
Gráficos “Dotplot ” “Boxplot ” Histograma

17 DOTPLOT Arquivo PULSE – Dotplot da pulsação em repouso (PULSE1) MTB > DOTPLOT C1 : : : : . : : : : : : : : : : : : : . . : . : : : :.: : : : : : : : : : : : ..: : : . : Pulse1

18 Arquivo PULSE – Dotplot da pulsação em repouso (PULSE1) segundo Sexo (SEX) MTB > DotPlot 'Pulse1' ; SUBC> Same; SUBC> By 'Sex'. : Sex : : : : . . : : : : : : : : : : : : : : : : . : : Sex : : . : : : : : : : : ..: : Pulse1

19 Boxplot Representa os dados através de um retângulo construído com os quartis e fornece informações sobre os valores extremos.

20 Construção “Máximo” Q3 75% Mediana 50% Q1 25% “Mínimo”
LS=Q3+1,5(Q3-Q1) “Máximo” Q3 Mediana Q1 “Mínimo” 25% 50% 75% LI=Q1-1,5(Q3-Q1) “Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI.

21 Observações discrepantes?
Exemplo: Tempo de sobrevivência (dias) Dados ordenados (n=36) md = 41,5 Q1 = 30, Q3 = 49,5 120 100 80 60 40 20 * Observações discrepantes? LI = Q1 - 1,5(Q3 - Q1) =1,38 LS = Q3 + 1,5(Q3 - Q1) =78,38

22 Arquivo PULSE –Boxplot da pulsação em repouso (PULSE1) MTB > BOXPLOT C1
Alguns Comentários: não há observações discrepantes; a distribuição dos valores é aproximadamente simétrica.

23 Arquivo PULSE – Boxplots da pulsação em repouso (PULSE1) por sexo (SEX) MTB > BOXPLOT C1*C5
Alguns Comentários: não há observações discrepantes; as medidas de posição são maiores para o sexo feminino; não há fortes evidências de assimetria nos dois grupos.

24 Histograma Agrupar os dados em intervalos de classes
(distribuição de freqüências) Bases iguais Construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à freqüência da classe (f). Bases diferentes Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a freqüência relativa da classe(fr). A altura será dada por h = fr/base (densidade de freqüência).

25 Arquivo PULSE – Histograma da altura (Height)
MTB > HIST C6 Distribuição de freqüência para altura (arquivo PULSE) Classe de altura f fr 60,25 ⊢ 61,75 61,75 ⊢ 63,25 63,25 ⊢ 64,75 64,75 ⊢ 66,25 66,25 ⊢ 67,75 67,75 ⊢ 69,25 69,25 ⊢ 70,75 70,75 ⊢ 72,25 72,25 ⊢ 73,75 73,75 ⊢ 75,25 Total 1 10 2 13 7 20 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,163 0,098 0,087

26 Exemplo: Classes desiguais
h 0,10 0,02 0,04 0,06 0,08 Classes (meses) f fr h 0 | , ,093 3 | , ,022 12 | , ,013 24 | , ,010 Total ,00 Vacinação Infantil f

27 Forma da Distribuição

28 Variáveis Qualitativas
Os dados podem ser resumidos construindo-se uma tabela de distribuição de freqüências, que quantifica a freqüência das distintas categorias. Variáveis qualitativas no arquivo PULSE Ran Smokes Sex Activity

29 Variáveis qualitativas no arquivo PULSE MTB > Tally 'Sex' 'Smokes' 'Activity';
SUBC> Counts; SUBC> Percents. Summary Statistics for Discrete Variables Sex Count Percent Smokes Count Percent , ,43 , ,57 N= N= Activity Count Percent ,09 ,78 ,30 ,83 N=

30 Podemos também construir tabelas de freqüências conjuntas (tabelas de contingência), relacionando duas variáveis qualitativas. Exemplo 1: Há indícios de associação entre Sexo e Hábito de fumar? Qual o significado dos valores desta tabela? Como concluir?

31 MTB > Table 'Sex' 'Smokes';
SUBC> Counts. Rows: Sex Columns: Smokes All All

32 Verificar associação através da: porcentagem segundo as colunas, ou porcentagem segundo as linhas. Qual o significado dos valores desta tabela? Como concluir?

33 MTB > Table 'Sex' 'Smokes';
SUBC> ColPercents (RowPercents/TotPercents) Rows: Sex Columns: Smokes All , , ,96 , , ,04 All , , ,00

34 MTB > Table 'Sex' 'Smokes'; SUBC> Counts; SUBC> RowPercents.
Rows: Sex Columns: Smokes All , , , , , ,00 All , , ,00 Cell Contents – Count - % of Row

35 Exemplo 2: Dentre os que correram, qual a porcentagem de mulheres?
MTB > Table 'Ran' 'Sex'; SUBC> Counts; SUBC> RowPercents. Rows: Ran Columns: Sex All , , , , , ,00 All , , ,00 Resposta: 31,43%

36 Variáveis Qualitativas
Gráficos Gráfico de setores Gráfico de barras

37 Gráfico de setores Um círculo é dividido em tantos setores quantas forem as categorias da variável. A área de cada setor é proporcional à freqüência da categoria

38 Arquivo PULSE — Gráfico de setores para a variável Ran
MTB > %Pie c3.

39 Arquivo PULSE — Gráfico de setores para a variável Activity

40 Gráfico de barras Sobre um eixo, são representados retângulos, um para cada categoria da variável. A altura do retângulo é proporcional à freqüência da categoria

41 Arquivo PULSE — Gráfico de barras para a variável RAN
MTB > Chart C3

42 Arquivo PULSE — Gráfico de barras para a variável Activity
MTB > Chart C8


Carregar ppt "Estatística Descritiva (II)"

Apresentações semelhantes


Anúncios Google