Capítulo 2 Descrição, Exploração e Comparação de Dados ESTATÍSTICA APLICADA Capítulo 2 Descrição, Exploração e Comparação de Dados Prof. Paulo Renato de Morais
Descrevendo Dados Qualitativos
Tabela de Freqüências 1. Lista categorias e no. elementos na categoria 2. Obtida tabulando respostas na categoria 3. Pode mostrar freqüências, % ou ambas Tabul.: |||| |||| |||| ||||
Gráfico em Colunas Freqüência Curso Coluna mostra freqüência ou % Larguras iguais Curso Ponto Zero 1/2 a 1 largura da coluna
Gráfico em Setores 1. Mostra divisão da quantidade total em categorias 2. Útil para mostrar diferenças relativas 3. Valor do ângulo: (360°)(Porcentagem) Cursos Adm. Econ. 25% 10% 36° Eng. 65% (360°) (10%) = 36°
Questão Você deseja analisar a divisão de mercado dos fabricantes de programas para Windows em 1992. Construa um gráfico em colunas e um gráfico em setores para descrever os dados. Marca Div. Merc. (%) Lotus 15 Microsoft 60 WordPerfect 10 Outros 15
Solução do Gráfico em Colunas Div. Mercado (%) Marca
Solução do Gráfico em Setores Divisão do Mercado Outros Wordperfect 15% 10% Lotus 15% Microsoft 60%
Descrevendo Dados Quantitativos
Histograma 1. Condensa dados agrupando valores similares em classes num gráfico 2. Pode mostrar freqüências (contagens) ou freqüências relativas (proporções) 3. Primeiro deve-se construir uma tabela de distribuição de freqüências
Tabela de Distribuição de Freqüências 1. Determine amplitude total 2. Selecione número de classes Usualmente entre 5 e 20 inclusive 3. Calcule intervalos de classe (comprimento) 4. Determine limites das classes 5. Calcule pontos médios das classes 6. Conte observações e designe a classes
Tabela de Distribuição de Freqüências Dados: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 Classe P. médio Freqüência 15 |---- 25 20 3 Amplit. = 10 25 |---- 35 30 5 35 |---- 45 40 2 (Limite superior + inferior) / 2 Limites
Tabela de Distribuição de Freqüência Relativa e % Distribuição Percentual Classe Prop. Classe % 15 |---- 25 0,3 15 |---- 25 30,0 25 |---- 35 0,5 25 |---- 35 50,0 35 |---- 45 0,2 35 |---- 45 20,0
Histograma Contagem 5 4 Freqüência Freqüência Relativa 3 Porcentagem Colunas se tocam 2 1 0 15 25 35 45 55 Limites
Métodos Numéricos para Dados Quantitativos
Notação Medida Amostra População Média ` X m Desvio padrão S s 2 Variância S s 2 Tamanho n N
Propriedades de Dados Quantitativos Tendência Central (Localização) Variação (Dispersão) Forma
Métodos Numéricos para Dados Quantitativos Propriedades Numéricas Tendência Variação Forma Central Média Amplitude Simetria Mediana Variância Moda Desvio Padrão Intervalo Interquartílico
Medidas de Tendência Central
Média 1. Medida de tendência central 2. Medida mais comum 3. Funciona como ‘ponto de equilíbrio’ 4. Afetada por valores extremos (‘outliers’)
å Média 1. Medida de tendência central 2. Medida mais comum 3. Funciona como ‘ponto de equilíbrio’ 4. Afetada por valores extremos (‘outliers’) 5. Fórmula (média amostral) n å X i X + X + ... + X 1 2 n X = i = 1 = n n
å Exemplo de Média Dados: 10,3 4,9 8,9 11,7 6,3 7,7 X X + X + X + X + n å X i X + X + X + X + X + X 1 2 3 4 5 6 X = i = 1 = n 6 10 , 3 + 4 , 9 + 8 , 9 + 11 , 7 + 6 , 3 + 7, . 7 = 6 = 8 , 30
Mediana 1. Medida de tendência central 2. Valor central numa seqüência ordenada Se n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centrais
Mediana 1. Medida de tendência central 2. Valor central numa seqüência ordenada Se n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centrais 3. Posição da mediana na seqüência: n + 1 Posição = 2
Mediana n + 1 Posição = 2 1. Medida de tendência central 2. Valor central numa seqüência ordenada Se n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centrais 3. Posição da mediana na seqüência 4. Não é afetada por valores extremos n + 1 Posição = 2
Exemplo de Mediana: Amostra Tamanho Ímpar Dados: 24,1 22,6 21,5 23,7 22,6 Ordenação: 21,5 22,6 22,6 23,7 24,1 Posição: 1 2 3 4 5 n + 1 5 + 1 Posição = = = 3 2 2 Mediana = 22 , 6
Exemplo de Mediana Amostra Tamanho Par Dados: 10,3 4,9 8,9 11,7 6,3 7,7 Ordenação: 4,9 6,3 7,7 8,9 10,3 11,7 Posição: 1 2 3 4 5 6 n + 1 6 + 1 Posição = = = 3 , 5 2 2 7 , 7 + 8 , 9 Mediana = = 8 , 3 2
Moda 1. Medida de tendência central 2. Valor que ocorre mais freqüentemente 3. Não é afetada por valores extremos 4. Pode haver nenhuma moda ou várias modas 5. Pode ser usada para dados quantitativos e qualitativos
Exemplo de Moda Nenhuma Moda: Dados: 10,3 4,9 8,9 11,7 6,3 7,7 Mais de Uma Moda: Dados: 21 28 28 41 43 43
Questão Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são: 17, 16, 21, 18, 13, 16, 12, 11 Descreva estes dados em termos de tendência central.
Solução da Tendência Central Média n å X i X + X + ... + X 1 2 8 X = i = 1 = n 8 17 + 16 + 21 + 18 + 13 + 16 + 12 + 11 = 8 = 15 , 5
Solução da Tendência Central Mediana Dados: 17 16 21 18 13 16 12 11 Ordenados: 11 12 13 16 16 17 18 21 Posição: 1 2 3 4 5 6 7 8 n + 1 8 + 1 Posição = = = 4 , 5 2 2 16 + 16 Mediana = = 16 2
Solução da Tendência Central Moda Dados: 17 16 21 18 13 16 12 11 Ordenados: 11 12 13 16 16 17 18 21 Moda = 16
Resumo das Medidas de Tendência Central Equação Descrição Média S X / n Ponto de Equilíbrio i Mediana ( n +1) Posição Valor Central 2 Quando Ordenados Moda Nenhuma Mais Freqüente
Medidas de Variação ou Dispersão
Amplitude Total 1. Medida de dispersão 2. Diferença entre maior e menor observação Amplitude = X - X maior menor
Amplitude Total 1. Medida de dispersão 2. Diferença entre maior e menor observação 3. Ignora como os dados estão distribuídos Amplitude = X - X maior menor 7 8 9 10 7 8 9 10
Variância e Desvio Padrão 1. Medidas de dispersão 2. Medidas mais comuns 3. Considera como os dados estão distribuídos
Variância e Desvio Padrão 1. Medidas de dispersão 2. Medidas mais comuns 3. Considera como os dados estão distribuídos 4. Mostra variação ao redor da média (X ou m) ` X = 8,3 4 6 8 10 12
Fórmula da Variância Amostral 2 å (X - X) i 2 S = i = 1 n - 1 2 2 2 (X - X) + (X - X) + ... + (X - X) 1 2 n = n - 1
Fórmula da Variância Amostral 2 å (X - X) n - 1 no denominador! (Use N se Variância Populacional) i 2 S = i = 1 n - 1 2 2 2 (X - X) + (X - X) + L + (X - X) 1 2 n = n - 1
Fórmula do Desvio Padrão Amostral 2 S = S n 2 å (X - X) i = i = 1 n - 1 2 2 2 (X - X) + (X - X) + ... + (X - X) 1 2 n = n - 1
å å Exemplo da Variância Dados: 10,3 4,9 8,9 11,7 6,3 7,7 (X - X) X S 2 å å (X - X) X i i 2 S = i = 1 onde X = i = 1 = 8 , 3 n - 1 n 2 2 2 (10 , 3 - 8 , 3) + (4 , 9 - 8 , 3) + ... + (7 , 7 - 8 , 3) 2 S = 6 - 1 = 6 , 368
Questão Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são: 17, 16, 21, 18, 13, 16, 12, 11 Quais são a variância e o desvio padrão dos dados?
Solução å å Variância Amostral Dados: 17 16 21 18 13 16 12 11 (X - X) = i = 1 onde X = i = 1 = 15 , 5 n - 1 n 2 2 2 (17 - 15 , 5) + (16 - 15 , 5) + ... + (11 - 15 , 5) 2 S = 8 - 1 = 11 , 14
Solução å Desvio Padrão Amostral (X - X) S = S = = 11 , 14 = 3 , 34 n 2 å (X - X) i 2 S = S = i = 1 = 11 , 14 = 3 , 34 n - 1
Resumo das Medidas de Variabilidade Equação Descrição Amplitude Total X - X Dispersão Total maior menor Interv. Interquartílico Q - Q Dispersão 50% Centrais 3 1 Desvio Padrão X n i - ( ) å 2 1 Dispersão sobre (Amostral) Média Amostral Desvio Padrão å 2 Dispersão sobre ( ) X - m (Populacional) i Média Populacional N Variância S ( X - ` X ) 2 Dispersão Quadrática i (Amostral) n - 1 sobre Média Amostral
Forma
Forma 1. Descreve como os dados estão distribuídos 2. Medida pela simetria Simétrica Média = Mediana = Moda
Forma 1. Descreve como os dados estão distribuídos 2. Medida pela simetria Desvio à esquerda Simétrica Desvio à direita Méd. Median Moda Méd. = Median = Moda Moda Median Média
Quartis
Quartis 1. Medida de tendência não-central 2. Divide dados ordenados em 4 partes 3. Posição do i-ésimo quartil 25% 25% 25% 25% Q1 Q2 Q3 i × (n + 1) Posição de Q = i 4
Exemplo de Quartil (Q1) Dados: 10,3 4,9 8,9 11,7 6,3 7,7 Ordenados: 4,9 6,3 7,7 8,9 10,3 11,7 Posição: 1 2 3 4 5 6 1 × (n + 1) 1 × (6 + 1) Posição Q = = = 1 , 75 @ 2 1 4 4 Q = 6 , 3 1
Exemplo de Quartil (Q2) Dados: 10,3 4,9 8,9 11,7 6,3 7,7 Ordenados: 4,9 6,3 7,7 8,9 10,3 11,7 Posição: 1 2 3 4 5 6 2 × (n + 1) 2 × (6 + 1) Posição Q = = = 3 , 5 2 4 4 7 , 7 + 8 , 9 Q = = 8 , 3 2 2
Exemplo de Quartil (Q3) Dados: 10,3 4,9 8,9 11,7 6,3 7,7 Ordenados: 4,9 6,3 7,7 8,9 10,3 11,7 Posição: 1 2 3 4 5 6 3 × (n + 1) 3 × (6 + 1) Posição Q = = = 5 , 25 @ 5 3 4 4 Q = 10 , 3 3
Intervalo Interquartílico 1. Medida de dispersão 2. Também chamado dispersão central 3. Diferença entre terceiro e primeiro quartis 4. Dispersão dos 50% centrais 5. Não é afetado por valores extremos Intervalo Interquartílico = Q - Q 3 1
Questão Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são: 17, 16, 21, 18, 13, 16, 12, 11 Quais são os quartis Q1 e Q3 e o intervalo interquartílico?
Solução do Quartil Q1 Dados: 17 16 21 18 13 16 12 11 Ordenados: 11 12 13 16 16 17 18 21 Posição: 1 2 3 4 5 6 7 8 1 × (n + 1) 1 × (8 + 1) Posição Q = = = 2 , 25 @ 2 1 4 4 Q = 12 1
Solução do Quartil Q3 Dados: 17 16 21 18 13 16 12 11 Ordenados: 11 12 13 16 16 17 18 21 Posição: 1 2 3 4 5 6 7 8 3 × (n + 1) 3 × (8 + 1) Posição Q = = = 6 , 75 @ 7 3 4 4 Q = 18 3
Solução do Intervalo Interquartílico Dados: 17 16 21 18 13 16 12 11 Ordenados: 11 12 13 16 16 17 18 21 Posição: 1 2 3 4 5 6 7 8 Intervalo Interquart. = Q - Q = 18 - 12 = 6 3 1