Estatística Básica Utilizando o Excel Fernando Augusto Silva Marins 3a. Aula - Estatística Descritiva (medidas de posição e dispersão) Nevembro/2004 FEG & FOSJC
Tópicos Medidas de Tendência Central Média, Mediana, Moda Quartis Medidas de Dispersão Amplitude, Variância e Desvio-Padrão e coeficiente de Variação Nevembro/2004 FEG & FOSJC
Tópicos Formato Simétrica, assimétrica (Gráfico Box-and-whisker) (continuação) Formato Simétrica, assimétrica (Gráfico Box-and-whisker) Coeficiente de Correlação Nevembro/2004 FEG & FOSJC
Coeficiente de Variação Sumário das Medidas Sumário das Medidas Tendência Central Variação Quartis Média Moda Coeficiente de Variação Mediana Amplitude Variância Desvio-Padrão Nevembro/2004 FEG & FOSJC
Medidas de Tendência Central Média Mediana Moda Nevembro/2004 FEG & FOSJC
Média Média Amostra População Tamanho da Amostra Tamanho da População Nevembro/2004 FEG & FOSJC
Média Medida mais comum de tendência central (continuação) Medida mais comum de tendência central Afetada por valores extremos (outliers) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Média = 5 Média = 6 Nevembro/2004 FEG & FOSJC
Mediana Medida Robusta de Tendência Central Não é afetada por valores extremos Numa disposição ordenada, a mediana é o valor do “meio” se n, or N, é ímpar, a mediana é o número do meio da seqüência If n, or N, é par, a mediana é a média dos dois números centrais 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Mediana = 5 Mediana = 5 Nevembro/2004 FEG & FOSJC
Moda Valor que ocorre mais freqüentemente Não é afetada por valores extremos Pode não haver Moda num conjunto de dados Pode haver várias Modas num conjunto de dados 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Não há Moda Moda = 9 Nevembro/2004 FEG & FOSJC
Dividem os Dados já ordenados em 4 partes Quartis Dividem os Dados já ordenados em 4 partes Posição i-th Quartil: e são medidas de localização não-centrais = Mediana é medida de tendência central 25% 25% 25% 25% Dados ordenados: 11 12 13 16 16 17 18 21 22 Nevembro/2004 FEG & FOSJC
Medidas de Variação Variação Variância Desvio Padrão Coeficiente de Variação Amplitude Desvio Padrão População Variância População Desvio Padrão Amostra Variância Amostra Nevembro/2004 FEG & FOSJC
Amplitude (Range) Medida de variação Diferença entre o maior e o menor valor das observações: Ignora o tipo da distribuição dos dados Range = 12 - 7 = 5 Range = 12 - 7 = 5 7 8 9 10 11 12 7 8 9 10 11 12 Nevembro/2004 FEG & FOSJC
Variância Importante medida de variação Mostra variação média em torno da Média Variância Amostral: Variância Populacional: Nevembro/2004 FEG & FOSJC
Desvio Padrão Importante medida de variação Mostra variação média em torno da Média Está na mesma unidade dos dados originais Desvio padrão amostral: Desvio padrão populacional: Nevembro/2004 FEG & FOSJC
Comparação de Desvios Padrão Dados A Média = 15,5 s = 3,338 11 12 13 14 15 16 17 18 19 20 21 Dados B Média = 15,5 s = 0,9258 11 12 13 14 15 16 17 18 19 20 21 Dados C Média = 15,5 s = 4,57 11 12 13 14 15 16 17 18 19 20 21 Nevembro/2004 FEG & FOSJC
Coeficiente de Variação Mede variação relativa em relação à Média Sempre em percentages (%) Usado na comparação de 2 ou mais conjuntos de dados expressos em diferentes unidades de medidas Nevembro/2004 FEG & FOSJC
Comparação com Coeficientes de Variação Ação A: Preço médio último ano = $50, Desvio padrão = $5 Ação B: Preço médio último ano = $100, Desvio padrão = $5 Coeficientes de variação: Nevembro/2004 FEG & FOSJC
Formato de uma Distribuição Descreve como os Dados estão distribuídos Medidas de formato Simétrica ou Assimétrica Assimétrica à esquerda Simétrica Assimétrica à direita Média < Mediana < Moda Média = Mediana =Moda Moda < Mediana < Média Nevembro/2004 FEG & FOSJC
Análise Exploratória de Dados Gráfico de Box-and-whisker Usa o “Esquema dos 5 Números” e constrói os Box Plots Mediana( ) X X maior menor 4 6 8 10 12 Nevembro/2004 FEG & FOSJC
Formato da Distribuição e o Gráfico Box-and-Whisker Assimétrica à direita Assimétrica à esquerda Simétrica Nevembro/2004 FEG & FOSJC
Coeficiente de Correlação Mede o grau da relação linear entre duas variáveis quantitativas (X e Y) Nevembro/2004 FEG & FOSJC
Aspectos do Coeficiente de Correlação Adimensional Varia entre –1 e 1 Mais perto de –1, mais forte a relação linear negativa Mais perto de 1, mais forte a relação linear positiva Mais perto de 0, mais fraca é a relação linear Nevembro/2004 FEG & FOSJC
Diagramas de Dispersão (Scatter Plots) Y Y Y X X X r = -1 r = -.6 r = 0 Y Y X X r = .6 r = 1 Nevembro/2004 FEG & FOSJC