A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Descrição e Apresentação de Dados

Apresentações semelhantes


Apresentação em tema: "Descrição e Apresentação de Dados"— Transcrição da apresentação:

1 Descrição e Apresentação de Dados
Tabelas: Univariadas Bivariadas Gráficos Colunas Barras Setores Linha Histogramas Polígono de frequências Ogivas

2 Apresentação de Dados Qualitativos
Distribuição de frequências: Variáveis qualitativas nominais: a distribuição de frequências é, simplesmente, uma lista das categorias ou valores que uma ou mais variáveis apresentam em conjunto com a quantidade de ocorrências (número) de cada valor ou categoria. Esta quantidade é denominada de frequência absoluta (No.). Também, podemos calcular a frequência percentual de cada categoria (%). Tabela univariada: resume todos os valores ou categorias de uma variável. Tabela 1: Alunos segundo sexo Sexo No. % Feminino 20 69% Masculino 9 31% Total 29 100%

3 Apresentação de Dados Qualitativos
Gráficos para variáveis Nominais: Tabela 1: Alunos segundo sexo Sexo No. % Feminino 20 69% Masculino 9 31% Total 29 100%

4 Apresentação de dados qualitativos
Tabela bi-variada: resume todos os valores ou categorias de duas variáveis. Tabela 2: Alunos segundo sexo e idade

5 Apresentação de dados qualitativos
Tabela bi-variada: resume todos os valores ou categorias de duas variáveis. Tabela 3: Distribuição de alunos segundo o usa do computador por sexo Usa o computador? Sexo Feminino Masculino Total Sim 55% 21% 76% Não 14% 10% 24% 69% 31% 100%

6 Apresentação de dados qualitativos Variáveis Ordinais
Tabela 4: Perspectiva inicial e atual dos funcionários Escala Perspectiva Inicial Perspectiva Final No. % 1 0% 2 3 4 5 3% 6 10% 7 20% 13% 8 10 33% 17% 9 27% 12 40% Total 30 100%

7 Apresentação de dados quantitativos
Distribuição de frequências - dados agrupados - Geralmente trabalhamos com conjuntos de centenas ou milhares de observações, onde uma análise razoável torna-se impraticável. Taxa de desistência de cartões de crédito CREDICARD Ponto médio xi Freq. Absoluta Freq. Cumulada Crescente 0,0 ├ 10,0 5 1 10,0 ├ 20,0 15 10 11 20,0 ├ 30,0 25 26 30,0 ├ 40,0 35 7 33 40,0 ├ 50,0 45 50,0 ├ 60,0 55 60,0├ 70,0 65 34 Total Nestes casos, podemos construir distribuições de frequências, agrupando resultados em classes pré estabelecidas. As classes são pequenos intervalos mutuamente exclusivos.

8 Histograma de Freqüências
Polígono de Freqüências Ogiva

9 Estatísticas Descritivas
Medidas de tendência central Medidas de dispersão Medidas separatrizes

10 Medidas de tendência central:
Xt ? Moda Mediana Média aritmética

11 A moda é o valor que ocorre mais freqüentemente nos dados.
No exemplo abaixo, observamos que a moda é 20. Esta é a idade mais freqüente no grupo de 45 pessoas.

12 As propriedades da moda podem ser resumidas como segue:
Muitas vezes a moda pode não ser uma boa medida descritiva, dado que para calcular a moda não são usadas todas as observações; A moda pode não ser um único valor, isto é, as observações podem apresentar mais de uma moda; Não podemos combinar modas para calcular uma média modal de duas modas separadas na distribuição; A moda é uma medida volátil, sensível a pequenas mudanças nas observações; A moda não é afetada por valores extremos (outliers).

13 ·  A mediana é o valor médio central após ordenarmos os dados em forma ascendente.
(50%) (50%)

14 Para calcular a mediana devemos realizar os seguintes passos:
ordenar as observações em forma ascendente; identificar o meio ou centro das observações; o valor médio central das observações é a mediana. Algebricamente, a mediana é o valor que ocupa a posição Caso a razão não seja um número inteiro, toma-se como mediana a média dos dois valores de posições mais próximas a .

15 Na tabela de distribuição de freqüências do exemplo, observamos que o centro das observações está na posição (45+1)/2 = 23,

16 É possível determinar graficamente a mediana da distribuição de freqüências, usando a curva da freqüência acumulada (ogiva). Para o exemplo, a curva da distribuição percentual acumulada da distribuição de idades é mostrada na figura abaixo Como no eixo vertical está marcada a freqüência percentual,localizamos o valor 50%. Deste ponto puxamos uma linha na horizontal até a ogiva, e uma linha vertical até a interseção com o eixo dos x’s.Assim, a mediana corresponde à idade de 20 anos.

17 As propriedades da mediana podem ser resumidas como segue:
·   A mediana não é volátil como a moda. ·  A mediana, da mesma forma que a moda, não é particularmente sensível a valores extremos. ·   A mediana toma sempre um único valor. ·  A mediana é igual a um valor observado se o número de observações (n) é um número ímpar. ·  A mediana pode ser determinada graficamente.

18 Média aritmética O conceito da média aritmética, ou simplesmente média, é bastante familiar. · Para calcular a média, soma-se todas as observações e divide-se pelo número de valores somados. Matematicamente, se as n observações são representadas como: X1, X2, Xn, a média aritmética pode ser escrita como: que pode ser representada numa forma mais sucinta

19 No exemplo 2, a idade média é calculada como:

20 Taxa de desistencia de cartões de crédito CREDICARD
Desvio padrão para dados em intervalos de classe Taxa de desistencia de cartões de crédito CREDICARD Ponto médio xi Freq. Absoluta (desvio) = (desvio)2 = 0,0 ├ 10,0 5 1 -19,7 388,09 10,0 ├20,0 15 10 125,3 15700,09 157000,9 20,0 ├30,0 25 350,3 122710,1 30,0 ├40,0 35 7 220,3 48532,09 339724,6 40,0 ├50,0 45 -24,7 610,09 50,0 ├60,0 55 60,0├70,0 65 40,3 1624,09 Total 34 68805, e S = 262,3081.

21 As propriedades da média aritmética podem ser resumidas como segue:
· Para calcular a média usa-se todas as observações disponíveis. ·  A média é afetada por valores extremos. · A média é uma medida estável a pequenas mudanças das observações. · A média não necessariamente será igual a um dos valores observados. ·  A média não pode ser determinada graficamente.

22 A escolha das medidas de tendência central
Tipo de variável Nominal Ordinal Quantitativos Moda sim Mediana não Média

23 Comparação entre as medidas de tendência central:

24 Medidas de Dispersão Amplitude total dos dados (AT) AT = Xmax - Xmin.
Esta medida depende apenas do menor e do maior valor do conjunto de dados. Em geral não é tão boa quanto as outras medidas de variação que levam em conta todos os valores.

25 Desvio Médio (DM) O desvio pela diferença di = (Xi – média)
mede o quão longe o dado está da média. Entretanto, a soma desses desvios sempre é igual a zero. Assim, uma medida de dispersão pode ser definida como o módulo dos desvios:

26 Outra medida de dispersão é definida como o desvio quadrático (desvio)2.
Variância (2, S2) Desvio Padrão (, S)

27 Para Entender o Desvio-Padrão
Devemos ter em mente que o desvio padrão mede a variação entre valores. Valores próximos uns dos outros originam desvios-padrão menores, enquanto valores muito afastados uns dos outros dão um desvio-padrão maior. Uma regra prática que utiliza a amplitude para obter uma estimativa bastante rudimentar do desvio padrão é: Uma regra prática: Desvio padrão 

28 Regra empírica: aplicável somente a conjuntos de dados com distribuição aproximadamente simétrica (forma de sino). 99% 95% 68%

29 Coeficiente de Variação (CV)
Onde: é a média aritmética e e a variância.

30 Outras Medidas de Posição:
Quartis: Divide a distribuição em 4 partes iguais. Há três quartis denotados por Q1, Q2 e Q3 ,que dividem os dados ordenados em 4 grupos com 25% das observações em cada grupo; Decis: Divide a distribuição em 10 partes iguais. Há nove decis, denotados por D1, D2, ... D9 , que dividem os dados em 10 grupos com cerca de 10% das observações em cada grupo. Percentis: Divide a distribuição em 100 partes iguais. Há 99 percentis, que dividem os dados em 100 grupos com cerca de 1% das observações em cada grupo.

31 Pontos discrepantes Diagrama em caixas – Box-Plot

32 Diagrama em caixas – Box-Plot
Atípicos Atípicos Valores maiores do que Q3 + 1,5(Q3 - Q1) ou menores do que Q1 - 1,5(Q3 - Q1) são considerado atípicos.

33 Valores maiores do que Q3 + 3(Q3 - Q1) ou menores do que Q1 - 3(Q3 - Q1) são considerados outliers.

34 Medidas de Assimetria Primeiro Coeficiente de Pearson:
Segundo Coeficiente de Pearson: Se As < 0 a distribuição é assimétrica negativa; As = 0 a distribuição é simétrica; As > 0 a distribuição é assimétrica positiva.

35 Medidas de Curtose Curtose é o grau de achatamento de uma distribuição que pode ser medido utilizando o seguinte coeficiente: Onde: Q1 e Q3 são os quartis, P90 e P10 são os percentis. Se K > 0,263 a distribuição de freqüências é platicúrtica; K = 0,263 a distribuição de freqüências é mesocúrtica; K < 0,263 a distribuição de freqüências é leptocúrtica.


Carregar ppt "Descrição e Apresentação de Dados"

Apresentações semelhantes


Anúncios Google