A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Descritiva

Apresentações semelhantes


Apresentação em tema: "Estatística Descritiva"— Transcrição da apresentação:

1 Estatística Descritiva

2 SUMARIZANDO DADOS MENSURADOS
Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas de dispersão: variância, desvio padrão, coeficiente de variação.

3 Média aritmética

4 Mediana É o valor central ou a média aritmética dos dois valores centrais.

5 Em que: L1 = limite inferior da classe mediana (isto é, da classe que contém a mediana); N = número de itens dos dados (isto é, freqüência total); (f)1 = soma de todas as freqüências das classes inferiores à mediana; fmediana = freqüência da classe mediana; c = amplitude do intervalo da classe mediana.

6 Moda É o valor que ocorre com a maior freqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista, pode não ser única.

7 Em que: L1 = limite inferior da classe modal (isto é, a que contém a moda); 1 = excesso da freqüência modal sobre a da classe imediatamente inferior; 2 = excesso da freqüência modal sobre a da classe imediatamente superior; c = amplitude do intervalo da classe modal.

8 Quartis, decis e percentis
De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis.

9 Variância, desvio padrão

10 Para as distribuições normais
(a) 68,27% dos casos estão incluídos entre X -s e X + s (isto é, um desvio padrão de cada lado da média); (b) 95,45% dos casos estão incluídos entre X - 2s e X + 2s (isto é, dois desvios padrões de cada lado da média); (c) 99,73% dos casos estão incluídos entre X - 3s e X + 3s (isto é, três desvios padrões de cada lado da média).

11 Se a dipersão absoluta é o desvio padrão s e média é a aritmética X, a dispersão relativa é denominada coeficiente de variação ou de dispersão.

12 A arte de representar dados

13 Mas por que usar gráficos?
Uma imagem vale mais que ... Ganho considerável de tempo para o leitor A informação fica mais concisa Atrai mais a atenção

14 Com o quê estamos lidando?
Variáveis qualitativas ou quantitativas. Qualitativas são caracterizadas por estados, níveis ou categorias ordenadas e não ordenadas Quantitativas níveis expressos numericamente discretas ou contínuas

15 Preparando os Gráficos
Diretrizes gerais, não regras

16 Preparando os gráficos
Requerer mínimo esforço do leitor Nível de esforço para ler e entender o gráfico Ex: direct labeling vs. legend box A B C Número de usuários Tempo de Resposta B A C Número de usuários Tempo de Resposta

17 Preparando os gráficos (cont.)
Maximizar informação O gráfico deve ser auto-explicativo Eixos devem ser informativos Usar práticas usualmente aceitas Exs: origem em (0,0); escala cresce da esquerda pra direita; escalas lineares...

18 Preparando os gráficos (cont.)
Evitar ambigüidades Identificar todos os elementos do gráfico(eixos, escala, origem, curvas individuais...) Minimizar tinta Dia da semana Disponibilidade 1 2 3 4 5 Dia da semana Indisponibilidade 0.1 1 2 3 4 5

19 Preparando os gráficos (cont.)
Os eixos de coordenadas são mostrados e rotulados? As escalas e divisões são mostradas em ambos os eixos? O número de curvas é razoável? Todos os gráficos usam a mesma escala? As unidades de medida são indicadas? O gráfico usa as convenções de representação? Não existem curvas, símbolos, ou textos que podem ser removidos sem afetar a informação?

20 Como falhar apresentando resultados
Erros Comuns Como falhar apresentando resultados

21 Erros comuns Apresentar muitas alternativas num único gráfico
Apresentar muitas “imagens” num único gráfico Informações “não interessantes” Selecionar variação de escala imprópria

22 Erros comuns (cont.) Uso de símbolos ao invés de texto =1 =3 =2 l R
(a)Símbolos 1 job/seg 3 jobs/seg 2 jobs/seg Taxa de chegada Response Time (b)Palavras Chave

23 Erros comuns (cont.) Usar gráficos de linha ao invés de coluna MIPS
Tipo da CPU MIPS 8000 8100 8200 8300

24 “Jogando” com as imagens
Levando Vantagem “Jogando” com as imagens

25 Levando vantagem Usando origens diferentes de (0,0) para enfatizar diferenças 5200 MINE YOURS 2610 2600

26 Levando vantagem (cont.)
Usando duas curvas diferentes num mesmo gráfico para enfatizar o contraste Número de Usuários Vazão Tempo de Resposta

27 Levando vantagem (cont.)
Plotar quantidades aleatórias sem indicar intervalos de confiança (a) Com intervalo de confiança (a) Sem intervalo de confiança MINE MINE YOURS YOURS

28 Levando vantagem (cont.)
Figuras modificadas em escala pela altura MINE YOURS

29 Levando vantagem (cont.)
Escolha “errada” do tamanho das células num histograma Frequência Tempo de Resposta [0,2] 4 6 8 10 12 [2,4] [4,6] [6,8] [8,10] [10,12] 2 Frequência Tempo de Resposta [0,6] 6 9 12 15 18 [6,12] 3

30 Levando vantagem (cont.)
Usar escalas quebradas em gráficos de coluna Tempo de Resposta 9 10 11 12 Sistema A B C D E F Tempo de Resposta Sistema A 4 6 8 10 12 B C D E F 2

31 Gráficos de Gantt Usado para exibir a duração relativa de qualquer número de condições booleanas. Cada condição é mostrada como um conjunto de segmentos de reta horizontais Os segmentos de reta são arranjados de forma que a sobreposição das retas representa a sobreposição das condições

32 Gráficos de Gantt (cont.)
0% 20% 40% 60% 80% 100% CPU Canal de I/O Rede 60 20 30 10 5 15

33 Gráficos de Kiviat Auxilia no reconhecimento de problemas de performance Gráfico circular em que as métricas são plotadas sobre retas radiais Parâmetros: 50% HB, 50% LB Devido a essa configuração, o gráfico ideal é uma estrela!

34 Gráficos de Kiviat (cont.)
CPU busy 90% CPU only 10% CPU/Channel overlap 80% CPU in problem state supervisor state wait Channel only Any Channel O gráfico ideal para um sistema balanceado

35 Gráficos de Kiviat (cont.)
CPU busy 90% CPU only 10% CPU/Channel overlap 80% CPU in problem state supervisor state wait Channel only Any Channel Exemplo de um sistema com problemas de balançeamento

36 Mas e se tudo isso não funcionar para convencer os decision makers?

37 Rejeitando uma análise
O problema precisa de mais análise A carga do sistema precisa ser melhor entendida “Isso vai aumentar a complexidade e o custo” Isso vai violar o IEEE, ANSI, CCITT, ou qualquer outro padrão


Carregar ppt "Estatística Descritiva"

Apresentações semelhantes


Anúncios Google