A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo.

Apresentações semelhantes


Apresentação em tema: "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."— Transcrição da apresentação:

1 1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação

2 2 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos

3 3 Introdução Massa de Dados Dados agrupados Parâmetros Típicos Coleta de Dados Organização dos Dados Caracterização dos Dados 2 X H Estatística Descritiva

4 4 Introdução Inferência Estatística –A partir de amostras -> conclusões sobre a população Erro amostral – elementos atípicos que não representam a amostra -> diferença entre amostra e população Amostra viciada – tendência maior em selecionar algum tipo de elemento

5 5 Análise de Resultados - Introdução População Amostragem Amostra Dados Organizados Conclusões sobre a população Inferência Análise Descritiva

6 6 Introdução Inferência Estatística –Erro amostral - cálculo aproximado N – tamanho da população E 0 – Erro amostral tolerável n – tamanho da amostra

7 7 Introdução Inferência Estatística –Erro amostral - cálculo aproximado N – tamanho da população E 0 – Erro amostral tolerável n – tamanho da amostra E0E0 Pesquisas eleitorais Esse comportamento explica a razão da amostra para eleição de prefeito de uma grande cidade ser praticamente igual a de eleição para presidente

8 8 Análise de Resultados Universo: Eleitorado brasileiro eleitores Tamanho da amostra: entrevistas A margem de erro é de dois pontos percentuais para mais ou para menos. Intervalo de Confiança- 95% Universo: Cidade de São Paulo eleitores Tamanho da amostra = entrevistas A margem de erro é de três pontos percentuais para mais ou para menos. Intervalo de Confiança- 95%

9 9 Análise de Resultados A margem de erro é de três pontos percentuais para mais ou para menos. Intervalo de Confiança- 95%

10 10 Análise de Resultados A margem de erro é de dois pontos percentuais para mais ou para menos. Intervalo de Confiança- 95%

11 11 Análise de Resultados Segundo Sir Conan Doyle, criador do personagem Sherlock Holmes: "Enquanto um homem individualmente é um quebra-cabeças insolúvel, no conjunto, ele se torna uma certeza matemática. Você nunca pode prever o que um homem fará, mas pode dizer com precisão o que, em média, um número deles fará. Individualmente eles variam, mas em média se mantêm constantes."

12 12 Análise de Resultados errado Procedimento errado normalmente utilizado para uma avaliação 1.Desenvolvimento de um procedimento para avaliação 2.Validação e verificação do sistema de avaliação uma 3.Obtenção dos resultados através de uma execução da forma de avaliação escolhida 4.Conclusões sobre o sistema em estudo Equivalente a se considerar uma amostra unitária

13 13 Análise de Resultados errado Por que esse Procedimento está errado ? Sistema a ser Avaliado entradas saídas Resultados Tem-se controle de todo o sistema? Como são controladas as entradas do sistema? Quais as condições iniciais do sistema? O que mais o sistema está processando no momento da avaliação? Como controlar as interrupções? Diferentes características a serem consideradas, p.ex. onde estão localizadas as informações no disco? Aferição

14 14 Análise de Resultados errado Por que esse Procedimento está errado ? Tarefa programada pode ser ativada durante a execução? Interrupção do clock. Variável necessária está no cache? Na primeira vez que o processo executa pode não estar. Quais as condições iniciais do sistema? Que outros processos estão executando? Tempo para Execução de um processo em um Sistema Operacional

15 15 Análise de Resultados Sistema a ser Avaliado Modelo Execução da simulação entradas saídas Variáveis aleatórias Resultados Estocásticos Representadas por Estimativa das Modelagem

16 16 Análise de Resultados Portanto, Em uma aferição, a medida obtida é uma dentre um conjunto de possibilidades Em uma Simulação Estocástica, tem-se uma variabilidade inerente ao processo estocástico da simulação

17 17 Análise de Resultados Portanto... Deve-se utilizar os resultados que a estatística nos oferece para analisar os resultados dos experimentos.

18 18 Análise de Resultados População População Amostragem Amostra Dados Organizados Conclusões sobre a população Inferência Análise Descritiva Conjunto de Resultados Possíveis (infinito) Conjunto de Medições Realizadas Cálculo de médias, máximos, mínimos,intervalo de confiança, erro... Conclusões sobre o Sistema Real

19 19 Análise de Resultados Cuidado... Como mentir com Estatística livro célebre de Huff, Na verdade, nem sequer é preciso mentir, apenas mostrar a informação conveniente e omitir as outras Ricupero

20 20 Análise de Resultados Cuidado... Os números são lindos!!!! Mas são também traiçoeiros.... Primeiro ponto a ser considerado Que métricas estão sendo utilizadas? O que representam os valores obtidos?

21 21 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

22 22 Medidas de Desempenho Freqüentemente Utilizadas Medidas de Posição –Média –Moda –Mediana Medidas de Dispersão –Desvio Padrão –Variância –Percentis –Box-Plot

23 23 Medidas de Posição Média –média aritmética dos valores –valores extremos puxam a média Moda –valor que ocorre mais vezes Mediana –divide o conjunto em duas partes iguais –num conjunto ordenado a mediana esta no centro –Não é influenciada por valores extremos

24 24 Medidas de Posição Média X Mediana

25 25 Medidas de Posição Exemplo: Medidas relacionadas a utilização da CPU de um Servidor

26 26 Medidas de Dispersão –Variância –Desvio Padrão –Análise de percentis –Box-Plot

27 27 Medidas de Posição/Dispersão Exemplo: Medidas relacionadas a utilização da CPU de um Servidor

28 28 Medidas de Dispersão Percentis – dividem os dados em cem partes de tamanhos iguais Quartis: dividem em quatro grupos, delimitados pelos percentis 25, 50 e 75 –1º Quartil Q1 ou Q valor a que corresponde a percentagem cumulativa de 25% –3º Quartil Q3 ou Q valor a que corresponde a percentagem cumulativa de 75%

29 29 Medidas de Posição/Dispersão Exemplo: Medidas relacionadas a utilização da CPU de um Servidor

30 30 Medidas de Dispersão Box Plot –Mostra a mediana, primeiro e terceiro quartis de uma distribuição (pontos 50%, 25% e 75% na distribuição acumulada) –Noção de outlier: observação que se encontra a mais de um dado múltiplo (1.5 ou 3.0) do intervalo inter-quartílico, acima ou abaixo dos percentis 75% e 25%, respectivamente

31 31 Medidas de Dispersão Outliers – valores extremos da população. Moderados (1ª espécie)(o) [Q3+1.5(Q3-Q1) ; Q3+3(Q3-Q1)] e [Q1-1.5(Q3-Q1) ; Q1-3(Q3-Q1)] Severos (2ª espécie)(*) [Q3+3(Q3-Q1) ; máximo] e [mínimo ; Q1-3(Q3-Q1)] Q3 ou Q0.75 Q1 ou Q0.25 Mediana D D – Distância entre Quartis I I – Intervalo das Amostras sem Outliers *oo*oo oooo *

32 32 Medidas de Posição/Dispersão Exemplo: Medidas relacionadas a utilização da CPU de um Servidor

33 33 Medidas de Dispersão Valores extremos Outliers –Dados díspares, muito grandes ou muito pequenos, em relação aos demais, –Influenciam muito as médias –Podem distorcer conclusões –É fundamental sua detecção e tratamento. Possíveis causas de valores espúrios: –Erro na fase de mensuração (tomada da medida) –Erro na transcrição ou anotação do registro –Mudanças (reais) não-controláveis nas condições experimentais. –Característica da variável (ex.:instabilidade)

34 34 Medidas de Dispersão Tratamento de Outliers –Muita controvérsia... –Não existe um critério ou metodologia para rejeição de dados –Problema maior quando tem-se pequena quantidade de dados ou uma distribuição normal não pode ser garantida.

35 35 Medidas de Dispersão Analisando Observações Atípicas (Exemplos) –Exemplo 1 – amostra sendo obtida em um sistema durante o mês de abril de 2a. a 6a. das 9 as 17; 21/04 – 6a.feira – feriado - deve ser desprezado –Exemplo 2- Requisições de um servidor Web –Exemplo 3 –Sistema Distribuído ambiente de desenvolvimento de software – distribuição bimodal –Exemplo 4 –Acessos a um servidor Web ao longo de um dia

36 36 Medidas de Dispersão Podem-se desprezar dados atípicos? Apenas o especialista na área pode responder.....

37 37 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

38 38 Análise de Resultados Considera-se que alguma técnica para avaliação de desempenho e obtenção dos resultados tenha sido utilizada

39 39 Análise de Resultados Em qualquer experimentação, três problemas a serem considerados: 1.Condições iniciais da experimentação 2.Quando parar uma experimentação 3.Resultado de uma execução oferece um resultado dentre muitos outros possíveis

40 40 Análise de Resultados Primeiro problema: Qual as condições iniciais que deve-se ter para iniciar uma avaliação? Três condições possíveis: 1.Início no estado vazio; 2.Início no estado de maior probabilidade de ocorrência; 3.Início na média do estado de equilíbrio

41 41 Análise de Resultados 1.Início no estado vazio Simples Todos os servidores desocupados -> filas vazias Importante para a análise do transitório mas não do comportamento estacionário Ex.: Banco Comportamento normal x inicial Solução: Valores iniciais Truncamento Experimentação muito grande

42 42 Análise de Resultados 2.Início no estado de maior probabilidade de ocorrência; Vantagem: –Come ç ar em um estado representativo do sistema Desvantagem: –Como determinar o estado mais prov á vel? –Como levar o sistema at é esse estado?

43 43 Análise de Resultados 3.Início na média do estado de equilíbrio Come ç ar a coleta para estat í sticas quando os resultados se estabilizam Truncamento de dados Per í odo de aquecimento – warm-up Retardar a coleta de estat í sticas por um per í odo de aquecimento Problema: quando truncar? 10% do valor total (??)

44 44 Análise de Resultados Segundo problema: Quando parar a Avaliação? Algumas possibilidades: 1.Limitar tempo de experimentação 2.Limitar o número de elementos que entram no sistema avaliado 3.Limitar o número de entidades processadas por um servidor 4.Parada automática

45 45 Análise de Resultados 1.Limitar tempo de experimentação Desvantagem: número de amostras coletadas será diferente em cada caso 2.Limitar o número de elementos que entram no sistema Termina em estado vazio e ocioso Problema inicial

46 46 Análise de Resultados 3.Limitar o número de entidades processadas por um servidor Problema: sistemas com prioridades Ex.: termina só com tarefas longas na fila – pode camuflar os resultados 4.Parada automática Manipulam resultados da experimentação em intervalos selecionados Calculam média e variância Experimentação pára quando a estimativa da variância da média está dentro de certa tolerância

47 47 Análise de Resultados Primeiro e Segundo problemas: Relacionados com a condução do experimentoRelacionados com a condução do experimento Dependem muito da técnica de avaliação que está sendo utilizadaDependem muito da técnica de avaliação que está sendo utilizada Depende bastante do sistema que deve ser avaliadoDepende bastante do sistema que deve ser avaliado Serão melhor discutidos em cada técnica de avaliação e/ou aplicação consideradaSerão melhor discutidos em cada técnica de avaliação e/ou aplicação considerada

48 48 Análise de Resultados Terceiro problema: Durante a obtenção de dados sobre sistemas computacionais, tem-se que... Os Resultados de uma medição oferecem um resultado dentre muitos outros possíveis

49 49 Análise de Resultados Terceiro problema: Deve ser utilizado em qualquer experimento que gere um conjunto de resultados possíveisDeve ser utilizado em qualquer experimento que gere um conjunto de resultados possíveis Após a obtenção dos resultados estes devem ser analisados independente da técnica utilizadaApós a obtenção dos resultados estes devem ser analisados independente da técnica utilizada Qual resultado deve ser considerado?Qual resultado deve ser considerado? Como comparar dois conjuntos de resultados?Como comparar dois conjuntos de resultados?

50 50 Análise de Resultados Como analisar os diferentes resultados de uma avaliação? Primeiro objetivo da análise estatística dos resultados é estimar o erro ou intervalo de confiança Deve-se considerar diversos resultados provenientes de diferentes execuções –Para simulação: utilizar conjuntos de números aleatórios sem correlação – diferentes sementes –Para aferição: considerar diversas medidas

51 51 Utilização da CPU Semente Semente Semente Semente Semente DISCO2 CPU DISCO1 Análise de Resultados - Exemplo Como analisar estes resultados? Perigo utilizar resultados de uma única simulação

52 52 Análise de Resultados Utilização de Intervalos de confiança A partir de um conjunto de resultados possíveis queremos estimar o comportamento de um sistema Podemos utilizar: –Valores fixos –Intervalos Valores fixos não permitem estimar o erro cometido Intervalos de confiança permitem avaliar a confiança no resultado


Carregar ppt "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."

Apresentações semelhantes


Anúncios Google