A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Avaliação de Desempenho Planejamento de Experimentos 1 Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.

Apresentações semelhantes


Apresentação em tema: "Avaliação de Desempenho Planejamento de Experimentos 1 Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de."— Transcrição da apresentação:

1 Avaliação de Desempenho Planejamento de Experimentos 1 Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação

2 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados

3 Conteúdo 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalho Modelos para Planejamento de Experimento 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados

4 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho –Técnicas de Aferição: Protótipos, Benchmarks e Monitores –Técnicas de Modelagem: Solução Analítica e por Simulação 3.Análise de Resultados

5 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Análise Estatística dos Resultados –Comparação de Resultados –Aplicações em Sistemas Operacionais

6 Conteúdo 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalho Modelos para Planejamento de Experimento 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados

7 Motivação Como Agilizar? 1.Identificar os pontos negativos e verificar o impacto desse pontos: Verificar a freqüência com que o procedimento ocorre –Eventos raros e lentos: Pouco impacto Muita otimização para ser perceptível Exemplo: procedimento ao ligar o computador, falha ao entrar em uma região crítica –Eventos freqüentes: Muito impacto Pequena otimização pode ser perceptível Exemplo: processo escalonador 2. Propor soluções 3. Avaliar soluções Avaliação de Desempenho de Sistemas Computacionais

8 Conteúdo 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalho Modelos para Planejamento de Experimento 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados

9 Avaliação de Desempenho Por quê se preocupar com isso? O que vem a ser isso? Quando se preocupar com o desempenho? Quem deve se preocupar com a avaliação? Como medir o desempenho? Que técnicas utilizar? O que medir? Como confiar nas métricas obtidas?

10 Avaliação de Desempenho Como confiar nas métricas obtidas? Avaliação versus Análise Qual a diferença? Avaliar obter, produzir, levantar dados a respeito de uma entidade; exemplo: determinar o consumo de um automóvel usar alguma técnica para medir a distância percorrida e o volume de combustível consumido;

11 Avaliação de Desempenho Avaliação versus Análise Qual a diferença? Analisar verificar a precisão, a validade, o significado da grandeza produzida durante a avaliação. exemplo: se a avaliação do automóvel levou a 20 Km/litro de gasolina, então a análise se preocupa em se certificar que: a metodologia utilizada foi correta; que os números levantados são suficientemente precisos; e, então, conclui se o desempenho avaliado é bom, ruim, etc.

12 Pontos Importantes para a Avaliação de Desempenho 1. Entendimento completo do sistema, dos problemas e dos objetivos da avaliação 2. Abordagem sistemática 3. Não devem ser considerados parâmetros, cargas, métricas, etc. arbitrários. 4. Definição de uma carga de trabalho característica 5. Definição da metodologia mais apropriada 6. Definição do nível de detalhamento 7. Análise dos resultados 8. Considerar os limites, suposições e margem de erro

13 Avaliação de Desempenho 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalho Modelos para Planejamento de Experimento 2.Análise de Resultados 3.Técnicas para Avaliação de Desempenho

14 Etapas a serem consideradas na Avaliação de Desempenho Planejamento do Experimento 1. Estudar o sistema e definir os objetivos 2. Determinar os serviços oferecidos pelo sistema 3. Selecionar métricas de avaliação 4. Determinar os parâmetros que afetam o desempenho do sistema 5. Determinar o nível de detalhamento da análise

15 Etapas a serem consideradas na Avaliação de Desempenho 6. Determinar a Técnica de Avaliação apropriada 7. Determinar a carga de trabalho característica 8. Realizar a avaliação e obter os resultados 9. Analisar e interpretar os resultados 10. Apresentar os resultados As etapas apresentadas nem sempre são executadas linearmente como apresentado nesta lista

16 Etapas a serem consideradas 1. Estudar o sistema e definir os objetivos 2. Determinar os serviços oferecidos pelo sistema 3. Selecionar métricas de avaliação 4. Determinar os parâmetros que afetam o desempenho do sistema 5. Determinar o nível de detalhamento da análise 6. Determinar a Técnica de Avaliação apropriada 7. Determinar a carga de trabalho característica 8. Realizar a avaliação e obter os resultados 9. Analisar e interpretar os resultados 10. Apresentar os resultados Planejamento de Experimento Análise dos Resultados Técnica de Avaliação

17 Avaliação de Desempenho 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos BásicosConceitos Básicos Carga de trabalho Modelos para Planejamento de Experimento 2.Análise de Resultados 3.Técnicas para Avaliação de Desempenho

18 Deve ser utilizado em qualquer experimento É uma técnica muito importante para a indústria pois seu emprego permite resultados mais confiáveis economizando dinheiro e tempo Requer uma quantidade exaustiva de cálculos tornando fundamental o emprego de ferramentas Planejamento de Experimentos

19 Técnicas utilizadas para se planejar experimentos e definir: quais dados em que quantidade em que condições os dados devem ser coletados durante um determinado experimento Obter a maior precisão estatística possível na resposta a um menor custo Planejamento de Experimentos

20 Objetivos Obter o máximo de informação com um número mínimo de experimentos Separar os efeitos de vários fatores no resultado observado Determinar o quão significante é o efeito de um fator no resultado observado. Melhor qualidade dos resultados dos testes e um projeto com desempenho superior em termos de suas características funcionais e de sua robustez Planejamento de Experimentos

21 Terminologia Variável de Resposta – Saída de um experimento Fatores – Variável que afeta as variáveis de resposta e que podem assumir diversas alternativas Níveis – Os valores que um determinado fator pode assumir Fatores Primários – Fatores que causam um grande impacto em uma variável de resposta e que devem ser considerados Fatores Secundários – Fatores cujo impacto na variável de resposta não é significante ou não se tem interesse em quantificar Planejamento de Experimentos

22 Terminologia: Replicação – Repetição de todo ou de parte de um experimento Projeto - Determina o número de experimentos a serem considerados, incluindo o número de fatores e níveis, a combinação entre os níveis e o número de replicações para cada experimento Interação – Dois fatores interagem se o efeito de um depende do nível do outro Planejamento de Experimentos

23 Manipula-se de forma planejada certas variáveis independentes (fatores), definindo-se os valores mais prováveis que essas variáveis podem assumir (níveis) para verificar o efeito que esta manipulação provoca na variável de resposta (variável dependente)

24 Variável de Resposta O que medir? Quero ter a informação mais fiel possível sobre o comportamento de um sistema Diversos enfoques: Responsividade – tempo que leva para executar um serviço Produtividade – taxa de execução de um serviço por unidade de tempo Utilização – recurso utilizado para a execução do serviço Planejamento de Experimentos

25 Variável de Resposta O que medir? Velocidade Confiabilidade Disponibilidade Métricas individuais Métricas globais Planejamento de Experimentos

26 Variável de Resposta O que medir? Média Variabilidade Distribuição Máximo e mínimo Desvio Padrão Intervalo de confiança Planejamento de Experimentos

27 Medidas de Desempenho Categorias das medidas de despenho –Alto é melhor (High is Better - HB); –Baixo é melhor (Low is Better - LB); –Nominal é melhor (Nominal is Better - Nbi).

28 Medidas de Desempenho Tempo de resposta –intervalo entre o pedido do usuário e a resposta do sistema pedido e resposta instantâneos pedido e resposta realistas

29 Medidas de Desempenho tempo de resposta com pedido e resposta realistas geralmente o tempo de resposta cai na medida que a carga de trabalho diminui

30 Medidas de Desempenho Tempo de Resposta Visão do usuário Medida individual ou global Velocidade de execução de uma tarefa em determinadas condições Influencia da carga de trabalho do sistema Engloba diversas fases: tempo de espera por um trabalho comprimento de uma fila por um recurso tempo de processamento Valores médios/máximos/mínimos/distribuições

31 Medidas de Desempenho Troughput –Taxa de pedidos que podem ser servidos pelo sistema (pedidos por unidade de tempo) –Capacidade nominal –Troughput geralmente aumenta até certo ponto, depois começa a cair –Eficiência Medidas orientadas ao sistema

32 Medidas de Desempenho Utilização –Fração de tempo em que o recurso está ocupado –Relação entre o serviço útil executado e a carga máxima suportada pelo sistema (processador por exemplo) Avalia quão bem os vários elementos do sistema estão sendo utilizados Medidas orientadas ao sistema

33 Medidas de Desempenho Disponibilidade –fração de tempo em que o sistema está disponível pode ser utilizada como uma medida de desempenho, apesar de medir aspectos de confiabilidade; algumas medidas úteis: tempo de vida; intervalo de disponibilidade; MTTF (mean time to failure); MTTR (mean time to repair); MTBF (mean time between failures).

34 Medidas de Desempenho Produtividade do Sistema Indica como o usuário pode submeter o seu trabalho; Indica o grau de facilidade oferecido pelo sistema; Aspectos de manutenção do sistema; Existe certa dificuldade para quantificar esse item.

35 Medidas de Desempenho Custo/Desempenho –melhor relação Confiabilidade –tempo provável em que o sistema fica livre de erros

36 Medidas de Desempenho -Fabricantes apresentam números de pico de MIPS e MFLOPS superiores aos reais, valores obtidos em situações ideais -Comparação entre máquinas com conjunto de instruções diferentes – CISC X RISC MIPS Milhões de Instruções por Segundo MFLOPS Milhões de Instruções de Ponto Flutuante por Segundo

37 Medidas de Desempenho MIPS e MFLOPS são relevantes quando aplicados em computadores de mesma arquitetura para análise comparativa –Apresentam características similares de hardware e software –Números de MIPS e MFLOPS mais coerentes

38 Avaliação de Desempenho Qual ou quais das medidas acima devem ser consideradas? Depende da aplicação (do tipo do sistema): Uso Geral tempo de resposta e utilização desempenho; disponibilidade confiabilidade. Alta Disponibilidade (bancos, res. aéreas, etc.) tempo de resposta, disponibilidade e produtividade desempenho.

39 Avaliação de Desempenho Qual ou quais das medidas acima devem ser consideradas? Tolerantes a Falhas Disponibilidade e recuperação desempenho Tempo Real tempo de resposta e carga de trabalho desempenho. Orientados a Missão disponibilidade desempenho.

40 Avaliação de Desempenho Qual ou quais das medidas acima devem ser consideradas? Cuidado

41 Avaliação de Desempenho Aeronave Boeing 747 BAD/Sud Concorde Velocidade 610 mph 1350 mph Washington a Paris 6.5 horas 3 horas

42 Avaliação de Desempenho Passageiros 470 132 Throughput (pmph) 286,700 178,200 Aeronave Boeing 747 BAD/Sud Concorde Velocidade 610 mph 1350 mph Washington a Paris 6.5 horas 3 horas Tempo para executar a tarefa –tempo de resposta, latência Tarefas por dia, por hora, etc. –Throughput, bandwidth

43 Terminologia – Exemplo Considere a avaliação do aquário 1.Variáveis de Resposta (métricas): Planejamento de Experimentos Tempo para a cerveja atingir a temperatura desejada Número de cervejas que atingem a temperatura desejada por hora

44 Quatro fatores: Fator 1 – 3 níveis Fator 2 – 4 níveis Fator 3 – 3 níveis Fator 4 – 3 níveis Planejamento de Experimentos Tamanho do aquário: 30X30X30 30X30X60 60X60X30 (em centímetros) 2. Definição dos Fatores primários e níveis

45 Quatro fatores: Fator 1 – 3 níveis Fator 2 – 4 níveis Fator 3 – 3 níveis Fator 4 – 3 níveis Planejamento de Experimentos Quantidade de cervejas: 10 20 50 100

46 Quatro fatores Fator 1 – 3 níveis Fator 2 – 4 níveis Fator 3 – 3 níveis Fator 4 – 3 níveis Planejamento de Experimentos Quantidade de gelo 1 Kg 2 Kg 5 Kg

47 Quatro fatores: Fator 1 – 3 níveis Fator 2 – 4 níveis Fator 3 – 3 níveis Fator 4 – 3 níveis Planejamento de Experimentos Tamanho da cerveja : Lata – 350 ml Latão – 473 ml Super – 1000 ml

48 Espessura do vidro – 5 mm Temperatura inicial da cerveja – 25 graus Planejamento de Experimentos 2. Definição dos Fatores Secundários

49 3. Interação Fator A = Tamanho do aquário Fator B = Quantidade de gelo Fatores sem interação Fator A = Quantidade de gelo Fator B = Número de cervejas Fatores que interagem Planejamento de Experimentos Terminologia – Exemplo

50 Considere a avaliação de um banco de dados 1.Variáveis de Resposta (métricas): Planejamento de Experimentos Tempo para recuperar uma informação Número de informações recuperadas por unidade de tempo Taxa de acerto ao cache

51 Quatro fatores: Fator 1 – Tamanho do banco de dados Fator 2 – Quantidade de usuários Fator 3 – Quantidade de cache Fator 4 – Forma de armazenamento Planejamento de Experimentos 2. Definição dos Fatores primários e níveis

52 Fator 1 – Tamanho do banco de dados: 20 mil registros 1 milhão de registros 5 milhões de registros Fator 2 – Quantidade de usuários: 10 usuários 100 usuários 1000 usuários 10000 usuários Planejamento de Experimentos 2. Definição dos Fatores primários e níveis

53 Fator 3 – Quantidade de cache: 512K byte 1M byte 10 M byte Fator 4 – Forma de armazenamento: RAID – nível 10 com 5 discos RAID – nível 4 com 5 discos RAID – nível 5 com 5 discos Planejamento de Experimentos 2. Definição dos Fatores primários e níveis

54 Processamento Número de discos do RAID Planejamento de Experimentos 2. Definição dos Fatores Secundários

55 O que vocês acham de um banco em dia de pagamento? Planejamento de Experimentos Mais um ponto deve ser considerado.... Filas longas... Muita espera Desempenho ruim...

56 E o mesmo banco alguns dias antes do pagamento? Planejamento de Experimentos Mais um ponto deve ser considerado.... Filas curtas... Rapidez.... Atenção... Desempenho ótimo... Mas o mesmo sistema pode ter desempenho ótimo/ruim? Mais um ponto deve ser considerado.... Carga de trabalho imposta ao sistema

57 Conteúdo – Parte II 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalhoCarga de trabalho Modelos para Planejamento de Experimento 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados

58 Planejamento de Experimentos Tempo para atender cada cliente – 5 minutos Tempo entre a chegada de um cliente e outro – 2 minutos Três casos: Filas cada vez maiores Tempo para atender cada cliente – 6 minutos Tempo entre a chegada de um cliente e outro – 10 minutos Nenhuma fila Tempo para atender cada cliente – 5 minutos (na média) Tempo entre a chegada de um cliente e outro – 4 minutos (na média) ???

59 Caracterização de Carga de Trabalho Exemplo: Acesso a um disco com: Valor médio da taxa entre chegadas – 10 ms Valor médio do tempo de acesso ao disco – 8ms Simular de 0 a 100 m segundos – O que ocorre?

60 Caracterização de Carga de Trabalho Considerar agora que estes valores apresentam uma certa distribuição, de forma que os valores gerados são: Tempo de chegada: 12, 6, 4, 15, 20, 3, 1, 17, 12, 10 Tempo de serviço: 8, 12, 4, 7, 9, 12, 3, 1, 16, 8 (Tempo em m segundos) Simular de 0 a 100 m segundos - Qual a diferença observada?

61 Caracterização de Carga de Trabalho Conclusão: Na avaliação de desempenho de um sistema é muito importante considerar a carga de trabalho real do sistema

62 Procedimento para determinar Carga de Trabalho I. Determinar que tipo de caracteristica é importante ser representada Depende do objetivo da avaliação Exemplo: Um Sistema Computacional pode ser subdividido em 4 camadas que executam as seguintes operações:

63 1.Camada de aplicação que recebe as transações e envia comandos para o SO 2.Sistema Operacional que recebe os comandos e serviços e envia instruções para a CPU 3.CPU que divide as instruções em instruções aritméticas e lógicas e as envia para a ULA 4.ULA – executa instrução Qual tipo de carga de trabalho deve ser considerada? Depende da camada a ser analisada Procedimento para determinar Carga de Trabalho

64 1.Camada de aplicação que recebe as transações e envia comandos para o SO Freqüência dos diferentes tipos de transações efetuadas 2.Sistema Operacional que recebe os comandos e serviços e envia instruções para a CPU Conjunto de comandos e serviços oferecidos pelo SO 3. CPU que divide as instruções em instruções aritméticas e lógicas e as envia para a ULA Conjunto de Instruções 4. ULA – executa instrução Freqüência e tipo das instruções aritméticas

65 Caracterização de Carga de Trabalho e do Tempo de Serviço II. Nível de detalhe a ser considerado Várias possibilidades: a – Utilizar as requisições mais freqüentes b – Considerar os vários tipos de requisições e suas freqüências c – Trace: Seqüência de requisições com timestamp d – Utilizar valores médios e – Utilizar distribuições de probabilidade

66 Caracterização de Carga de Trabalho e do Tempo de Serviço III. Verificar a representatividade da carga de trabalho Três Aspectos importantes: a – Taxa de chegada b – Demanda por recurso c – Seqüência e demanda por diferentes recursos IV. Atualização da carga de trabalho

67 Tipos Básicos de Carga de Trabalho Precisamos agora de uma forma para representar a carga de trabalho. Basicamente, duas formas: 1.Carga de trabalho Real 2.Carga de trabalho Sintética

68 Tipos Básicos de Carga de Trabalho Real – Observada no sistema real em operação normal. Vantagem: –Precisão Desvantagens: –Não pode ser repetida com facilidade –Arquivos de Trace -> arquivos muito grandes

69 Tipos Básicos de Carga de Trabalho Sintética – Carga com características similares às reais Vantagens: Pode ser repetida de forma controlada Não necessita de arquivos com dados reais Carga pode ser facilmente modificada Pode ser transportada para diferentes sistemas Problema: Determinar a distribuição mais apropriada para o sistema em avaliação.

70 Etapas a serem consideradas 1. Estudar o sistema e definir os objetivos 2. Determinar os serviços oferecidos pelo sistema 3. Selecionar métricas de avaliação 4. Determinar os parâmetros que afetam o desempenho do sistema 5. Determinar o nível de detalhamento da análise 6. Determinar a Técnica de Avaliação apropriada 7. Determinar a carga de trabalho característica 8. Realizar a avaliação e obter os resultados 9. Analisar e interpretar os resultados 10. Apresentar os resultados Planejamento de Experimento Análise dos Resultados Técnica de Avaliação

71 Conteúdo – Parte II 1.Planejamento de Experimentos –Motivação –Introdução à Avaliação de Desempenho –Etapas de um Experimento –Planejamento do Experimento Conceitos Básicos Carga de trabalho Modelos para Planejamento de ExperimentoModelos para Planejamento de Experimento 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados


Carregar ppt "Avaliação de Desempenho Planejamento de Experimentos 1 Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de."

Apresentações semelhantes


Anúncios Google