A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo.

Apresentações semelhantes


Apresentação em tema: "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."— Transcrição da apresentação:

1 1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação

2 2 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos

3 3 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

4 4 Introdução Massa de Dados Dados agrupados Parâmetros Típicos Coleta de Dados Organização dos Dados Caracterização dos Dados 2 X H Estatística Descritiva

5 5 Introdução População População Amostragem Amostra Dados Organizados Conclusões sobre a população Inferência Análise Descritiva Conjunto de Resultados Possíveis (infinito) Conjunto de Medições Realizadas Cálculo de médias, máximos, mínimos,intervalo de confiança, erro... Conclusões sobre o Sistema Real

6 6 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

7 7 Medidas de Desempenho Medidas de Posição –Média –Moda –Mediana Medidas de Dispersão –Desvio Padrão –Variância –Percentis –Box-Plot

8 8 Medidas de Dispersão Outliers – valores extremos da população. Moderados (1ª espécie)(o) [Q3+1.5(Q3-Q1) ; Q3+3(Q3-Q1)] e [Q1-1.5(Q3-Q1) ; Q1-3(Q3-Q1)] Severos (2ª espécie)(*) [Q3+3(Q3-Q1) ; máximo] e [mínimo ; Q1-3(Q3-Q1)] Q3 ou Q0.75 Q1 ou Q0.25 Mediana D D – Distância entre Quartis I I – Intervalo das Amostras sem Outliers *oo*oo oooo *

9 9 Medidas de Dispersão Valores extremos Outliers –Dados díspares, muito grandes ou muito pequenos, em relação aos demais, –Influenciam muito as médias –Podem distorcer conclusões –É fundamental sua detecção e tratamento. Possíveis causas de valores espúrios: –Erro na fase de mensuração (tomada da medida) –Erro na transcrição ou anotação do registro –Mudanças (reais) não-controláveis nas condições experimentais. –Característica da variável (ex.:instabilidade)

10 10 Medidas de Dispersão Tratamento de Outliers –Muita controvérsia... –Não existe um critério ou metodologia para rejeição de dados –Problema maior quando tem-se pequena quantidade de dados ou uma distribuição normal não pode ser garantida.

11 11 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

12 12 Análise de Resultados Em qualquer experimentação, três problemas a serem considerados: 1.Condições iniciais da experimentação 2.Quando parar uma experimentação 3.Resultado de uma execução oferece um resultado dentre muitos outros possíveis

13 13 Análise de Resultados Primeiro problema: Qual as condições iniciais que deve-se ter para iniciar uma avaliação? Três condições possíveis: 1.Início no estado vazio; 2.Início no estado de maior probabilidade de ocorrência; 3.Início na média do estado de equilíbrio

14 14 Análise de Resultados Segundo problema: Quando parar a Avaliação? Algumas possibilidades: 1.Limitar tempo de experimentação 2.Limitar o número de elementos que entram no sistema avaliado 3.Limitar o número de entidades processadas por um servidor 4.Parada automática

15 15 Análise de Resultados Terceiro problema: Durante a obtenção de dados sobre sistemas computacionais, tem-se que... Os Resultados de uma medição oferecem um resultado dentre muitos outros possíveis

16 16 Análise de Resultados Terceiro problema: Deve ser utilizado em qualquer experimento que gere um conjunto de resultados possíveisDeve ser utilizado em qualquer experimento que gere um conjunto de resultados possíveis Após a obtenção dos resultados estes devem ser analisados independente da técnica utilizadaApós a obtenção dos resultados estes devem ser analisados independente da técnica utilizada Qual resultado deve ser considerado?Qual resultado deve ser considerado? Como comparar dois conjuntos de resultados?Como comparar dois conjuntos de resultados?

17 17 Análise de Resultados Como analisar os diferentes resultados de uma avaliação? Primeiro objetivo da análise estatística dos resultados é estimar o erro ou intervalo de confiança Deve-se considerar diversos resultados provenientes de diferentes execuções –Para simulação: utilizar conjuntos de números aleatórios sem correlação – diferentes sementes –Para aferição: considerar diversas medidas

18 18 Utilização da CPU Semente 1 0.33123 Semente 2 0.32571 Semente 3 0.32510 Semente 4 0.31999 Semente 5 0.33813 DISCO2 CPU DISCO1 Análise de Resultados - Exemplo Como analisar estes resultados? Perigo utilizar resultados de uma única simulação

19 19 Análise de Resultados Utilização de Intervalos de confiança A partir de um conjunto de resultados possíveis queremos estimar o comportamento de um sistema Podemos utilizar: –Valores fixos –Intervalos Valores fixos não permitem estimar o erro cometido Intervalos de confiança permitem avaliar a confiança no resultado

20 20 Análise de Resultados O que é o Intervalo de confiança? Intervalo que com uma determinada probabilidade (confiança) contem o valor do parâmetro estudado 1- /2 Intervalo de Confiança Y Y+H Y-H Confiança = 100*(1- )% = probabilidade de erro Y = média da amostra H = Largura do Intervalo de Confiança

21 21 Análise de Resultados O que significa Intervalo de confiança? Se Confiança = 95% Tenho 95% de chance de que parâmetro estará dentro do intervalo Nada garante que o resultado de uma única execução (Y i ) cairá no intervalo 1- /2 Intervalo de Confiança Y Y+H Y-H O resultado de uma única execução poderá estar na área definida por/2

22 22 Análise de Resultados Como determinar o Intervalo de confiança? 1.Ordenar os valores obtidos 2.Eliminar os /2 maiores valores 3.Eliminar os /2 menores valores 4.Obtém-se o intervalo procurado

23 23 Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido Utiliza-se o Teorema do Limite Central e a Tabela t-student Para amostras maiores que 30 ou com desvio padrão da população conhecido Utiliza-se o Teorema do Limite Central e a Tabela Z

24 24 Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido Utiliza-se o Teorema do Limite Central e a Tabela t-student Conheço o desvio padrão da amostra - DP

25 25 Análise de Resultados

26 26 Análise de Resultados Como determinar o Intervalo de confiança? Média Amostral Y i = Média das observações de uma execução Estimativa Global Y = Média das médias amostrais Variância Amostral Desvio Padrão (DP) t 1- /2,N-1 distribuição Student com N-1 graus de liberdade e nível de confiança igual a 1-

27 27 Análise de Resultados 1- /2 Intervalo de Confiança Y Y+H Y-H Como determinar o Intervalo de confiança? Largura do Intervalo de Confiança de 100(1- )% H = t * DP/ H = t 1- /2,N-1 * Intervalo de confiança Y ± H Relação entre halfwidth e média H/Y

28 28 Análise de Resultados Como determinar o Intervalo de confiança? No excel... Função INT.CONFIANÇA considera que o desvio padrão da população é conhecido. Quando apenas o desvio padrão da amostra é conhecido, deve-se calcular o intervalo de confiança utilizando a função: =INVT( ;n-1)*(DESVPAD(amostra)/RAIZ(n))

29 29 Análise de Resultados - Exemplo X i : tempo na fila para cliente i X: tempo médio na fila para 5.000 clientes : média real para tempo na fila -> não conhecido T chegada = 125 T serviço = 100

30 30 Análise de Resultados - Exemplo Simulação executada 10 vezes para diferentes conjuntos de números aleatórios, obtendo-se: 331,993447,532 366,052420,858 403,524355,959 464,856492,144 393,393389,200 Y = 406,551 Esse valor está suficientemente próximo de ?

31 31 Análise de Resultados - Exemplo Simulação executada 10 vezes 1- = 0,95 = 0,05 Média = Y = 406,551 Variância = S 2 = DP = t.05/2;9 = 2,26 H = t.05/2;9 *DP/ =36,012 IC: 370,54 – 442,56 331,993447,532 366,052420,858 403,524355,959 464,856492,144 393,393389,200

32 32 Análise de Resultados - Exemplo H = 36,012 IC: 370,54 – 442,56 Tem-se 95% de certeza que a média verdadeira está entre 370,54 – 442,56 Valores individuais podem estar fora do intervalo de confiança Se a simulação for repetida várias vezes e em cada vez for determinado o intervalo de confiança, 95% destes intervalos irão conter a média verdadeira

33 33 Análise de Resultados - Exemplo Média = Y = 406,554 H = 36,012 IC: 370,54 – 442,56 Amplitude do intervalo de confiança = 72 17,8% do valor médio Não é um valor muito grande? Como diminuir? Aumentando o número de replicações

34 34 Análise de Resultados Controle do Erro Utilizando-se a técnica de replicações: Não pode-se determinar a precisão desejada Pode-se determinar, aproximadamente, quantas replicações adicionais deve-se considerar para controlar o erro

35 35 Análise de Resultados - Exemplo Para o exemplo anterior Suponha que se queira 2*H <= 15% da Média H <=30,49 Seja r = as próximas replicações rt r-1;0,95 t r-1;0,95 * 112,2315,934 35,53393 122,20 15,193 33,42448 132,1814,546 31,71058 142,1613,975 30,18703 São necessárias mais 4 replicações para atingir o erro máximo desejado

36 36 Análise de Resultados Batch Means – outra abordagem para atingir a precisão desejada Executar uma parte da experimentação (batch) Determinar intervalo de confiança Se atingiu precisão Então parar Senão Executar mais um batch e retornar ao cálculo do intervalo de confiança Vantagem: apenas 1 warm-up Desvantagem: maior complexidade

37 37 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

38 38 Análise de Resultados Comparação entre dois experimentos Testes estatísticos podem ser utilizados para definir se os resultados provenientes de dois experimentos são conclusivos Definem se os resultados são estatisticamente diferentes

39 39 Comparação entre dois experimentos Variabilidade Média Variabilidade Baixa Variabilidade Alta Teste visual

40 40 Comparação entre dois experimentos Teste visual A B Caso 1 A B A B Caso 2Caso 3 Caso 1 – ICs não sobrepostos A > B Caso 2 – Média de um está inserida no IC do outro A = B Caso 3 – ICs sobrepostos mas média está fora necessário outro teste

41 41 Comparação entre dois experimentos Área de Estatística oferece grande número de testes para comparação entre experimentos: –Teste t-student – para comparar a média de duas amostras –Teste para amostras pareadas –Teste para amostras não pareadas –Análise de Variância - para comparar média de três ou mais amostras –Chi-Quadrado e Poisson - para valores não contínuos

42 42 Comparação entre dois experimentos Cáculo número de graus de liberdade n = n T + n C - 2 Entrar na tabela t-student com n e confiança desejada t tab Se t > t tab médias são diferentes Se t < t tab não existe diferença significativa entre as médias Teste T-student Cáculo o valor de t para a amostra:

43 43 Após dez replicações de um programa de simulação, avaliando-se o tempo médio na fila de um recurso, obtiveram-se as médias das amostras e intervalo de confiança para 95% e para 90% representados na tabela a seguir: Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,2)0,40,5 O que se pode concluir?

44 44 Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,2)0,40,5 A B A B H 1 (0,05) A - 11,2 – 12,2 B – 10,1 – 11,9 H 2 (0,2) A – 11,6 – 12,4 B – 10,5 – 11,5

45 45 Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,1)0,40,5 A B A B Var A = 1,13 Var B = 1,27 n = n A + n B – 2 = 18 t =2,040 H 1 (0,05) t t = 2,101 > 2,040 H 1 (0,2) t t = 1,330 < 2,040 Não existe diferença significativa Médias diferentes

46 46 Teste de hipótese X Intervalo de Confiança Teste de hipótese Resposta: aceita ou rejeita a hipótese Conclusivo: não deixa dúvida Não oferece maiores informações Difícil de interpretar O que significa t t = 2,101 > 2,040?

47 47 Teste de hipótese X Intervalo de Confiança Intervalo de confiança Informações adicionais Intervalo pequenos parâmetro bem estimado Valores com o mesmo significado que as medidas originais mais fácil de entender e analisar Significado de Média=12 e H(95%)=0,6

48 48 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

49 49 Procedimento para análise de resultados 1.Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo 2.Escolher os fatores e níveis adequadamente 3.Realizar o experimento quantas vezes forem necessárias 4.Pensar na melhor forma de apresentar os dados 5.Fazer o tratamento estatístico adequado para os resultados 6.Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado

50 50 Procedimento para análise de resultados 1.Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo Não considerar variáveis essenciais pode levar a erros na análise Considerar variáveis desnecessárias contribui para aumentar a complexidade da análise Sempre tentar analisar conjuntos não muito grandes de variáveis e, se necessário, realizar a análise em diversas fases

51 51 Procedimento para análise de resultados 2.Escolher os fatores e níveis adequadamente Escolher poucos fatores e, se possível, apenas dois níveis por fator Para os fatores com grande influência nas variáveis de resposta, detalhar processo separadamente. Considerar um grande número de fatores e de níveis em um primeiro momento da avaliação, torna a análise suscetível a erros.

52 52 Procedimento para análise de resultados 3.Realizar o experimento quantas vezes forem necessárias Utilizar um dos métodos apresentados para determinar o ponto de parada de coleta de dados Não tirar conclusões baseando-se em um único resultado

53 53 Procedimento para análise de resultados 4.Pensar na melhor forma de apresentar os dados Tabelas são ótimas para observar detalhes e valores precisos Gráficos são adequados para melhor visualizar os resultados Nos gráficos, cuidado com escalas e origem dos eixos Muitos valores em uma tabela ou em um gráfico tornam a análise mais complexa, e possíveis resultados mais difíceis de serem identificados

54 54 Procedimento para análise de resultados 5.Fazer o tratamento estatístico adequado para os resultados Não tirar conclusões considerando-se apenas médias Valores médios só fazem sentido quando acompanhados de desvio padrão, variância, intervalo de confiança, etc. Valores médios com máximo e mínimo podem ajudar na análise mas não levam a resultados conclusivos, sem a presença de uma métrica que indique a dispersão dos dados

55 55 Procedimento para análise de resultados 6.Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado Desconfie de resultados não esperados Tente relacionar os diferentes resultados obtidos Tente explicar os resultados obtidos

56 56 Procedimento para análise de resultados A seguir..... Alguns Exemplos e Contra-exemplos relacionados a esses procedimentos....

57 57 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

58 58 Exemplos Exemplo 1: Avaliar o desempenho gráfico de um sistema computacional –Trabalho desenvolvido por alunos do Curso de Engenharia de Computação Exemplo 2: Redes sem fio X Redes com fio –Trabalho desenvolvido por alunos do Curso de Engenharia de Computação

59 59 Exemplo 1 Objetivo: avaliar o desempenho gráfico e de CPU de um sistema computacional, e verificar quanto cada fator influência no desempenho do sistema. Utilizam-se três fatores: –Placa mãe + processador, possui dois níveis: athleon64 3500+/dfi-lanparty e athlon64 3000+/asus –Memória RAM: 1GB ddr2 433 dual channel e 2GB ddr2 433 dual channel –Placa de vídeo: geforce 7800 GTX, 256mb PCI-Ex e ati radeon x600, 256mb PCI-Ex

60 60 Exemplo 1 Técnica utilizada: Benchmark Variável de Resposta – pontuação nos Benchmarks –3DMark mede desempenho da placa de vídeo executa de 3 aplicações gráficas, e avalia desempenho do sistema para programas como jogos 3D ou de renderização gráfica –CPUMark – mede desempenho da CPU execução de dois programas que avaliam o desempenho do processador, realizando cálculos de iluminação e renderização de polígonos. Fatorial Completo Resultado: média de 10 execuções

61 61 Exemplo 1 Gráfico de comparação da pontuação 3DMark dos testes: Vermelho – intervalo de confiança Teste 1 – athlon64 3000; 1GB; ati radeon x600 Teste 2 - athlon64 3000; 2GB; ati radeon x600 Teste 3 – athleon64 3500; 1GB; ati radeon x600 Teste 4 – athleon64 3500; 2GB; ati radeon x600 Teste 5 – athleon64 3500; 2GB; geforce 7800 GTX Teste 6 – athleon64 3500; 1GB; geforce 7800 GTX Teste 7 – athlon64 3000; 1GB; geforce 7800 GTX Teste 8 - athlon64 3000; 2GB; geforce 7800 GTX

62 62 Exemplo 1 Gráfico de comparação da pontuação CPUMark dos testes: Teste 1 – athlon64 3000; 1GB; ati radeon x600 Teste 2 - athlon64 3000; 2GB; ati radeon x600 Teste 3 – athleon64 3500; 1GB; ati radeon x600 Teste 4 – athleon64 3500; 2GB; ati radeon x600 Teste 5 – athleon64 3500; 2GB; geforce 7800 GTX Teste 6 – athleon64 3500; 1GB; geforce 7800 GTX Teste 7 – athlon64 3000; 1GB; geforce 7800 GTX Teste 8 - athlon64 3000; 2GB; geforce 7800 GTX

63 63 Exemplo 2 Este trabalho consistiu em medir a diferença de velocidade de navegação entre uma conexão sem fio e uma conexão com cabo de banda larga normal

64 64 Exemplo 2 - Fatores e níveis Número de pacotes enviados – 40 – 80 Tamanho dos pacotes enviados (em Bytes) – 32 – 1024 Localização do receptor do pacotes – Internacional (www.lycos.co.uk) – Nacional (www.uol.com.br) – Local (Um IP de uma máquina conectada à rede) Quantidade de computadores com o mesmo tipo de conexão ligado ao hub – 2 – 3

65 65 Exemplo 2 - Rede com fio

66 66 Exemplo 2 - Rede sem fio

67 67 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados 3.Técnicas para Avaliação de Desempenho


Carregar ppt "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."

Apresentações semelhantes


Anúncios Google