A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo.

Apresentações semelhantes


Apresentação em tema: "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."— Transcrição da apresentação:

1 1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação

2 2 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos

3 3 Medidas de Desempenho Freqüentemente Utilizadas Medidas de Posição –Média –Moda –Mediana Medidas de Dispersão –Desvio Padrão –Variância –Percentis –Box-Plot

4 4 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos

5 5 Análise de Resultados Em qualquer experimentação, três problemas a serem considerados: 1.Condições iniciais da experimentação 2.Quando parar uma experimentação 3.Resultado de uma execução oferece um resultado dentre muitos outros possíveis

6 6 Análise de Resultados Durante a obtenção de dados sobre sistemas computacionais, tem-se que... Os Resultados de uma medição oferecem um resultado dentre muitos outros possíveis

7 7 Análise de Resultados Utilização de Intervalos de confiança A partir de um conjunto de resultados possíveis queremos estimar o comportamento de um sistema Podemos utilizar: –Valores fixos –Intervalos Valores fixos não permitem estimar o erro cometido Intervalos de confiança permitem avaliar a confiança no resultado

8 8 Análise de Resultados O que é o Intervalo de confiança? Intervalo que com uma determinada probabilidade (confiança) contem o valor do parâmetro estudado 1- /2 Intervalo de Confiança Y Y+H Y-H Confiança = 100*(1- )% = probabilidade de erro Y = média da amostra H = Largura do Intervalo de Confiança

9 9 Análise de Resultados O que significa Intervalo de confiança? Se Confiança = 95% Tenho 95% de chance de que parâmetro estará dentro do intervalo Nada garante que o resultado de uma única execução (Y i ) cairá no intervalo 1- /2 Intervalo de Confiança Y Y+H Y-H O resultado de uma única execução poderá estar na área definida por/2

10 10 Análise de Resultados Como determinar o Intervalo de confiança? 1.Ordenar os valores obtidos 2.Eliminar os /2 maiores valores 3.Eliminar os /2 menores valores 4.Obtém-se o intervalo procurado

11 11 Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido Utiliza-se o Teorema do Limite Central e a Tabela t-student Para amostras maiores que 30 ou com desvio padrão da população conhecido Utiliza-se o Teorema do Limite Central e a Tabela Z

12 12 Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido Utiliza-se o Teorema do Limite Central e a Tabela t-student Conheço o desvio padrão da amostra - DP

13 Teorema do Limite Central Tenho uma amostra ou população com distribuição qualquer com média M de desvio padrão DP 13 Quanto maior o valor de n maior a proximidade das médias amostrais de uma distribuição normal com média M e desvio padrão DP Pegando a média de varias amostras de tamanho n

14 14 Análise de Resultados

15 15 Análise de Resultados Como determinar o Intervalo de confiança? Média Amostral Y i = Média das observações de uma execução Estimativa Global Y = Média das médias amostrais Variância Amostral Desvio Padrão (DP) t 1- /2,N-1 distribuição Student com N-1 graus de liberdade e nível de confiança igual a 1-

16 16 Análise de Resultados 1- /2 Intervalo de Confiança Y Y+H Y-H Como determinar o Intervalo de confiança? Largura do Intervalo de Confiança de 100(1- )% H = t * DP/ H = t 1- /2,N-1 * Intervalo de confiança Y ± H Relação entre halfwidth e média H/Y

17 17 Análise de Resultados Como determinar o Intervalo de confiança? Em versões antigas do Excel... Função INT.CONFIANÇA considera que o desvio padrão da população é conhecido. Quando apenas o desvio padrão da amostra é conhecido, deve-se calcular o intervalo de confiança utilizando a função: =INVT( ;n-1)*(DESVPAD(amostra)/RAIZ(n))

18 18 Análise de Resultados - Exemplo X i : tempo na fila para cliente i X: tempo médio na fila para clientes : média real para tempo na fila -> não conhecido T chegada = 125 T serviço = 100

19 19 Análise de Resultados - Exemplo Simulação executada 10 vezes para diferentes conjuntos de números aleatórios, obtendo-se: 331,993447, ,052420, ,524355, ,856492, ,393389,200 Y = 406,551 Esse valor está suficientemente próximo de ?

20 20 Análise de Resultados - Exemplo Simulação executada 10 vezes 1- = 0,95 = 0,05 Média = Y = 406,551 Variância = S 2 = DP = t.05/2;9 = 2,26 H = t.05/2;9 *DP/ =36,012 IC: 370,54 – 442,56 331,993447, ,052420, ,524355, ,856492, ,393389,200

21 21 Análise de Resultados - Exemplo H = 36,012 IC: 370,54 – 442,56 Tem-se 95% de certeza que a média verdadeira está entre 370,54 – 442,56 Valores individuais podem estar fora do intervalo de confiança Se a simulação for repetida várias vezes e em cada vez for determinado o intervalo de confiança, 95% destes intervalos irão conter a média verdadeira

22 22 Análise de Resultados - Exemplo Média = Y = 406,554 H = 36,012 IC: 370,54 – 442,56 Amplitude do intervalo de confiança = 72 17,8% do valor médio Não é um valor muito grande? Como diminuir? Aumentando o número de replicações

23 23 Análise de Resultados Controle do Erro Utilizando-se a técnica de replicações: Não pode-se determinar a precisão desejada Pode-se determinar, aproximadamente, quantas replicações adicionais deve-se considerar para controlar o erro

24 24 Análise de Resultados - Exemplo Para o exemplo anterior Suponha que se queira 2*H <= 15% da Média H <=30,49 Seja r = as próximas replicações rt r-1;0,95 t r-1;0,95 * 112,2315,934 35, ,20 15,193 33, ,1814,546 31, ,1613,975 30,18703 São necessárias mais 4 replicações para atingir o erro máximo desejado

25 25 Análise de Resultados Batch Means – outra abordagem para atingir a precisão desejada Executar uma parte da experimentação (batch) Determinar intervalo de confiança Se atingiu precisão Então parar Senão Executar mais um batch e retornar ao cálculo do intervalo de confiança Vantagem: apenas 1 warm-up Desvantagem: maior complexidade

26 26 Conteúdo 1.Planejamento de Experimentos 2.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos 3. Técnicas para Avaliação de Desempenho

27 27 Análise de Resultados Comparação entre dois experimentos Testes estatísticos podem ser utilizados para definir se os resultados provenientes de dois experimentos são conclusivos Definem se os resultados são estatisticamente diferentes

28 28 Comparação entre dois experimentos Variabilidade Média Variabilidade Baixa Variabilidade Alta Teste visual

29 29 Comparação entre dois experimentos Teste visual A B Caso 1 A B A B Caso 2Caso 3 Caso 1 – ICs não sobrepostos A > B Caso 2 – Média de um está inserida no IC do outro A = B Caso 3 – ICs sobrepostos mas média está fora necessário outro teste

30 30 Comparação entre dois experimentos Área de Estatística oferece grande número de testes para comparação entre experimentos: –Teste t-student – para comparar a média de duas amostras –Teste para amostras pareadas –Teste para amostras não pareadas –Análise de Variância - para comparar média de três ou mais amostras –Chi-Quadrado e Poisson - para valores não contínuos

31 31 Comparação entre dois experimentos Cáculo número de graus de liberdade n = n T + n C - 2 Entrar na tabela t-student com n e confiança desejada t tab Se t > t tab médias são diferentes Se t < t tab não existe diferença significativa entre as médias Teste T-student Cáculo o valor de t para a amostra:

32 32 Após dez replicações de um programa de simulação, avaliando-se o tempo médio na fila de um recurso, obtiveram-se as médias das amostras e intervalo de confiança para 95% e para 90% representados na tabela a seguir: Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,2)0,40,5 O que se pode concluir?

33 33 Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,2)0,40,5 A B A B H 1 (0,05) A - 11,2 – 12,2 B – 10,1 – 11,9 H 2 (0,2) A – 11,6 – 12,4 B – 10,5 – 11,5

34 34 Análise de Resultados AB Média1211 H 1 (0,05)0,80,9 H 2 (0,1)0,40,5 A B A B Var A = 1,13 Var B = 1,27 n = n A + n B – 2 = 18 t =2,040 H 1 (0,05) t t = 2,101 > 2,040 H 1 (0,2) t t = 1,330 < 2,040 Não existe diferença significativa Médias diferentes

35 35 Teste de hipótese X Intervalo de Confiança Teste de hipótese Resposta: aceita ou rejeita a hipótese Conclusivo: não deixa dúvida Não oferece maiores informações Difícil de interpretar O que significa t t = 2,101 > 2,040?

36 36 Teste de hipótese X Intervalo de Confiança Intervalo de confiança Informações adicionais Intervalo pequenos parâmetro bem estimado Valores com o mesmo significado que as medidas originais mais fácil de entender e analisar Significado de Média=12 e H(95%)=0,6

37 37 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Procedimento para análise de resultados –Exemplos

38 38 Exemplos Exemplo 1: Avaliar o desempenho gráfico de um sistema computacional Exemplo 2: Redes sem fio X Redes com fio

39 39 Exemplo 1 Objetivo: avaliar o desempenho gráfico e de CPU de um sistema computacional, e verificar quanto cada fator influência no desempenho do sistema. Utilizam-se três fatores: –Placa mãe + processador, possui dois níveis: athleon /dfi-lanparty e athlon /asus –Memória RAM: 1GB ddr2 433 dual channel e 2GB ddr2 433 dual channel –Placa de vídeo: geforce 7800 GTX, 256mb PCI-Ex e ati radeon x600, 256mb PCI-Ex

40 40 Exemplo 1 Técnica utilizada: Benchmark Variável de Resposta – pontuação nos Benchmarks –3DMark mede desempenho da placa de vídeo executa de 3 aplicações gráficas, e avalia desempenho do sistema para programas como jogos 3D ou de renderização gráfica –CPUMark – mede desempenho da CPU execução de dois programas que avaliam o desempenho do processador, realizando cálculos de iluminação e renderização de polígonos. Fatorial Completo Resultado: média de 10 execuções

41 41 Exemplo 1 Gráfico de comparação da pontuação 3DMark dos testes: Vermelho – intervalo de confiança Teste 1 – athlon ; 1GB; ati radeon x600 Teste 2 - athlon ; 2GB; ati radeon x600 Teste 3 – athleon ; 1GB; ati radeon x600 Teste 4 – athleon ; 2GB; ati radeon x600 Teste 5 – athleon ; 2GB; geforce 7800 GTX Teste 6 – athleon ; 1GB; geforce 7800 GTX Teste 7 – athlon ; 1GB; geforce 7800 GTX Teste 8 - athlon ; 2GB; geforce 7800 GTX

42 42 Exemplo 1 Gráfico de comparação da pontuação CPUMark dos testes: Teste 1 – athlon ; 1GB; ati radeon x600 Teste 2 - athlon ; 2GB; ati radeon x600 Teste 3 – athleon ; 1GB; ati radeon x600 Teste 4 – athleon ; 2GB; ati radeon x600 Teste 5 – athleon ; 2GB; geforce 7800 GTX Teste 6 – athleon ; 1GB; geforce 7800 GTX Teste 7 – athlon ; 1GB; geforce 7800 GTX Teste 8 - athlon ; 2GB; geforce 7800 GTX

43 43 Exemplo 2 Este trabalho consistiu em medir a diferença de velocidade de navegação entre uma conexão sem fio e uma conexão com cabo de banda larga normal

44 44 Exemplo 2 - Fatores e níveis Número de pacotes enviados – 40 – 80 Tamanho dos pacotes enviados (em Bytes) – 32 – 1024 Localização do receptor do pacotes – Internacional (www.lycos.co.uk) – Nacional (www.uol.com.br) – Local (Um IP de uma máquina conectada à rede) Quantidade de computadores com o mesmo tipo de conexão ligado ao hub – 2 – 3

45 45 Exemplo 2 - Rede com fio

46 46 Exemplo 2 - Rede sem fio

47 47 Conteúdo 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados –Introdução –Medidas de Desempenho –Análise Estatística dos Resultados –Comparação de Resultados –Exemplos –Procedimento para análise de resultados

48 48 Procedimento para Experimento 1.Defina claramente o objetivo do experimento a ser realizado 2.Estude detalhadamente o sistema a ser avaliado, o objetivo do sistema e os possíveis usuários 3.Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo 4.Escolher os fatores e níveis adequadamente 5.Realizar o experimento quantas vezes forem necessárias 6.Pensar na melhor forma de apresentar os dados 7.Fazer o tratamento estatístico adequado para os resultados 8.Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado

49 49 Procedimento para Experimento 1.Defina claramente o objetivo do experimento a ser realizado O sucesso do experimento dependerá da definição do seu objetivo e do que se pretende observar

50 50 Procedimento para Experimento 2.Estude detalhadamente o sistema a ser avaliado, o objetivo do sistema e os possíveis usuários Quem avalia um sistema deve ser especialista da área em que se insere Quem avalia um sistema deve conhecer os usuários e qual é o usuário foco da avaliação

51 51 Procedimento para Experimento 3.Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo Não considerar variáveis essenciais pode levar a erros na análise Considerar variáveis desnecessárias contribui para aumentar a complexidade da análise Sempre tentar analisar conjuntos não muito grandes de variáveis e, se necessário, realizar a análise em diversas fases

52 52 Procedimento para Experimento 4.Escolher os fatores e níveis adequadamente Escolher poucos fatores e, se possível, apenas dois níveis por fator Para os fatores com grande influência nas variáveis de resposta, detalhar processo separadamente. Considerar um grande número de fatores e de níveis em um primeiro momento da avaliação, torna a análise suscetível a erros.

53 53 Procedimento para Experimento 5.Realizar o experimento quantas vezes forem necessárias Utilizar um dos métodos apresentados para determinar o ponto de parada de coleta de dados Não tirar conclusões baseando-se em um único resultado

54 54 Procedimento para Experimento 6.Pensar na melhor forma de apresentar os dados Tabelas são ótimas para observar detalhes e valores precisos Gráficos são adequados para melhor visualizar os resultados Nos gráficos, cuidado com escalas e origem dos eixos Muitos valores em uma tabela ou em um gráfico tornam a análise mais complexa, e possíveis resultados mais difíceis de serem identificados

55 55 Procedimento para Experimento 7.Fazer o tratamento estatístico adequado para os resultados Não tirar conclusões considerando-se apenas médias Valores médios só fazem sentido quando acompanhados de desvio padrão, variância, intervalo de confiança, etc. Valores médios com máximo e mínimo podem ajudar na análise mas não levam a resultados conclusivos, sem a presença de uma métrica que indique a dispersão dos dados

56 56 Procedimento para Experimento 8.Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado Desconfie de resultados não esperados Tente relacionar os diferentes resultados obtidos Tente explicar os resultados obtidos

57 57 Avaliação de Desempenho de Sistemas Computacionais 1.Planejamento de Experimentos 2.Técnicas para Avaliação de Desempenho 3.Análise de Resultados Próxima Aula : Apresentação de Resultados ??


Carregar ppt "1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo."

Apresentações semelhantes


Anúncios Google