Avaliação de Desempenho de Sistemas Computacionais

Slides:



Advertisements
Apresentações semelhantes
IFTO ESTRUTURA DE DADOS AULA 05 Prof. Manoel Campos da Silva Filho
Advertisements

Aprendizado de Máquina
Estimação de parâmetros
Algoritmos para Geração de Variáveis Aleatórias
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
Cássio Luís Fernandes de Oliveira
Exercício do Tangram Tangram é um quebra-cabeças chinês no qual, usando 7 peças deve-se construir formas geométricas.
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
Curso de ADMINISTRAÇÃO
Análise de regressão linear simples: abordagem matricial
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 6 Estimativas e Tamanho de Amostras
MB751 – Modelos de previsão
Avaliação de Desempenho de Sistemas Computacionais
Diretrizes para Desenvolvimento do Projeto
Sistemas Operacionais Planejamento de Experimento
Avaliação de Sistemas Operacionais
Avaliação de Desempenho Planejamento de Experimentos 2 Aula 2 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.
1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo.
1 Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo.
Avaliação de Desempenho de Sistemas Computacionais
Avaliação de Desempenho
Avaliação de Desempenho Planejamento de Experimentos 1
Avaliação de Desempenho de Sistemas Computacionais
Avaliação de Desempenho de Sistemas Computacionais
Avaliação de Desempenho
Avaliação de Desempenho Introdução Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas.
FUNÇÃO MODULAR.
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 5)
Estatística Aplicada (Aula 4)
Distribuição de probabilidade
Distribuição de probabilidade
Provas de Concursos Anteriores
Renda até 2 SM.
J. Landeira-Fernandez Ética e Ciência
ESTATÍSTICA.
ESTATÍSTICA.
MECÂNICA - DINÂMICA Exercícios Cap. 13, 14 e 17. TC027 - Mecânica Geral III - Dinâmica © 2013 Curotto, C.L. - UFPR 2 Problema
Estatística Descritiva (I)
ME623A Planejamento e Pesquisa
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
Quais são, suas médias, medianas e modas?
Modelagem Estatística
O que é Estatística, afinal de contas?
Dimensionamento de Corridas e Análise de Resultados
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Avaliação de Desempenho Planejamento de Experimentos 3
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Estatística.
Estatística Aula 9 – 28/02/2011.
ANÁLISE ESTATÍSTICA II
Olhe fixamente para a Bruxa Nariguda
Inferência Estatística
Estatística Aplicada Aula 7
Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.
Medidas de tendência central e de dispersão
Medidas de Dispersão Aula 8.
Noções de Inferência Estatística
Abordagem Sistemática Guilherme Amaral Avelino Avaliação e Controle de Sistemas de Informação.
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Transcrição da apresentação:

Avaliação de Desempenho de Sistemas Computacionais Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação Avaliação de Desempenho de Sistemas Computacionais Análise de Resultados Marcos José Santana Regina Helena Carlucci Santana

Conteúdo Planejamento de Experimentos Técnicas para Avaliação de Desempenho Análise de Resultados Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos

Medidas de Desempenho Freqüentemente Utilizadas Medidas de Posição Média Moda Mediana Medidas de Dispersão Desvio Padrão Variância Percentis Box-Plot

Conteúdo Planejamento de Experimentos Técnicas para Avaliação de Desempenho Análise de Resultados Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos

Análise de Resultados Em qualquer experimentação, três problemas a serem considerados: Condições iniciais da experimentação Quando parar uma experimentação Resultado de uma execução oferece um resultado dentre muitos outros possíveis

Análise de Resultados Durante a obtenção de dados sobre sistemas computacionais, tem-se que... Os Resultados de uma medição oferecem um resultado dentre muitos outros possíveis

Análise de Resultados Utilização de Intervalos de confiança   A partir de um conjunto de resultados possíveis queremos estimar o comportamento de um sistema Podemos utilizar: Valores fixos Intervalos Valores fixos não permitem estimar o erro cometido Intervalos de confiança permitem avaliar a confiança no resultado

O que é o Intervalo de confiança? Análise de Resultados O que é o Intervalo de confiança?   Intervalo que com uma determinada probabilidade (confiança) contem o valor do parâmetro estudado 1- /2 Intervalo de Confiança Y Y+H Y-H Confiança = 100*(1- )%  = probabilidade de erro Y = média da amostra H = Largura do Intervalo de Confiança

O que significa Intervalo de confiança? Análise de Resultados O que significa Intervalo de confiança?   Se Confiança = 95% Tenho 95% de chance de que parâmetro estará dentro do intervalo Nada garante que o resultado de uma única execução (Yi) cairá no intervalo 1- /2 Intervalo de Confiança Y Y+H Y-H O resultado de uma única execução poderá estar na área definida por /2

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança?   Ordenar os valores obtidos Eliminar os /2 maiores valores Eliminar os /2 menores valores Obtém-se o intervalo procurado

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido   Utiliza-se o Teorema do Limite Central e a Tabela t-student Para amostras maiores que 30 ou com desvio padrão da população conhecido Utiliza-se o Teorema do Limite Central e a Tabela Z

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança? Para amostras menores que 30 e com desvio padrão da população desconhecido   Utiliza-se o Teorema do Limite Central e a Tabela t-student Conheço o desvio padrão da amostra - DP

Teorema do Limite Central Tenho uma amostra ou população com distribuição qualquer com média M de desvio padrão DP Pegando a média de varias amostras de tamanho n Quanto maior o valor de n maior a proximidade das médias amostrais de uma distribuição normal com média M e desvio padrão DP

Análise de Resultados

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança?   Média Amostral  Yi = Média das observações de uma execução Estimativa Global  Y = Média das médias amostrais Variância Amostral  Desvio Padrão (DP)  t1-/2,N-1  distribuição Student com N-1 graus de liberdade e nível de confiança igual a 1- 

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança? Largura do Intervalo de Confiança de 100(1- )% H = t * DP/ H = t1-/2,N-1 *  Intervalo de confiança   Y ± H Relação entre halfwidth e média H/Y 1- /2 Intervalo de Confiança Y Y+H Y-H

Como determinar o Intervalo de confiança? Análise de Resultados Como determinar o Intervalo de confiança? Em versões antigas do Excel... Função INT.CONFIANÇA considera que o desvio padrão da população é conhecido. Quando apenas o desvio padrão da amostra é conhecido, deve-se calcular o intervalo de confiança utilizando a função: =INVT(;n-1)*(DESVPAD(amostra)/RAIZ(n))

Análise de Resultados - Exemplo Tchegada = 125 Tserviço = 100 Xi: tempo na fila para cliente i X: tempo médio na fila para 5.000 clientes : média real para tempo na fila -> não conhecido

Análise de Resultados - Exemplo Simulação executada 10 vezes para diferentes conjuntos de números aleatórios, obtendo-se: 331,993 447,532 366,052 420,858 403,524 355,959 464,856 492,144 393,393 389,200 Y = 406,551 Esse valor está suficientemente próximo de ?

Análise de Resultados - Exemplo Simulação executada 10 vezes 1- = 0,95   = 0,05 Média = Y = 406,551 Variância = S2 = DP = t.05/2;9 = 2,26 H = t.05/2;9 *DP/ =36,012 IC: 370,54 – 442,56 331,993 447,532 366,052 420,858 403,524 355,959 464,856 492,144 393,393 389,200

Análise de Resultados - Exemplo H = 36,012 IC: 370,54 – 442,56 Se a simulação for repetida várias vezes e em cada vez for determinado o intervalo de confiança, 95% destes intervalos irão conter a média verdadeira Tem-se 95% de certeza que a média verdadeira está entre 370,54 – 442,56 Valores individuais podem estar fora do intervalo de confiança

Análise de Resultados - Exemplo Média = Y = 406,554 H = 36,012 IC: 370,54 – 442,56 Amplitude do intervalo de confiança = 72  17,8% do valor médio Não é um valor muito grande? Como diminuir? Aumentando o número de replicações

Análise de Resultados Controle do Erro Utilizando-se a técnica de replicações: Não pode-se determinar a precisão desejada Pode-se determinar, aproximadamente, quantas replicações adicionais deve-se considerar para controlar o erro

Análise de Resultados - Exemplo Para o exemplo anterior Suponha que se queira 2*H <= 15% da Média  H <=30,49 Seja r = as próximas replicações r tr-1;0,95 tr-1;0,95* 11 2,23 15,934 35,53393 12 2,20 15,193 33,42448 13 2,18 14,546 31,71058 14 2,16 13,975 30,18703 São necessárias mais 4 replicações para atingir o erro máximo desejado

Batch Means – outra abordagem para atingir a precisão desejada Análise de Resultados Batch Means – outra abordagem para atingir a precisão desejada Executar uma parte da experimentação (batch) Determinar intervalo de confiança Se atingiu precisão Então parar Senão Executar mais um batch e retornar ao cálculo do intervalo de confiança Vantagem: apenas 1 warm-up Desvantagem: maior complexidade

Conteúdo Planejamento de Experimentos Análise de Resultados Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos 3. Técnicas para Avaliação de Desempenho

Comparação entre dois experimentos Análise de Resultados Comparação entre dois experimentos Testes estatísticos podem ser utilizados para definir se os resultados provenientes de dois experimentos são conclusivos Definem se os resultados são estatisticamente diferentes

Comparação entre dois experimentos Teste visual Variabilidade Média Variabilidade Baixa Variabilidade Alta

Comparação entre dois experimentos Teste visual Caso 1 Caso 2 Caso 3 A B A B A B Caso 1 – ICs não sobrepostos  A > B Caso 2 – Média de um está inserida no IC do outro  A = B Caso 3 – ICs sobrepostos mas média está fora  necessário outro teste

Comparação entre dois experimentos Área de Estatística oferece grande número de testes para comparação entre experimentos: Teste t-student – para comparar a média de duas amostras Teste para amostras pareadas Teste para amostras não pareadas Análise de Variância - para comparar média de três ou mais amostras Chi-Quadrado e Poisson - para valores não contínuos

Comparação entre dois experimentos Teste T-student Cáculo o valor de t para a amostra: Cáculo número de graus de liberdade  n = nT + nC - 2 Entrar na tabela t-student com n e confiança desejada  ttab Se t > t tab  médias são diferentes Se t < t tab  não existe diferença significativa entre as médias

Análise de Resultados Após dez replicações de um programa de simulação, avaliando-se o tempo médio na fila de um recurso, obtiveram-se as médias das amostras e intervalo de confiança para 95% e para 90% representados na tabela a seguir:   A B Média 12 11 H1 (0,05) 0,8 0,9 H2 (0,2) 0,4 0,5 O que se pode concluir?

Análise de Resultados A A B B H2 (0,2) H1 (0,05) A – 11,6 – 12,4   A B Média 12 11 H1 (0,05) 0,8 0,9 H2 (0,2) 0,4 0,5 A A B B H2 (0,2) A – 11,6 – 12,4 B – 10,5 – 11,5 H1 (0,05) A - 11,2 – 12,2 B – 10,1 – 11,9

Análise de Resultados VarA = 1,13 VarB = 1,27 n = nA + nB – 2 = 18   A B Média 12 11 H1 (0,05) 0,8 0,9 H2 (0,1) 0,4 0,5 VarA = 1,13 VarB = 1,27 n = nA + nB – 2 = 18 t =2,040 A B A B H1 (0,05)  tt = 2,101 > 2,040 H1 (0,2)  tt = 1,330 < 2,040 Não existe diferença significativa Médias diferentes

Teste de hipótese X Intervalo de Confiança Resposta: aceita ou rejeita a hipótese Conclusivo: não deixa dúvida Não oferece maiores informações Difícil de interpretar O que significa tt = 2,101 > 2,040?

Teste de hipótese X Intervalo de Confiança Informações adicionais Intervalo pequenos  parâmetro bem estimado Valores com o mesmo significado que as medidas originais  mais fácil de entender e analisar Significado de Média=12 e H(95%)=0,6

Conteúdo Planejamento de Experimentos Técnicas para Avaliação de Desempenho Análise de Resultados Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados Exemplos

Exemplos Exemplo 1: Avaliar o desempenho gráfico de um sistema computacional Exemplo 2: Redes sem fio X Redes com fio

Exemplo 1 Objetivo: avaliar o desempenho gráfico e de CPU de um sistema computacional, e verificar quanto cada fator influência no desempenho do sistema. Utilizam-se três fatores: Placa mãe + processador, possui dois níveis: athleon64 3500+/dfi-lanparty e athlon64 3000+/asus Memória RAM: 1GB ddr2 433 dual channel e 2GB ddr2 433 dual channel Placa de vídeo: geforce 7800 GTX, 256mb PCI-Ex e ati radeon x600, 256mb PCI-Ex

Exemplo 1 Técnica utilizada: Benchmark Variável de Resposta – pontuação nos Benchmarks 3DMark mede desempenho da placa de vídeo executa de 3 aplicações gráficas, e avalia desempenho do sistema para programas como jogos 3D ou de renderização gráfica CPUMark – mede desempenho da CPU execução de dois programas que avaliam o desempenho do processador, realizando cálculos de iluminação e renderização de polígonos. Fatorial Completo Resultado: média de 10 execuções

Exemplo 1 Gráfico de comparação da pontuação 3DMark dos testes: Vermelho – intervalo de confiança Teste 1 – athlon64 3000; 1GB; ati radeon x600 Teste 2 - athlon64 3000; 2GB; ati radeon x600 Teste 3 – athleon64 3500; 1GB; ati radeon x600 Teste 4 – athleon64 3500; 2GB; ati radeon x600 Teste 5 – athleon64 3500; 2GB; geforce 7800 GTX Teste 6 – athleon64 3500; 1GB; geforce 7800 GTX Teste 7 – athlon64 3000; 1GB; geforce 7800 GTX Teste 8 - athlon64 3000; 2GB; geforce 7800 GTX

Exemplo 1 Gráfico de comparação da pontuação CPUMark dos testes: Teste 1 – athlon64 3000; 1GB; ati radeon x600 Teste 2 - athlon64 3000; 2GB; ati radeon x600 Teste 3 – athleon64 3500; 1GB; ati radeon x600 Teste 4 – athleon64 3500; 2GB; ati radeon x600 Teste 5 – athleon64 3500; 2GB; geforce 7800 GTX Teste 6 – athleon64 3500; 1GB; geforce 7800 GTX Teste 7 – athlon64 3000; 1GB; geforce 7800 GTX Teste 8 - athlon64 3000; 2GB; geforce 7800 GTX

Exemplo 2 Este trabalho consistiu em medir a diferença de velocidade de navegação entre uma conexão sem fio e uma conexão com cabo de banda larga normal

Exemplo 2 - Fatores e níveis Número de pacotes enviados 40 80 Tamanho dos pacotes enviados (em Bytes) 32 1024 Localização do receptor do pacotes Internacional (www.lycos.co.uk) Nacional (www.uol.com.br) Local (Um IP de uma máquina conectada à rede) Quantidade de computadores com o mesmo tipo de conexão ligado ao hub 2 3

Exemplo 2 - Rede com fio

Exemplo 2 - Rede sem fio

Conteúdo Planejamento de Experimentos Técnicas para Avaliação de Desempenho Análise de Resultados Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Exemplos Procedimento para análise de resultados

Procedimento para Experimento Defina claramente o objetivo do experimento a ser realizado Estude detalhadamente o sistema a ser avaliado, o objetivo do sistema e os possíveis usuários Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo Escolher os fatores e níveis adequadamente Realizar o experimento quantas vezes forem necessárias Pensar na melhor forma de apresentar os dados Fazer o tratamento estatístico adequado para os resultados Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado

Procedimento para Experimento Defina claramente o objetivo do experimento a ser realizado O sucesso do experimento dependerá da definição do seu objetivo e do que se pretende observar

Procedimento para Experimento Estude detalhadamente o sistema a ser avaliado, o objetivo do sistema e os possíveis usuários Quem avalia um sistema deve ser especialista da área em que se insere Quem avalia um sistema deve conhecer os usuários e qual é o usuário foco da avaliação

Procedimento para Experimento Escolher as variáveis de resposta adequadas e suficientes para atingir o objetivo Não considerar variáveis essenciais pode levar a erros na análise Considerar variáveis desnecessárias contribui para aumentar a complexidade da análise Sempre tentar analisar conjuntos não muito grandes de variáveis e, se necessário, realizar a análise em diversas fases

Procedimento para Experimento Escolher os fatores e níveis adequadamente Escolher poucos fatores e, se possível, apenas dois níveis por fator Para os fatores com grande influência nas variáveis de resposta, detalhar processo separadamente. Considerar um grande número de fatores e de níveis em um primeiro momento da avaliação, torna a análise suscetível a erros.

Procedimento para Experimento Realizar o experimento quantas vezes forem necessárias Utilizar um dos métodos apresentados para determinar o ponto de parada de coleta de dados Não tirar conclusões baseando-se em um único resultado

Procedimento para Experimento Pensar na melhor forma de apresentar os dados Tabelas são ótimas para observar detalhes e valores precisos Gráficos são adequados para melhor visualizar os resultados Nos gráficos, cuidado com escalas e origem dos eixos Muitos valores em uma tabela ou em um gráfico tornam a análise mais complexa, e possíveis resultados mais difíceis de serem identificados

Procedimento para Experimento Fazer o tratamento estatístico adequado para os resultados Não tirar conclusões considerando-se apenas médias Valores médios só fazem sentido quando acompanhados de desvio padrão, variância, intervalo de confiança, etc. Valores médios com máximo e mínimo podem ajudar na análise mas não levam a resultados conclusivos, sem a presença de uma métrica que indique a dispersão dos dados

Procedimento para Experimento Observar os resultados e correlaciona-los com o que se conhece do sistema sendo avaliado Desconfie de resultados não esperados Tente relacionar os diferentes resultados obtidos Tente explicar os resultados obtidos

Avaliação de Desempenho de Sistemas Computacionais Planejamento de Experimentos Técnicas para Avaliação de Desempenho Análise de Resultados Próxima Aula: Apresentação de Resultados ??