A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

UD I.3 : MEDIDAS DE DESEMPENHO

Apresentações semelhantes


Apresentação em tema: "UD I.3 : MEDIDAS DE DESEMPENHO"— Transcrição da apresentação:

1 UD I.3 : MEDIDAS DE DESEMPENHO
AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC.

2 Tipos de Desempenho . Tempo de Execução (Latência).
- Tempo total para o computador executar (rodar) um programa ou completar uma tarefa. - Desempenho da UCP, E/S, etc. . Vazão (Throughput) - Quantidade total de trabalhos (programas) feitos (executados) em um determinado tempo. - Desempenho de servidores (processadores, SO, etc.)

3 Definições de Desempenho
TEX : Tempo de Execução de um programa de teste em uma máquina X DX = DesempenhoX = 1/TEX DX/Y = Desempenho relativo de X em relação a Y DX/Y = DX /DY = TEY/TEX

4 Temporização: relógio (clock)

5 Medidas em ciclos de clock (relógio)
T (período) = duração do ciclo de máquina (clock: relógio) em segundos f (freqüência) = ciclos/segundo = Hertz = 1/T NCC: número de ciclos de clock por programa DCC: duração do ciclo de clock NCC = TE/DCC = TE*f

6 Ciclos por instrução (CPI)
Cada Programa  Várias instruções Cada instrução  # (número) diferente de ciclos CPI: Média de ciclos por instrução NIPP: # (número) de instruções por programa NCC = NIPP*CPI TE = NCC/f = (NIPP*CPI)/f

7 Latência da instrução: LI
Cada instrução completa leva em média CPI ciclos de máquina (clock). Cada ciclo de máquina (clock) tem a duração de T unidades de tempo A Latência LI é o tempo gasto para executar uma instrução sem pipeline, ou seja, LIsp= CPI*T Um processador gasta um tempo TEsp para executar n instruções sem usar pipeline: TEsp= n*CPI*T

8 Fatores de Desempenho TE = segundos/programa
= (NIPP*CPI)/f = NIPP*CPI*T NIPP = instruções/programa CPI = ciclos de clock/ instrução T = segundos/ ciclo de clock

9 Banda Passante Taxa de rendimento ou vazão (“throughput”) do processador: ips (instruções por segundo), mips ou mflops. Memória: MB/s (Megabytes por segundo) Entrada e Saída (E/S): MB/s ou Mb/s (Megabits por segundo)

10 Banda Passante do Processador (VAZÃO)
É a taxa na qual as instruções são executadas, ou seja é número de instruções executadas por unidade de tempo. Exemplos: - ips (instruções por segundo) - mips (milhões de instruções por segundo) - mflops (milhões de instruções de ponto flutuante por segundo) Sem usar o pipeline a vazão V de um processador pode ser dada por V = 1/LI

11 Banda passante de memória (BPM)
LB = largura do barramento de dados (memória) fBM : freqüência da banda de memória BPM = LB * fBM Medido em MB/s (Megabytes por segundo)

12 Banda passante de E/S (BPES)
LB = largura do barramento de dados de E/S fBES : freqüência do barramento de E/S BPES = LB * fBES Medido em MB/s ou Mb/s (Megabits por segundo)

13 BenchMarks programas que permitem comparar o desempenho de computadores. Melhor programa de “benchmark”: aplicações reais

14 Conjuntos de BenchMarks
Sintéticos: Whetstone e o Dhrystone. SUPER-PI SPEC (89, 92, 95, 2000 e 2005) Sandra 2005 (System ANalyser, Diagnostic and Reporting Assistant) PCMARK05, 3DMARK05, SYSmark ( DiskBench V2.4.3 (para HD)

15 SPEC : System Performance Evaluation Corporation
Consórcio de empresas, criado em 1989, com o objetivo de melhorar a medida e as informações disponíveis sobre o desempenho de proces-sadores e computadores (

16 Membros do consórcio SPEC
3DLabs * Acer Inc. * AMD * Apple * ATI * Azul Systems * BEA Systems * Borland * Bull * Dell * EMC * Exanet * Fabric* Freescale * Fujitsu * HP * Hitachi * IBM * Intel * ION * JBoss * Microsoft * Mirapoint * NEC * Network Appliance * Novell * NVIDIA * Openwave Systems * Oracle * Panasas * PathScale * Portland Group * S3 Graphics Co., Ltd. * SAP AG * SGI * Sun* Super Micro * Sybase * Symantec* Unisys * Verisign *

17 Programas do SPEC 95 (1) go : Inteligência Artificial, joga o Go
- 8 programas inteiros na linguagem C (medida SPECint95) go : Inteligência Artificial, joga o Go M88ksim: Simulador do chip Motorola 88k (executa um programa de teste) gcc: Compilador C Gnu gerando código para o SPARC compress: Compressão e descompressão de arquivos na memória li : Interpretador Lisp ijpeg: Compressão e descompressão gráficas perl: Manipula strings e números primos na linguagem Perl vortex: Programa de banco de dados

18 Programas do SPEC 95 (2) tomcatv : Programa gerador de malhas
- 10 Programas de ponto flutuante na linguagem F77 (medida SPECfp95): tomcatv : Programa gerador de malhas swim: Modelo para águas rasas com uma grade 513 x 513 su2cor: Física quântica (simulação do método de Monte Carlo) hydro2d: Astrofísica (equações hidrodinâmicas de Naiver Stokes) mgrid: Potenciais de campo (solução em 3-D) applu: Equações diferenciais parciais parabólicas e elípticas trub3d : Simula uma turbulência isotrópica homogênea em um cubo apsi : Resolves problemas envolvendo temperatura, vento e poluição fpppp : Química quântica wave5: Física do plasma (simulação de partícula eletromagnética)

19 Exemplo 1 de Benchmark – Programas
3DMark2001 SE PCMark04 Sandra 2004 versão 9.89 SYSmark2002

20 Exemplo 1 de Benchmark – Configuração
Configuração de Hardware Athlon 64 : Chaintech ZNF3-150(nForece3-150, BIOS de 13 /10/2003) Pentium 4 : Soyo P4I875P (Intel 875P, BIOS de 19/10/2003) Pentium 4 "Prescott": Intel D875PBZ (Intel 875P, BIOS P21) Memória: Dois módulos 256 MB PC3200 TwinMOS em configuração DDR Dual Channel. Disco rígido: Maxtor DiamondMax 9 Plus (60 GB, ATA-133) Placa de Vídeo: Gigabyte Radeon 9800 Pro Resolução de vídeo: 800x600x32 Configuração de Software Windows XP Professional em português, instalado em NTFS Service Pack 1A Direct X 9.0B Versão do driver nForce: 3.13 Versão do driver Inf Intel: Versão do driver de vídeo ATI: 7.95 ( )

21 Exemplo 1 de Benchmark: Sandra 2004 (processador)
Mede a quantidade de instruções por segundo que o processador é capaz de executar, não considera como o processador é usado, isto é, não simula seu uso em programas comerciais.

22 Benchmark : Unidade de Ponto Flutuante (FPU)
O teste Inclui os cálculos necessários para a renderização de imagens tridimensionais, com os resultados do teste dados em instruções de ponto flutuante por segundo.

23 Benchmark: Desempenho Geral ( SYSmark2002)
Simula a utilização de aplicativos reais

24 Benchmark : 3DMark2001 SE (programas 3D)
Jogos 3D exigem o máximo de processamento matemático, vídeo 3D, disco e memória .

25 Exemplo 2 de Benchmark – Configuração
Processador Clock Interno Clock Externo Dados por Clock Cache L1 Cache L2 Cache L3 Athlon 2 GHz 200 MHz 2 128 KB 1 MB Não Athlon 2,2 GHz Athlon XP 3200+ 512 KB Pentium 4 3,2 GHz 3,2 GHz 4 158 KB Pentium 4 3,2 GHz "E" 166 KB Pentium 4 3,4 GHz 3,4 GHz Pentium 4 Extreme Edition 3,2 GHz 2 MB Pentium 4 Extreme Edition 3,4 GHz

26 Exemplo 2 de Benchmark – Sandra 2005

27 Exemplo 3 de benchmark : PCMark04 (1) SO : MS Windows XP – Configuração de HW:
Processador Pentium GHz Pentium GHz Pentium 4 Mobile HT 3.06 GHz Vídeo NVIDIA GeForce FX 5200 Intel 82865G ATI MOBILITY RADEON 9000 Memória 510 502 446

28 Exemplo 3 de benchmark : PCMark04 (2)

29 Exemplo 4 de benchmark AMD Opteron 250 2.4 GHz x Intel Xeon 3.6 GHz
Opteron 100 Series Opteron 200 Series Opteron 800 Series HyperTransport channels 2x 200 MHz quad-pumped 3x 200 MHz quad-pumped 4x 200 MHz quad-pumped Total bandwidth I/O 6.4 GB/s 9.6 GB/s 12.8 GB/s Applications Single-processor Single-processor Dual-processor Single-processor Dual-processor Multi-Processor ( up to 8)

30 Processadores AMD Opteron -características

31

32

33


Carregar ppt "UD I.3 : MEDIDAS DE DESEMPENHO"

Apresentações semelhantes


Anúncios Google