A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC.

Apresentações semelhantes


Apresentação em tema: "AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC."— Transcrição da apresentação:

1 AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, STALLINGS, W., cap 11 – AOC.

2 2 Tipos de Desempenho. Tempo de Execução (Latência). - Tempo total para o computador executar (rodar) um programa ou completar uma tarefa. - Desempenho da UCP, E/S, etc.. Vazão (Throughput) - Quantidade total de trabalhos (programas) feitos (executados) em um determinado tempo. - Desempenho de servidores (processadores, SO, etc.)

3 3 Definições de Desempenho TE X : Tempo de Execução de um programa de teste em uma máquina X D X = Desempenho X = 1/TE X D X/Y = Desempenho relativo de X em relação a Y D X/Y = D X /D Y = TE Y /TE X

4 4 Temporização: relógio (clock)

5 5 Medidas em ciclos de clock (relógio) T (período) = duração do ciclo de máquina (clock: relógio ) em segundos f (freqüência) = ciclos/segundo = Hertz = 1/T NCC: número de ciclos de clock por programa DCC: duração do ciclo de clock NCC = TE/DCC = TE*f

6 6 Ciclos por instrução (CPI) Cada Programa Várias instruções Cada instrução # (n úmero) diferente de ciclos CPI: Média de ciclos por instrução NIPP: # (n úmero) de instruções por programa NCC = NIPP*CPI TE = NCC/f = (NIPP*CPI)/f

7 7 Latência da instrução: LI Cada instrução completa leva em média CPI ciclos de máquina (clock). Cada ciclo de máquina (clock) tem a duração de T unidades de tempo A Latência LI é o tempo gasto para executar uma instrução sem pipeline, ou seja, LI sp = CPI*T Um processador gasta um tempo TE sp para executar n instruções sem usar pipeline: TE sp = n*CPI*T

8 8 Fatores de Desempenho TE = segundos/programa = (NIPP*CPI)/f = NIPP*CPI*T NIPP = instruções/programa CPI = ciclos de clock/ instrução T = segundos/ ciclo de clock

9 9 Banda Passante Taxa de rendimento ou vazão (throughput) do processador: ips (instruções por segundo), mips ou mflops. Memória: MB/s (Megabytes por segundo) Entrada e Saída (E/S): MB/s ou Mb/s (Megabits por segundo)

10 10 Banda Passante do Processador (VAZÃO) É a taxa na qual as instruções são executadas, ou seja é número de instruções executadas por unidade de tempo. Exemplos: - ips (instruções por segundo) - mips (milhões de instruções por segundo) - mflops (milhões de instruções de ponto flutuante por segundo) Sem usar o pipeline a vazão V de um processador pode ser dada por V = 1/LI

11 11 Banda passante de memória (BPM) LB = largura do barramento de dados (memória) f BM : freqüência da banda de memória BPM = LB * f BM Medido em MB/s (Megabytes por segundo)

12 12 Banda passante de E/S (BPES) LB = largura do barramento de dados de E/S f BES : freqüência do barramento de E/S BPES = LB * f BES Medido em MB/s ou Mb/s (Megabits por segundo)

13 13 BenchMarks -programas que permitem comparar o desempenho de computadores. - Melhor programa de benchmark: aplicações reais

14 14 Conjuntos de BenchMarks -Sintéticos: Whetstone e o Dhrystone. -SUPER-PI -SPEC (89, 92, 95, 2000 e 2005) -Sandra 2005 (System ANalyser, Diagnostic and Reporting Assistant) )PCMARK05, 3DMARK05, SYSmark (www.futuremark.com) DiskBench V2.4.3 (para HD)

15 15 SPEC : System Performance Evaluation Corporation Consórcio de empresas, criado em 1989, com o objetivo de melhorar a medida e as informações disponíveis sobre o desempenho de proces- sadores e computadores (http://www.spec.org)

16 16 Membros do consórcio SPEC 3DLabs * Acer Inc. * AMD * Apple * ATI * Azul Systems * BEA Systems * Borland * Bull * Dell * EMC * Exanet * Fabric* Freescale * Fujitsu * HP * Hitachi * IBM * Intel * ION * JBoss * Microsoft * Mirapoint * NEC * Network Appliance * Novell * NVIDIA * Openwave Systems * Oracle * Panasas * PathScale * Portland Group * S3 Graphics Co., Ltd. * SAP AG * SGI * Sun* Super Micro * Sybase * Symantec* Unisys * Verisign *

17 17 Programas do SPEC 95 (1) - 8 programas inteiros na linguagem C (medida SPECint95) go : Inteligência Artificial, joga o Go M88ksim: Simulador do chip Motorola 88k (executa um programa de teste) gcc: Compilador C Gnu gerando código para o SPARC compress: Compressão e descompressão de arquivos na memória li : Interpretador Lisp ijpeg: Compressão e descompressão gráficas perl: Manipula strings e números primos na linguagem Perl vortex: Programa de banco de dados

18 18 Programas do SPEC 95 (2) - 10 Programas de ponto flutuante na linguagem F77 (medida SPECfp95): tomcatv : Programa gerador de malhas swim: Modelo para águas rasas com uma grade 513 x 513 su2cor : Física quântica (simulação do método de Monte Carlo) hydro2d : Astrofísica (equações hidrodinâmicas de Naiver Stokes) mgrid: Potenciais de campo (solução em 3-D) applu: Equações diferenciais parciais parabólicas e elípticas trub3d : Simula uma turbulência isotrópica homogênea em um cubo apsi : Resolves problemas envolvendo temperatura, vento e poluição fpppp : Química quântica wave5 : Física do plasma (simulação de partícula eletromagnética)

19 19 Exemplo 1 de Benchmark – Programas 3DMark2001 SE PCMark04 Sandra 2004 versão 9.89 SYSmark2002

20 20 Exemplo 1 de Benchmark – Configuração Configuração de Hardware Athlon 64 : Chaintech ZNF3-150(nForece3-150, BIOS de 13 /10/2003)Chaintech ZNF3-150 Pentium 4 : Soyo P4I875P (Intel 875P, BIOS de 19/10/2003)Soyo P4I875P Pentium 4 "Prescott": Intel D875PBZ (Intel 875P, BIOS P21)Intel D875PBZ Memória: Dois módulos 256 MB PC3200 TwinMOS em configuração DDR Dual Channel. Disco rígido: Maxtor DiamondMax 9 Plus (60 GB, ATA-133) Placa de Vídeo: Gigabyte Radeon 9800 Pro Resolução de vídeo: 800x600x32 Configuração de Software Windows XP Professional em português, instalado em NTFS Service Pack 1A Direct X 9.0B Versão do driver nForce: 3.13 Versão do driver Inf Intel: Versão do driver de vídeo ATI: 7.95 ( )

21 21 Exemplo 1 de Benchmark: Sandra 2004 (processador) Mede a quantidade de instruções por segundo que o processador é capaz de executar, não considera como o processador é usado, isto é, não simula seu uso em programas comerciais.

22 22 Benchmark : Unidade de Ponto Flutuante (FPU) O teste Inclui os cálculos necessários para a renderização de imagens tridimensionais, com os resultados do teste dados em instruções de ponto flutuante por segundo.

23 23 Simula a utilização de aplicativos reais Benchmark: Desempenho Geral ( SYSmark2002)

24 24 Benchmark : 3DMark2001 SE (programas 3D) Jogos 3D exigem o máximo de processamento matemático, vídeo 3D, disco e memória.

25 25 Exemplo 2 de Benchmark – Configuração ProcessadorClock InternoClock ExternoDados por ClockCache L1Cache L2Cache L3 Athlon GHz200 MHz2128 KB1 MBNão Athlon ,2 GHz200 MHz2128 KB1 MBNão Athlon XP ,2 GHz200 MHz2128 KB512 KBNão Pentium 4 3,2 GHz3,2 GHz200 MHz4158 KB512 KBNão Pentium 4 3,2 GHz "E"3,2 GHz200 MHz4166 KB1 MBNão Pentium 4 3,4 GHz3,4 GHz200 MHz4158 KB512 KBNão Pentium 4 Extreme Edition 3,2 GHz3,2 GHz200 MHz4158 KB512 KB2 MB Pentium 4 Extreme Edition 3,4 GHz3,4 GHz200 MHz4158 KB512 KB2 MB

26 26 Exemplo 2 de Benchmark – Sandra 2005

27 27 SO : Exemplo 3 de benchmark : PCMark04 (1) SO : MS Windows XP – Configuração de HW: ProcessadorPentium GHzPentium GHz Pentium 4 Mobile HT 3.06 GHz Vídeo NVIDIA GeForce FX 5200Intel 82865G ATI MOBILITY RADEON 9000 Memória

28 28 Exemplo 3 de benchmark : PCMark04 (2)

29 Exemplo 4 de benchmark AMD Opteron GHz x Intel Xeon 3.6 GHz Opteron 100 SeriesOpteron 200 SeriesOpteron 800 Series HyperTransport channels2x 200 MHz quad-pumped3x 200 MHz quad-pumped4x 200 MHz quad-pumped Total bandwidth I/O6.4 GB/s9.6 GB/s12.8 GB/s Applications Single-processorSingle-processor Dual-processor Single-processor Dual-processor Multi-Processor ( up to 8)

30 30 Processadores AMD Opteron -características

31 31

32 32

33 33


Carregar ppt "AOC II UD I.3 : MEDIDAS DE DESEMPENHO Referências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005. STALLINGS, W., cap 11 – AOC."

Apresentações semelhantes


Anúncios Google