A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

[Leonardo Garcia Tampelini]

Apresentações semelhantes


Apresentação em tema: "[Leonardo Garcia Tampelini]"— Transcrição da apresentação:

1 [Leonardo Garcia Tampelini]
[39a lista do TOP500] [Leonardo Garcia Tampelini] Instituto de Computação MO601 – Mario Côrtes UNICAMP – Nov/2012

2 Introdução Em 1986 Hans Meuer começa a publicar a contagem do número de supercomputadores Em 1979, com o objetivo de avaliar o desempenho de grandes computadores, Jack Dongarra formula o Linpack benchmark. Em 1993, com a junção das ideias a primeira lista do Top500 é lançada. Desde então, está lista é atualizada 2 vezes ao ano (Junho e Novembro). Falar sobre o surgimento da lista, seu objetivo e a importância dos dados capturados em cada nova lista.

3 Linpack Benchmark Programa que resolve um enorme sistema linear.
Altamente Paralelizável Intensivo em relação ao uso de CPU Vantagens Um único número: Rmax Simples para definir e utilizar para classificar Permite definir o tamanho diferentes tamanho de problemas Desvantagens Ênfase somente no pico máximo de utilização da CPU Não exige muita comunicação Ignora lei de Amdhal ( aumentar o problema conforme mais CPUs são usadas) Explicar o motivo da escolha do Linpack Mas as vantagens e desvantagem

4 Outras medidas Rmax = desempenho para o maior problema executado em uma máquina (em Gflop/s); Nmax = tamanho do maior problema executado em uma máquina; N1/2 = tamanho quando metade de Rmax é executado; Rpeak = pico de performance teórico para a máquina (em Gflop/s) #Proc = Número de processadores utilizados Power = Consumo de energia em Watts (Green500) Apresentar mais algumas medidas que o Top500 calcula e enfatizar o consumo de energia.

5 Arquiteturas PVP - Parallel Vector Processor
SMP - Symmetric Multiprocessor MPP - Massively Parallel Processors NOW - Network of Workstations COW - Cluster of Workstations Cluster (mais nós que processaor por nó) Constellation (mais processador por nó que nós) Mostrar como o top500 classifica as arquiteturas. Enfatizar as 2 únicas que aparecem na lista atual.

6 Arquiteturas PVP SMP MPP NOW Escalabilidade Baixa Alta Media Latência
Programação Facil Dificil Diicil Custo Alto Medio baixo Resumir as características

7 Arquiteturas Mostrar a tendência do Cluster (devido a escalabilidade e custo baixo) Falar sobre o problema do aumento dos nós e o problema do gargalo da comunicação que começou por volta de 2007/2008

8 Processadores Falar do uso dos processadores de prateleira e a relação do uso do Cluster

9 Modelo de programação MPI OpenMP Hibrido Muitos Cores (threads)
Muitos Nós Hibrido MPI e OpenMP Apresentar a questão do uso de cluster e como programar para eles de forma eficiente.

10 Referente a 39a Lista dos Top500 Junho 2012.
Os mais rápidos - Top 5 Mostra as máquinas mais rápidas e enfatizar o BlueGene/Q que ocupa a 1 e 3 posição. Referente a 39a Lista dos Top500 Junho 2012.

11 Projeto IBM – BlueGene/Q
Processador: PowerPC A2 Power (64-bits) 1.8Ghz 18 núcleos 16 cores para processamento 1 core para SO 1 core redundante (reserva) # 100 mil Rede: 5D Torus de 2Gb/s Memória: 1,6 Petabytes de memória RAM Energia: 7.890 MW 2 GFlops/W Sumarizar as características do BlueGene/Q - Sequoia

12 Projeto IBM – BlueGene/Q
Estrutura Modular – altamente escalável Mostrar sua escalabilidade e comentar sobre o BlueGene/Q - Mira que ocupa a 3 posição e é apenas uma redução do BlueGene/Q Sequoia

13 Fujitsu – K Computer Processador: Rede: Tofu Energia:
SPARC64 VIIIfx de 8 núcleos – 2Ghz - L1 de 6M/12-way # Rede: Tofu 6D mesh/torus Capacidade 80 mil nós Passagem de Mensagens Memória: 1,11 Petabytes de memória RAM Energia: 12659,89 MW % mais que o BlueGene/Q - Sequoia Obs.: 55% mais lento que o BlueGene/Q - Sequoia Mostrar as principais caracteristicas do segundo lugar da lista

14 Tendências Discutir a lei de Moore, as diferenças com os dados estatísticos atuais. Mostrar o histórico de crescimento e mostrar as algumas previsões

15 Tendências Discutir o problema da miniaturizaçao e uma possível mudança de paradigma.

16 A 40o Lista Top 500 (12/11/2012) Novo primeiro lugar Titan da Cray (Antigo Jaguar). Desempenho: PetaFlop/s Processador processadores AMD Opteron C de 2.200GHz processadores gráficos NVIDIA K20x As mudanças transformaram o antigo Jaguar em uma maquina 10x mais rápida e 5x mais eficiente, saindo da 6a posição para a 1ª Geralmente GPU não é efeiciente energeticamente , mas o TITAM manteve o consumo em 8209 Watts, apenas 4% a mais que o Sequoia. Falar sobre o novo número 1 da lista – Titam. Comentar do uso de GPU como co-processador e discutir porque ele não é contabilizado no número de processadores. Falar da dificuldade de programar em GPU e como isso está tentando ser resolvido.

17 Highlights da 40ª Lista Um total de 62 sistemas estão utilizando Aceleradores gráficos como co-processador. (Tendência?) Sistemas que utilizam multicores (84,6%) continuam dominando a lista. Desses, 46,2% do total utilizam processadores com 6 ou mais núcleos. A Intel continua fornecendo a maioria dos processadores (76%), seguida pela AMD (12%) e pela IBM (10,6%). InfiniBand é a tecnologia que fornece a interconexão de 226 sistemas, acima dos 209 sistemas, tornando-o mais usado tecnologia de interconexão interna do sistema. Gigabit Ethernet são encontrados em 188 sistemas. Os Estados Unidos continua na liderança com 251 dos 500 sistemas. A participação europeia (105 sistemas) ainda é menor do que a quota da Ásia (123 sistemas). O número de sistemas instalados na China já estabilizou em 72, em comparação com 68 e 74 nas duas últimas listas, mantendo a segunda posição. Mostrar os principais pontos da nova lista e mostrar a estabilidade dos dados.

18 Considerações Finais Técnicas de Programação flexíveis são essenciais
Dificuldade em programar para GPUs Dados se mantém relativamente estáveis Possível fazer boas previsões Limite da escalabilidade Gargalo nas redes de comunicação


Carregar ppt "[Leonardo Garcia Tampelini]"

Apresentações semelhantes


Anúncios Google