Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouElisa Araujo Alterado mais de 10 anos atrás
1
rganização de Computadores Multiprocessadores Capítulo 9 – Patterson & Hennessy Organização de Computadores Multiprocessadores Capítulo 9 – Patterson & Hennessy Prof. Fábio M. Costa Instituto de Informática Universidade Federal de Goiás
2
Visão geral Questões gerais Classificação Conexão entre processadores e memória(s) Clusters
3
Questões gerais Como os processadores que rodam em paralelo compartilham dados Como é feita a coordenação entre processadores que executam em paralelo Quantos processadores podem executar em paralelo (sem degradar o desempenho) Como é a conexão entre os processadores
4
Compartilhamento de dados Memória compartilhada – Um único espaço de endereçamento Dois tipos: – UMA – Uniform Memory Acess Também conhecidos como processadores SMP (Symetric MultiProcessors) Todos os processadores gastam o mesmo tempo para acesso à memória Em geral, todos estão conectados identicamente a uma mesma unidade (ou grupo de unidades) de memória – NUMA – Non-Uniform Memory Access Alguns acessos à memória são mais rápidos do que outros, dependendo do processador e dos dados acessados A memória e os dados são particionados entre os processadores – mas ainda um só espaço de endereçamento
5
Compartilhamento de dados Troca de mensagens – Send e receive – Com memória distribuída, i.e., cada processador tem sua própria memória e espaço de endereçamento privativos A rede de interconexão pode ser: – Um barramento, – Uma rede dedicada (de propósito específico), ou – Uma rede de propósito geral (e.g., um cluster organizado através de uma LAN)
6
Programação de sistemas multiprocessadores Eficiência e escalabilidade – Ganho de desempenho com o aumento no número de processadores Programadores precisam, em geral, conhecer bem o hardware A Lei de Amdahl – Influência de partes não paralelizáveis do programa
7
Multiprocessadores com barramento único
8
O problema da coerência de caches Inconsistência entre réplicas dos dados mantidos em caches distintas Duas técnicas básicas: – Write-back – Write-through
9
Hardware adicional para ajudar a manter coerência de cache
10
Multiprocessadores conectados por meio de uma rede
11
Memória compartilhada distribuída
12
Clusters Multiprocessadores construídos sobre redes locais Uso de software especializado para implementar a imagem de uma máquina paralela – PVM – Parallel Virtual Machine – MPI – Message-Passing Interface
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.