23-06-1999INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (1) Exemplos de Sistemas Vetoriais Tópicos: Sistemas Cray Sistemas NEC.

Slides:



Advertisements
Apresentações semelhantes
Paralelismo em Máquinas Monoprocessadas
Advertisements

CPU: Controle e processamento
Arquitetura e organização de computadores
Arquitetura e organização de computadores
Arquitetura e organização de computadores.
Arquiteturas de Barramento
Unidade Lógica e Aritmética Introdução à Ciência da Computação
Sistemas Digitais Projeto RTL – Unidade de Execução
Unidades de Execução e de Controle Sistemas Digitais.
Visão Geral do Trabalho
Organização de Computadores Inserindo o Controle Identifica pontos de controle no caminho de dados – Busca da instrução – Operações lógicas e aritméticas.
CISC e RISC.
Rganização de Computadores Melhorias de Desempenho com Pipelines Capítulo 6 – Patterson & Hennessy Organização de Computadores Melhorias de Desempenho.
Fundação Educacional de Barretos Faculdade de Engenhariarmação
Processadores – Aula 3 Professor: André Luis Meneses Silva
Tecnologias Especificas Informática
Prof. Felipe Ferreira de Oliveira
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 6 (1) Reestruturação de Programas em Sistemas Vetoriais Tópicos: Técnicas de Otimização Notação.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 8 (1) Exploração de Paralelismo em Sistemas Vetoriais Tópicos: Vetorização Paralelização.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 29 (1) Comunicação Coletiva em MPI Tópicos: Operação de Broadcast Operações de Redução Exemplo:
Airam J. Preto , Celso L. Mendes
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 32 (1) Entrada/Saída em MPI Tópicos: Operações de E/S Sincronização de Processadores Referência:
SISTEMAS OPERACIONAIS
Sistemas Operacionais
Sistemas Operacionais I
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 35 (1) Comunicação Avançada em MPI Tópicos: Exemplo: Difusão de Dados em Anel Armazenamento.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 5 (1) Análise de Dependência Tópicos: Restrições à Vetorização Detecção de Dependência Teste.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 34 (1) Desempenho de Programas com MPI Tópicos: Exemplo: Integração Numérica Medição de Tempo.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 26 (1) Troca de Mensagens Troca de Mensagens Tópicos: Características de Mensagens Implementação.
Memória Principal.
Unidade Central De Processamento: Processador
Organização e Arquitetura de Computadores
Subsistema de Memória.
INTRODUÇÃO À COMPUTAÇÃO
Hardware : Memórias Instrutor : Marcos
Montagem e Manutenção de Computador I Curso Técnico em Rede de Computadores Aula 05.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 24 (1) Redes de Interconexão Tópicos: Redes com Topologia Dinâmica Comparação entre Topologias.
Organização e Arquitetura de Computadores
IMM Instalação e Manutenção de Microcomputadores
AFINAL QUANTOS MPS EXITEM?
DSC/CEEI/UFCG Introdução à Computação. DSC/CEEI/UFCG 2 Hardware – Memória  Componente de um sistema de computação cuja função é armazenar informações.
Hierarquia de Memória Arquitetura de Computadores Aula 4 – Memória 23/08/2012 Bruno Iran Ferreira Maciel Mestrando em Ciências da Computação – Cin/UFPE.
Slides before 1st Section Divider
Supercomputadores.
INTRODUÇÃO À COMPUTAÇÃO
Prof. André Luis M. Silva Hierarquia de Memória Prof. André Luis M. Silva
Dispositivos de leitura e armazenamento de dados Prof. Alfredo UNICESPI – 1º sem 2011 AULA 2.
Circuitos Integrados Digitais ELT017
Introdução à Informática
UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS - CCT CURSO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS IDENTIFICAÇÃO POR RÁDIO FREQUÊNCIA.
Processadores.
Sistemas computacionais
Arquitetura de Sistemas Operacionais
Memória Principal Anotações de Aula
A linguagem de Máquina – Instruções Básicas
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 33 (1) Análise de Desempenho em Programas Paralelos Tópicos: Introdução Aquisição de Dados.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 34 (1) Formas de Programação Paralela Tópicos: Compilação de Linguagens de Alto Nível Padrão.
INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 4 (1) Introdução à Programação de Processadores Vetoriais Tópicos: Conceitos Básicos Encadeamento.
Introdução ao Processamento Vetorial
Modos de Transferência Acesso Direto à Memória (DMA) ARQUITETURA DE COMPUTADORES II Prof. César Augusto M. Marcon.
Organização de Computadores Implementação da UCP Construção do caminho de dados Controle Implementação monociclo.
CESAC Prof.: Jadiel Mestre. Introdução à Informática.
 Todo processador é constituído de circuitos capazes de realizar algumas operações primitivas:  Somar e subtrair  Mover um dado de um local de armazenamento.
“Armazenar dados e programas que serão utilizados pelo processador (CPU – unidade central de processamento) ”
TRABALHO AVALIATIVO ALUNO: FRANCISCO HELIÉSUS DE MEDEIROS MATÉRIA: ORGANIZAÇÃO DE COMPUTADORES.
Pearson Education Sistemas Operacionais Modernos – 2ª Edição 1 Sistemas Operacionais FATEC-PB Professor: Gustavo Wagner
Construção de Via de dados Trabalho Avaliativo do Primeiro Bimestre. Marcos André de Sena Silva.
Jean Carlo Mendes
“Armazenar dados e programas que serão utilizados pelo processador (CPU – Unidade Central de Processamento) ”
Transcrição da apresentação:

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (1) Exemplos de Sistemas Vetoriais Tópicos: Sistemas Cray Sistemas NEC

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (2) Sistema Cray-1 Principais Características: Primeira unidade entregue em 1976 Ciclo de relógio: 12.5 ns Primeiro sistema a utilizar encadeamento Registros vetoriais p/ armazenar vetores (64 elem.) Doze unidades funcionais, com pipelining Não usava formato IEEE para ponto-flutuante Principal limitação: –Apenas uma porta de leitura e de escrita em memória

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (3) Sistema Cray-1 (cont.) Reg Vet Reg.Esc. Reg.End. Memória Unidades Funcionais Soma V. Int. Lógica V. Shift V. Soma P.Flut. Mult. P.Flut. Recípr. P.Flut. Soma Int.. Lógica Shift Cont.Popul. Soma Ender. Mult.Ender.

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (4) Sistema Cray-1 (cont.) Estrutura de Memória: –Tempo de ciclo: 50 ns –Número de bancos: 16 Registros Especiais: –VL (Vector Length): 7 bits comprimento de vetores –VM (Vector Mask): 64 bits mascarar operação em alguns elementos dos vetores: máscara=0 : NÃO faz operação máscara=1 : operação normal

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (5) Sistema Cray-1 (cont.) Exemplo: Somar apenas os elementos pares de dois vetores de 40 elementos X e Y VL  40 V X  mem(X) V Y  mem(Y) VM  V Z  V X + V Y Obs: Operações com e sem máscara têm a mesma duração, ditada por VL.

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (6) Sistema Cray X-MP Múltiplos Processadores (até 4) Primeira unidade entregue em 1983 Principais avanços sobre o Cray-1 –Mais portas de memória (2 p/ leitura, 2 p/ escrita) –Relógio mais rápido (9.5 ns) –Maior possibilidade de encadeamento (até 3) Memória compartilhada entre processadores

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (7) Sistemas Cray-2 e Y-MP Cray-2: –Introduzido em 1985 –Até 4 processadores –Sem encadeamento –Apenas uma porta de leitura e de escrita em memória Cray Y-MP –Introduzido em 1987 –Até 8 processadores –Versão mais rápida do X-MP

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (8) Sistemas Cray - Comparação

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (9) Sistemas Cray - Comparação

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (10) Sistema NEC SX-3 Introduzido no final da década de 80 Número de processadores: 1, 2 ou 4 Ciclo de relógio: 2.9 ns Estrutura de memória: –Capacidade: 64 MB a 2 GB –Número de bancos: 128 a 1024 Desempenho máximo por processador: 5.5 Gflops Modelo instalado no INPE/Cach.Paulista: –NEC SX-3/12-R, ciclo=2.5 ns –Desempenho Máximo: 3.2 GFLOPS

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (11) Sistema NEC SX-3 (cont.) Parte Vetorial de Cada Processador: Memória Regs.V et. Soma / Shift Mult / Lóg. Unidades Funcionais (1,2 ou 4) 2.9ns x 16 = 5.5 GFLOPS

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 3 (12) NEC SX-3  SX-4 Tecnologia de componentes: –SX-3: ECL (refrig.água) ; SX-4: CMOS (refrig.ar) Número Máximo de Processadores: –SX-3: 4 ; SX-4: 32 por nó, até 16 nós (512 proc.) Máxima taxa de processamento por processador: –SX-3: 6.4 Gflops ; SX-4: 2 Gflops Máxima taxa de processamento total: –SX-3: 23 Gflops ; SX-4: 1 Tflops