Processador Intel Itanium

Slides:



Advertisements
Apresentações semelhantes
Integridade de Dados em Memórias Cache
Advertisements

Organização de Computadores I
Arquitetura de Computadores
William Stallings Arquitetura e Organização de Computadores 8a Edição
Arquitetura e organização de computadores.
Processadores AMD.
Aula 16: Memória Principal e Memória Virtual
ARQUITETURAS RISC E CISC
Exemplo de arquitetura registrador-registrador- MIPS
Arquitetura de Sistemas Operacionais
MO401 Arquitetura de Computadores I
MC542 Organização de Computadores Teoria e Prática
Arquitetura AMD 64 Família de 64 bits da AMD Trabalho feito por :
Daniel M. Aquino, Marcelo C. Perez, Thais A. B. Fernandes
Processador Pentium 4 MO401 – Arquitetura de Computadores I
Douglas Gameiro Diniz RA: Fernando Mendonça Maranho RA:016089
Arquiteturas Superescalares
Paralelismo em nível de instrução: Arquiteturas VLIW Grupo 01: Júlia Martinez Perdigueiro ra Tatiane Baggio Borili ra
1998 Morgan Kaufmann Publishers Paulo C. Centoducatte - IC/Unicamp- 2002s Prof. Paulo Cesar Centoducatte
CISC e RISC.
Aula 8 01/09/10 (Turmas 1 e 2) Profa. Sarita
SSC114 Arquitetura de Computadores Pipeline - Predição de desvios
SSC144 Arquitetura de Computadores Introdução
SSC541 - SISTEMAS OPERACIONAIS I Aula 13 – Gerenciamento de Memória
Xtensa LX Processador Configurável Tensilica
Mateus Beck Rutzig Picojava Processors Mateus Beck Rutzig
ARQUITETURA E ORGANIZAÇÃO DE PROCESSADORES DSP TI (Família C6000)
Estudo da aplicação “jogos” em sistemas embarcados
Rganização de Computadores Melhorias de Desempenho com Pipelines Capítulo 6 – Patterson & Hennessy Organização de Computadores Melhorias de Desempenho.
Estudo comparativo entre as arquiteturas Opteron e Itanium
Professor: Erivelto Tschoeke – UDESC/CEPLAN
REPRESENTAÇÃO DE INSTRUÇÕES
Processadores – Aula 3 Professor: André Luis Meneses Silva
Processadores – Aula 3 Professor: André Luis Meneses Silva
Sistemas Operacionais I
Arquitectura de Computadores II
Prof. Felipe Ferreira de Oliveira
Fundamentos da Arquitetura de Computadores
Representação de Instruções
SISTEMAS OPERACIONAIS
Família Intel P5 e P6 P5 P6 NetBurst Incluindo cache L2.
Subsistemas de memória
Sistemas Operacionais I
Aveiro, 28 de Abril de Arquitectura de Computadores II Ano lectivo 2003/2004 Nuno
Organização e Arquitetura de Computadores
Arquitetura de Computadores
Aula15: Reduzindo Miss Rate e Hit Time
Agenda Modos de Endereçamento.
Davi de Andrade Lima Castro RA:  A plataforma C6000: ◦ Ponto-fixo:  C62x  C64 / C64x+ ◦ Ponto-flutuante:  C67x / C67x+ ◦ Arquitetura VLIW:
Processamento de dados na UCP e memória UCP
Contextualização de Paralelismo em nível de instrução
ARQUITETURA DE COMPUTADORES II
Software Básico Nível ISA Capítulo 5 Mitsuo Takaki
Execução Especulativa
INTRODUÇÃO À COMPUTAÇÃO
Bruno C. Bourbon Jarbas J. de O. Júnior {bcb, cin.ufpe.br
Microprocesadores x Microcontroladores
Localidade Princípio da localidade è um programa acessa uma
Ch7b-1 Capítulo Sistemas de Memória - Memória Virtual.
Parte 3 Seção de Dados e Unidade de Controle
Conceitos Avançados de Arquitetura de Computadores Arquiteturas RISC Arquiteturas Superpipeline e Superescalares.
Slides before 1st Section Divider
1  1998 Morgan Kaufmann Publishers Paulo C. Centoducatte – MC542 - IC/Unicamp- 2006s Prof. Paulo Cesar Centoducatte
Arquitetura de Computadores Processadores 2 Waldemiro Arruda.
Arquitetura de Computadores
Arquitetura do ARM RISC (Reduced Instruction Set Computer) – Conjunto relativamente grande de registradores – Modelo “load/store “de processamento Operações.
Hierarquia de Memória – Parte 2 Prof. André Luis M. Silva
 Evolução constante das linguagens de programação de alto nível (LAN) desde o Fortran (primeira LAN)  Surgimento de novos paradigmas como a OO, Orientação.
Pearson Education Sistemas Operacionais Modernos – 2ª Edição 1 Sistemas Operacionais FATEC-PB Professor: Gustavo Wagner
Construção de Via de dados Trabalho Avaliativo do Primeiro Bimestre. Marcos André de Sena Silva.
Transcrição da apresentação:

Processador Intel Itanium

Visão Geral

Visão Geral

Caracteristicas Arquitetura EPIC - Explicit Parallel Instruction-Set Computer Processador de 64 bits Predication Execução Especulativa de Dados e Instruções Prediction ILP (Instruction Level Parallelism) - Pacotes de Instruções (Bundles)

Registradores Muitos registradores Propósito geral: 128 de 64 bits Ponto flutuante: 128 de 82 bits Registradores de predicado: 64 de 1 bit Registradores de branch: 8 de 64 bits RSE: Register Stack Engine Salvamento automático de determinados registradores Permite compartilhamento com outras funções

Diagrama de blocos do processador

Diagrama de blocos Processamento de instruções Prefetch, fetch, cache L1, branch prediction, geração de endereçamento, buffer de instruções, despacho de instruções, register renaming Execução Controle Alimentador de exceções, pipeline, SER Subsistema de memória Cache L2, Cache L3, TLB, ALAT, PIC

Sistema de memória Endereça 2^128 bytes!

Sistema de memória Cache L1: possui 2 unidades (1 para dados e a outra para instruções) de 16K cada Cache L2: unificada (armazena dados e intruções) Cache L3: idem à L2

Cache L1 L1I e L1D 4-way set-associative fisicamente indexadas para L1D: política de write through

Cache L2 Unificada 256 KB de espaço 8-way set-associative Linhas de cache com 128 bits Implementa o Write back

Cache L3 Unificada Tamanho variável: 1,5 MB até 3,0MB 12-way set-associative Linhas de cache de 128 bits

Sistema de memória Advanced Load Address Table (ALAT) Permite data speculation Translation Lookaside Buffers (TLB) Mapeamento entre endereços virtuais e físicos DTLB e ITLB DTLB L1 e DTBL L2 L1 gerencia Loads e acertos na Cache L1D L2 gerencia Stores e acertos nas Caches L2 e L3 Write Coalescing

Pipeline O pipeline do processador Itanium possui dez estágios:

Pipeline Nos 3 primeiros estágios ocorrem: Prefetch de instruções Fetch de 32 bytes em 1 ciclo de clock

Pipeline Brach Prediction O Itanium provê instruções para o fornecimento de branch hints Há também estruturas dentro do processador para esta função

Pipeline No quarto estágio do pipeline ocorre: Despacho de até 6 instruções para 9 portas de emissão. Bits de controle tipo Stop eliminam checagem de dependências

Pipeline No quinto estágio do pipeline ocorre: Register Renaming Transparente para o compilador Evita empilhar/desempilhar parâmetros

Pipeline No sexto e sétimo estágios do pipeline ocorrem: Busca de operandos "Delayed Stall" para dependências de registradores, o qual ajuda a evitar o esvaziamento do pipeline. Operand Latch Manipulation (OLM) captura retorno de dados dos operandos em latches, a fim de simular leitura de registradores.

Pipeline No oitavo estágio do pipeline ocorre: Resolução de predicados e cancelamento de execução de instruções cujo bit indicador de predicado tenha sido desligado. Todas as instruções cujo bit indicador de predicado ainda permaneça ligado, têm operandos lidos e executam na unidade funcional correspondente.

Pipeline Nos nono e décimo estágios do pipeline ocorrem: Execução de branches em paralelo, sendo que a especulação e predição dos branches resultam em clusters de branches.

Pipeline A execução de três branches por clock é realizada de forma otimizada para clusters de branches, permitindo compares/branches no mesmo grupo de emissão.

Tipos de instruções 6 tipos diferentes Cada um pode ser executado por 1 ou mais unidades de execução Cada formato possui diversas codificações diferentes OBS: instruções tem um formato fixo!!!

Tipos de instruções Lógica de execução 2 pacotes são lidos pelo processador por ciclo Cada pacote contém 3 instruções Instruções não utilizadas são gravadas em um buffer Pacote: cada instrução tem 41 bits 5 bits são utilizados como template, indicando a unidade de execução

Instrução Formato: [qp] opcode[.complementos] destino=fonte[,fonte] Paralelismo: o Itanium exige que o código assembly esteja separado em unidades independentes Especulação Exceções e resultados gerados em código que não deveria ser executado são descartadas

Performance?... Performance ainda ruim... falta um compilador bom problemas arquiteturais e de implementação Muito bom para muitas coisas ao mesmo tempo, mas ‘lento’ em cada uma delas.