Processador Intel Itanium

Slides:

Advertisements

Apresentações semelhantes

Integridade de Dados em Memórias Cache

Advertisements

Organização de Computadores I

Arquitetura de Computadores

William Stallings Arquitetura e Organização de Computadores 8a Edição

Arquitetura e organização de computadores.

Processadores AMD.

Aula 16: Memória Principal e Memória Virtual

ARQUITETURAS RISC E CISC

Exemplo de arquitetura registrador-registrador- MIPS

Arquitetura de Sistemas Operacionais

MO401 Arquitetura de Computadores I

MC542 Organização de Computadores Teoria e Prática

Arquitetura AMD 64 Família de 64 bits da AMD Trabalho feito por :

Daniel M. Aquino, Marcelo C. Perez, Thais A. B. Fernandes

Processador Pentium 4 MO401 – Arquitetura de Computadores I

Douglas Gameiro Diniz RA: Fernando Mendonça Maranho RA:016089

Arquiteturas Superescalares

Paralelismo em nível de instrução: Arquiteturas VLIW Grupo 01: Júlia Martinez Perdigueiro ra Tatiane Baggio Borili ra

1998 Morgan Kaufmann Publishers Paulo C. Centoducatte - IC/Unicamp- 2002s Prof. Paulo Cesar Centoducatte

Aula 8 01/09/10 (Turmas 1 e 2) Profa. Sarita

SSC114 Arquitetura de Computadores Pipeline - Predição de desvios

SSC144 Arquitetura de Computadores Introdução

SSC541 - SISTEMAS OPERACIONAIS I Aula 13 – Gerenciamento de Memória

Xtensa LX Processador Configurável Tensilica

Mateus Beck Rutzig Picojava Processors Mateus Beck Rutzig

ARQUITETURA E ORGANIZAÇÃO DE PROCESSADORES DSP TI (Família C6000)

Estudo da aplicação “jogos” em sistemas embarcados

Rganização de Computadores Melhorias de Desempenho com Pipelines Capítulo 6 – Patterson & Hennessy Organização de Computadores Melhorias de Desempenho.

Estudo comparativo entre as arquiteturas Opteron e Itanium

Professor: Erivelto Tschoeke – UDESC/CEPLAN

REPRESENTAÇÃO DE INSTRUÇÕES

Processadores – Aula 3 Professor: André Luis Meneses Silva

Processadores – Aula 3 Professor: André Luis Meneses Silva

Sistemas Operacionais I

Arquitectura de Computadores II

Prof. Felipe Ferreira de Oliveira

Fundamentos da Arquitetura de Computadores

Representação de Instruções

SISTEMAS OPERACIONAIS

Família Intel P5 e P6 P5 P6 NetBurst Incluindo cache L2.

Subsistemas de memória

Sistemas Operacionais I

Aveiro, 28 de Abril de Arquitectura de Computadores II Ano lectivo 2003/2004 Nuno

Organização e Arquitetura de Computadores

Arquitetura de Computadores

Aula15: Reduzindo Miss Rate e Hit Time

Agenda Modos de Endereçamento.

Davi de Andrade Lima Castro RA:  A plataforma C6000: ◦ Ponto-fixo:  C62x  C64 / C64x+ ◦ Ponto-flutuante:  C67x / C67x+ ◦ Arquitetura VLIW:

Processamento de dados na UCP e memória UCP

Contextualização de Paralelismo em nível de instrução

ARQUITETURA DE COMPUTADORES II

Software Básico Nível ISA Capítulo 5 Mitsuo Takaki

Execução Especulativa

INTRODUÇÃO À COMPUTAÇÃO

Bruno C. Bourbon Jarbas J. de O. Júnior {bcb, cin.ufpe.br

Microprocesadores x Microcontroladores

Localidade Princípio da localidade è um programa acessa uma

Ch7b-1 Capítulo Sistemas de Memória - Memória Virtual.

Parte 3 Seção de Dados e Unidade de Controle

Conceitos Avançados de Arquitetura de Computadores Arquiteturas RISC Arquiteturas Superpipeline e Superescalares.

Slides before 1st Section Divider

1  1998 Morgan Kaufmann Publishers Paulo C. Centoducatte – MC542 - IC/Unicamp- 2006s Prof. Paulo Cesar Centoducatte

Arquitetura de Computadores Processadores 2 Waldemiro Arruda.

Arquitetura de Computadores

Arquitetura do ARM RISC (Reduced Instruction Set Computer) – Conjunto relativamente grande de registradores – Modelo “load/store “de processamento Operações.

Hierarquia de Memória – Parte 2 Prof. André Luis M. Silva

 Evolução constante das linguagens de programação de alto nível (LAN) desde o Fortran (primeira LAN)  Surgimento de novos paradigmas como a OO, Orientação.

Pearson Education Sistemas Operacionais Modernos – 2ª Edição 1 Sistemas Operacionais FATEC-PB Professor: Gustavo Wagner

Construção de Via de dados Trabalho Avaliativo do Primeiro Bimestre. Marcos André de Sena Silva.

Transcrição da apresentação:

Processador Intel Itanium

Visão Geral

Visão Geral

Caracteristicas Arquitetura EPIC - Explicit Parallel Instruction-Set Computer Processador de 64 bits Predication Execução Especulativa de Dados e Instruções Prediction ILP (Instruction Level Parallelism) - Pacotes de Instruções (Bundles)

Registradores Muitos registradores Propósito geral: 128 de 64 bits Ponto flutuante: 128 de 82 bits Registradores de predicado: 64 de 1 bit Registradores de branch: 8 de 64 bits RSE: Register Stack Engine Salvamento automático de determinados registradores Permite compartilhamento com outras funções

Diagrama de blocos do processador

Diagrama de blocos Processamento de instruções Prefetch, fetch, cache L1, branch prediction, geração de endereçamento, buffer de instruções, despacho de instruções, register renaming Execução Controle Alimentador de exceções, pipeline, SER Subsistema de memória Cache L2, Cache L3, TLB, ALAT, PIC

Sistema de memória Endereça 2^128 bytes!

Sistema de memória Cache L1: possui 2 unidades (1 para dados e a outra para instruções) de 16K cada Cache L2: unificada (armazena dados e intruções) Cache L3: idem à L2

Cache L1 L1I e L1D 4-way set-associative fisicamente indexadas para L1D: política de write through

Cache L2 Unificada 256 KB de espaço 8-way set-associative Linhas de cache com 128 bits Implementa o Write back

Cache L3 Unificada Tamanho variável: 1,5 MB até 3,0MB 12-way set-associative Linhas de cache de 128 bits

Sistema de memória Advanced Load Address Table (ALAT) Permite data speculation Translation Lookaside Buffers (TLB) Mapeamento entre endereços virtuais e físicos DTLB e ITLB DTLB L1 e DTBL L2 L1 gerencia Loads e acertos na Cache L1D L2 gerencia Stores e acertos nas Caches L2 e L3 Write Coalescing

Pipeline O pipeline do processador Itanium possui dez estágios:

Pipeline Nos 3 primeiros estágios ocorrem: Prefetch de instruções Fetch de 32 bytes em 1 ciclo de clock

Pipeline Brach Prediction O Itanium provê instruções para o fornecimento de branch hints Há também estruturas dentro do processador para esta função

Pipeline No quarto estágio do pipeline ocorre: Despacho de até 6 instruções para 9 portas de emissão. Bits de controle tipo Stop eliminam checagem de dependências

Pipeline No quinto estágio do pipeline ocorre: Register Renaming Transparente para o compilador Evita empilhar/desempilhar parâmetros

Pipeline No sexto e sétimo estágios do pipeline ocorrem: Busca de operandos "Delayed Stall" para dependências de registradores, o qual ajuda a evitar o esvaziamento do pipeline. Operand Latch Manipulation (OLM) captura retorno de dados dos operandos em latches, a fim de simular leitura de registradores.

Pipeline No oitavo estágio do pipeline ocorre: Resolução de predicados e cancelamento de execução de instruções cujo bit indicador de predicado tenha sido desligado. Todas as instruções cujo bit indicador de predicado ainda permaneça ligado, têm operandos lidos e executam na unidade funcional correspondente.

Pipeline Nos nono e décimo estágios do pipeline ocorrem: Execução de branches em paralelo, sendo que a especulação e predição dos branches resultam em clusters de branches.

Pipeline A execução de três branches por clock é realizada de forma otimizada para clusters de branches, permitindo compares/branches no mesmo grupo de emissão.

Tipos de instruções 6 tipos diferentes Cada um pode ser executado por 1 ou mais unidades de execução Cada formato possui diversas codificações diferentes OBS: instruções tem um formato fixo!!!

Tipos de instruções Lógica de execução 2 pacotes são lidos pelo processador por ciclo Cada pacote contém 3 instruções Instruções não utilizadas são gravadas em um buffer Pacote: cada instrução tem 41 bits 5 bits são utilizados como template, indicando a unidade de execução

Instrução Formato: [qp] opcode[.complementos] destino=fonte[,fonte] Paralelismo: o Itanium exige que o código assembly esteja separado em unidades independentes Especulação Exceções e resultados gerados em código que não deveria ser executado são descartadas

Performance?... Performance ainda ruim... falta um compilador bom problemas arquiteturais e de implementação Muito bom para muitas coisas ao mesmo tempo, mas ‘lento’ em cada uma delas.