Conceitos Avançados de Arquitetura de Computadores Arquiteturas RISC Arquiteturas Superpipeline e Superescalares.

Slides:

Advertisements

Apresentações semelhantes

Paralelismo em Máquinas Monoprocessadas

Advertisements

Organização e Arquitetura de Computadores I Introdução

Arquitetura de Computadores

Arquitetura e organização de computadores.

Arquitetura de Computadores

Aula 06: Introdução ao Pipelining, Hazards Estruturais e Forwarding

Introdução Arquitectura com unidade de controlo uniciclo.

Software Básico Silvio Fernandes

ARQUITETURAS RISC E CISC

Arquitetura de Sistemas Operacionais

MC542 Organização de Computadores Teoria e Prática

Processador Intel Itanium

Daniel M. Aquino, Marcelo C. Perez, Thais A. B. Fernandes

Processador Pentium 4 MO401 – Arquitetura de Computadores I

MO401 – Arquitetura de Computadores I

Arquiteturas Superescalares

Paralelismo em nível de instrução: Arquiteturas VLIW Grupo 01: Júlia Martinez Perdigueiro ra Tatiane Baggio Borili ra

Sistemas Operacionais

Aula 8 01/09/10 (Turmas 1 e 2) Profa. Sarita

SSC114 Arquitetura de Computadores Pipeline - Predição de desvios

SSC144 Arquitetura de Computadores Introdução

Estudo comparativo entre as arquiteturas Opteron e Itanium

Professor: Erivelto Tschoeke – UDESC/CEPLAN

Componentes do Computador e noções de Arquitetura de Computadores

Linguagens de Programação

Arquitetura de Sistemas Operacionais

Avaliação do desempenho

2- Entendendo o que é Arquitetura e Organização

Introdução à Programação

Prof. João Paulo de Toledo Gomes

História do Computador Desde os idos tempos da humanidade os seres humanos procuram relacionar quantidades. Supõe-se que as primeiras tentativas de contagens.

Prof.: Vagner Pinto Borges Prof.: Vagner Pinto Introdução à Arquitetura e Organização.

Sistemas Operacionais

Arquitetura de computadores

Organização de Computadores

Sistemas Operacionais

Sistemas Operacionais I

Capítulo 4 Nível da Microarquitetura

Arquitetura de computadores

VII Semana de Iniciação Científica do CBPF

Organização e Arquitetura de Computadores

Pet computação UFPE Aula de apoio aos feras: Arquitetura de Computadores.

Contextualização de Paralelismo em nível de instrução

INPE / CAP-315 Airam J. Preto, Celso L. Mendes Aula 5 (1) Análise de Dependência Tópicos: Restrições à Vetorização Detecção de Dependência Teste.

Prof. Remy Eskinazi - Microcontroladores

Arquitetura de Computadores

Unidade Central De Processamento: Processador

Computação L1: Infra-Estrutura Básica

Sistemas Operacionais

Paralelismo em Máquinas Monoprocessadas

UNIP - UNIVERSIDADE PAULISTA

Microprocesadores x Microcontroladores

Conceitos Avançados de Arquitetura de Computadores Arquiteturas RISC Reduced Instruction Set Computer 6.

Centro de Informática - UFPE

Bruno Iran Ferreira Maciel

Slides before 1st Section Divider

Arquitetura de Computadores Processadores 2 Waldemiro Arruda.

O que devem fazer os Microprocessadores ?

Elementos de Informática

Arquitetura de computadores

Por: Lucas da Silva Montes, Marcos Ghesla e Vinícius Randon.

Arquitetura de Sistemas Operacionais

ARQUITETURA DE VON NEUMANN

CURSO TÉCNICO DE INFORMÁTICA ESCOLA E. CASSIANO MENDES

 Evolução constante das linguagens de programação de alto nível (LAN) desde o Fortran (primeira LAN)  Surgimento de novos paradigmas como a OO, Orientação.

 Todo processador é constituído de circuitos capazes de realizar algumas operações primitivas:  Somar e subtrair  Mover um dado de um local de armazenamento.

Transcrição da apresentação:

Conceitos Avançados de Arquitetura de Computadores Arquiteturas RISC Arquiteturas Superpipeline e Superescalares

Melhorando a performance Como melhorar a performance de máquinas implementadas como pipeline? Aumentar o número de estágios do pipeline Superpipeline Replicar recursos para executar instruções em paralelo Superescalar

Melhorando a performance pipeline superpipeline superescalar

Melhorando a performance Superpipeline Limitações no tamanho do pipeline: 1) Hazards de dados: pipeline maior => mais paradas 2) Hazards de controle: pipeline maior => saltos mais lentos 3) Tempo dos registradores do pipeline: Limita o tempo mínimo por estágio (clock)

Melhorando a performance Superpipeline Número de Estágios X Aumento de performance 3 . 2 . 5 2 . Performance relativa 1 . 5 1 . . 5 . 1 2 4 8 1 6 Número de estágios

Processador superescalar Execução simultânea de instruções: aritméticas, loads, stores, etc Aplicável a máquinas RISC e CISC RISC: melhor uso efetivo CISC: implementação mais difícil

Processador Superescalar Busca e Decodificação Despacho: Em ordem Unidade de Reserva Unidade de Reserva Unidade de Reserva Unidade de Reserva Inteiro Inteiro Ponto Flutua. Load Store Execução: Fora de ordem Escrita: 1) Em ordem 2) Fora de ordem Escrita de Resultados

Processador Superescalar

Superescalar: Revisando Dependências de Dados - Dependência Verdadeira: Read-after-Write (RAW) - Dependência de Saída: Write-after-Write (WAW) - Antidependência: Write-after-Read (WAR)

Superescalar: Dependências WAR e WAW As CPUs comuns não apresentam estas dependências porque apenas um estágio do pipeline altera o estado da máquina (os registradores) na ordem em que as instruções são iniciadas.

Processador Superescalar

Superescalar: Dependências de Dados r3:= r0 + r5 (I1) r4:= r3 + 1 (I2) r3:= r5 + 1 (I3) r7:= r3 - r4 (I4) Dependência Verdadeira: (RAW) I2 e I1, I4 e I3, I4 e I2 Antidependência: (WAR) I3 não pode terminar antes de I2 iniciar Dependências de Saída: (WAW) I3 não pode terminar antes de I1

Dependências de Dados WAR e WAW: Como tratá-las 1) Inserir NOPs ou bolhas (igual RAW) 2) Inserir instruções independentes (igual RAW) 3) Renomeação de registradores

Superescalar: Renomeação de Registradores r3 := r3 + r5 r3b:= r3a + r5a r4:= r3 + 1 r4b:= r3b + 1 r3:= r5 +1  r3c:= r5a + 1 r7:= r3 - r4 r7a:= r3c - r4b Unidade de renomeação Regs Físicos Virtuais

VLIW (EPIC) Very Long Instruction Word O compilador descobre as instruções que podem ser executadas em paralelo e agrupa-as formando uma longa instrução que será despachada para a máquina

detecção de paralelismo Superescalar x VLIW detecção de paralelismo hardware compilador tempo disponível para realizar a detecção pouco muito relógio mais lento mais rápido arquitetura CISC RISC

Crusoe: www.transmeta.com Projetado para sistemas portáteis: Gerenciamento eficiente da potência (LongRun Power Management) Fornece o necessário de poder computacional Code Morphing Technology Compatibilidade com x86 Máquina VLIW

Crusoe LongRun Power Management Controle da Frequência e voltagem Potência=(Capacitância x Frequência x Voltagem2) /2

Crusoe Code Morphing Technology

Crusoe Code Morphing Technology Código do Code Morphing fica em ROM na CPU (inacessível para instruções x86) Traduz dinamicamente (interpreta) instruções x86 para VLIW do µP Acumula estatísticas de uso de sequências de instruções Traduz as sequências mais usadas para

Executa instruções x86 por meio de interpretador Crusoe Interpretador Executa instruções x86 por meio de interpretador

Crusoe Tradução on-the-fly Executa um misto de sequências previamente traduzidas e não-traduzidas

Crusoe Usando código traduzido Executa código previamente traduzido

CPUs com pipeline 8086 2 estágios 68000 3 estágios 286 4 estágios Alpha 21264 9 estágios 6 inst/clk out-of-order exec. 600MHz (1997) 15 milhões trans.

Power Pc 601

Pentium