Intel Pentium 4 Giovanni Rizzo de Paiva - RA Matheus Tasso Perugini - RA Rafael Rodrigues Dias - RA MC722 - Projeto de Sistemas Computacionais
Visao Geral Micro-Arquitetura Netburst Atinge altas frequencias de clock, em detrimento do valor do IPC e de alto gasto energetico. Nao atingiu o objetivo de 10GHz
Caracteristicas Pipeline com muitos estagios Alteracao da localizacao do cache L1 ( Trace Cache ) Anterior `a unidade de busca para posterior `a unidade de decodificacao Decodificador CISC-RISC Transforma instrucoes CISC em micro- instrucoes RISC
Caracteristicas - (continuacao) Hyper-Threading Emula um sistema multiprocessado Tecnologia SpeedStep Eficiencia energetica – reduz processamento eXecute Disable bit Controle contra ataques mal intencionados Memoria extendida 64 bits Tecnologia EM64T
Pipelines Pipeline é uma lista de todos os estágios que uma dada instrução precisa percorrer dentro do processador para ser executada. [1] Cria paralelismo com as microinstrucoes Pipelines de 20 estagios 31 estagios para Prescott
Pipelines - (continuacao) Maior o numero de estagios – maior a frequencia de operacao Em um mesmo clock, um Pentium III pode obter um desempenho melhor que um Pentium 4, dado o tamanho de seu Pipeline.
Pipelines - Contras Custo e complexidade elevados Tamanho fisico do processador Instrucoes complexas O desvio atrapalha o Pipelining Desvios Condicionais Processamento inutil
Previsao de Desvio Determina se um desvio condicional vai ser acionado na lista de instrucoes Existencia de muitos loopings Buffer de instrucoes Um buffer de previsão de desvios é uma pequena memória indexada pela parte menos significativa do endereço da instrução de desvio. [1]. Nao e` necessario buscar na memoria principal Buffer para 100 instrucoes
Previsao de Desvio - (cont...) Pentium 4: Static Branch Predictor – Previsao estatica de desvio Assume-se que o desvio e' feito para tras Trace Cache Armazena microinstrucoes ja decodificadas
Cache de instrucoes A Trace Cache Armazena microinstrucoes ja decodificadas e nao instrucoes a serem carregadas pela unidade de busca Muito util em estruturas de repeticao BTB de 512 entradas
Hyper-Threading O que e' hyper-threading ? tecnologia multi-thread Como e' alcancada? Duplica-se o hardware necessario por guardar o estado de um processo
Hyper-Threading - (cont...) Cada unidade logica possui Seu proprio controlador de interrupcoes e conjunto de registradores Compartilham: cache de memoria, unidade de execucao, unidade logica e aritmetica, de ponto flutuante e barramentos
Hyper-Threading - (cont...) Intel alega 30% de aumento na eficiencia. Esquematico:
Termal Throttling Controle de risco – superaquecimento Diminui o processamento Possui duas classes: TM1 – cria delay TM2 – diminui o multiplicador de clock Dificuldade de detectar o acionamento do recurso. Lentidao.
Pentium 4 – 64 Bits Enderecamento de 64 Bits Sem a tecnologia EM64T, o Pentium endereca 4GB de memoria. Com ela, 32TB de RAM. Limitacao: chipset da placa mae Apontadores de 64 Bits Registradores de 64 Bits
Pentium 4 – 64 Bits Registrador 64 Bits Necessita um SO compativel Ultimos SuSE, Ubuntu.
Comparacao AMD x P4 ProcessadorClock InternoClock ExternoDados por ClockCache L1Cache L2Soquete Pentium Ghz133 MHz 416 KB512 KB478 Athlon XP Ghz 166 MHz2128 KB256 KB462
Comparacao AMD x P4 Pentium Athlon XP Clock Interno 2.66Ghz 2.1Ghz Clock Externo 133MHz 166 Mhz Cache L1 16KB 128KB Cache L2 512KB 256KB Soquete Utilizando os benchmarks Sandra, Aida, SuperPI e PC Mark
Intel Pentium Ghz:
Athlon XP 2700 (2100 Mhz)
Conclusao A Microarquitetura NetBurst – fracasso tecnologico Intel ressussita caracteristicas do P6, com pipelines nao tao extensos, e clock nao tao alto. Aumento na frequencia de operacao nao acarreta em aumento de potencia/desempenho
Conclusao Comparacao com AMD Preco elevado Alta necessidade energetica Superaquecimento Desempenho nao impressionou Mostra-se uma equivalencia nos benchmarks
Fim Obrigado. Duvidas ? Giovanni Rizzo de Paiva - Ra Matheus Tasso Perugini - Ra Rafael Rodrigues Dias - Ra Grupo 04