Soft Errors in Advanced Computer Systems Robert Baumann (IEEE Design & Test of Computers, May-June 2005)

Slides:



Advertisements
Apresentações semelhantes
Detectores de partículas: alguns conceitos
Advertisements

Sistemas Fortemente Correlacionados
Transmissão de pacotes
Sistemas distribuídos Metas de Projeto Prof. Diovani Milhorim
Redes de Computadores Wandreson Luiz Brandino
Fundamentos de Electrónica
UNIVERSIDADE FEDERAL DE SANTA MARIA Laboratório de Biomecânica
Barramentos Introdução.
Fundamentos de Electrónica
GERADOR SÍNCRONO Geradores síncronos ou alternadores são máquinas síncronas usadas para converter potência mecânica em potência elétrica ASPECTOS CONSTRUTIVOS.
Tabela Periódica Moderna
FIDEDIGNIDADE Universidade Católica de Goiás Departamento de Psicologia Psicometria Profª. Ms. Juliany Gonçalves Guimarães.
Deadlocks - Impasses 3.1. Recurso 3.2. Introdução aos deadlocks
12 Modelos doTransistor MOS Concepção de Circuitos Integrados
SSC SISTEMAS OPERACIONAIS I Aulas 6 – Escalonamento de Processos
Maria Aparecida Castro Livi
Fabio Notare Martins Pontifícia Universidade Católica do Rio Grande do Sul Programa de Pós-Graduação em Ciências da Computação.
Silberschatz and Galvin Operating System Concepts Unidade 1: Introdução O que é um sistema operacional? Systemas simples em lote (batch) Sistemas.
CAPACITOR MOS COM SUBSTRATO TIPO-P
Efeitos em dispositivos de pequenas dimensões.
Carlos Edson Flávio Jorge Luciano Rafael Welinton
Carlos Edson Flávio Jorge Luciano Rafael Welinton
Professor Victor Sotero
Gerência de Redes Áreas Funcionais de Gerenciamento
Ambiente de simulação Os algoritmos previamente discutidos foram analisados usando um simulador de mobilidade. Ele modela uma cidade de 20 Km de raio,
Universidade do Vale do Rio dos Sinos - São Leopoldo -
Sistemas Operacionais I
YADFS Yet Another Distributed File System
Controle Automático de Geração (Regulação Secundária) - I
Cap 4 – Métricas do Processo e Projeto de Software
Sistemas Distribuídos
Carlos Oberdan Rolim Ciência da Computação
Carlos Oberdan Rolim Ciência da Computação
Carlos Oberdan Rolim Ciência da Computação
Configurações básicas TJB - revisão
TRANSFORMADORES.
Sistemas Operacionais
Carlos Oberdan Rolim Ciência da Computação
Semicondutores e as suas Aplicações
Arquitetura de computadores
Tolerância a Falhas em Sistemas Distribuídos
1.
1 Pacotes, Quadros e Detecção de Erros Nathalie e Renan Copyright 2002 ©
Sistemas Operacionais
Confiabilidade - Árvore de Falhas
Radiação e Seus Riscos à Saúde no Ambiente de Trabalho
Introdução à Engenharia de Produção
Hardware : Memórias Instrutor : Marcos
Fontes de Erros Aula 1 Introdução; Erros em processos numéricos;
Sistemas Tolerantes a Falhas: Conceitos e Técnicas
Testes de Software AULA 02 Eduardo Silvestri
EPR16 – Planejamento e Gestão da Qualidade Professora Michelle Luz
Introdução à Radiação Eletromagnética
Fontes Ricardo Costa 12ºL Nº 10.
Testes de Software AULA 03 Eduardo Silvestri
TEORIA DOS SEMICONDUTORES
Oscar Takeshi Omar Mogames Vitor Gomes
Subsistema de Entrada e Saída do Kernel
Tolerância a Falhas Carlos Oberdan Rolim Ciência da Computação.
RESISTORES EM PARALELO
Memória.
Função produção.
Hardware de Rede Aula 2 Willamys Araújo.
Germano Maioli Penello
SERVIDORES E SERVIÇOS Leandro Escobar 2009 SERVIDORES E SERVIÇOS.
Memórias Faculdade de Ciências Aplicadas e Sociais de Petrolina - FACAPE Ciência da Computação Professora: Cynara Carvalho
MEMÓRIA (INFORMÁTICA)
INDUÇÃO MAGNÉTICA Faraday, baseando-se nos trabalhos de Oersted ( ) e Ampère, em meados de 1831, começou a investigar o efeito inverso do fenômeno.
Germano Maioli Penello
Condicionamento de Energia
Transcrição da apresentação:

Soft Errors in Advanced Computer Systems Robert Baumann (IEEE Design & Test of Computers, May-June 2005)

2 Introdução Aumento da integração, aumento da sensibilidade dos dispositivos Fenômenos observados por duas décadas: Partículas-alfa: U e To Nêutrons de alta energia: radiação cósmica Interação nêutrons de baixa energia: 10 B (borophosphosilicate glass – BPSG) Erros não esperados em tecnologias >65ηm

3 Geração de cargas A magnitude da perturbação de um íon depende de sua Linear Transfer Energy (LET), medida em [MeVcm²/mg] – depende da massa e da energia da partícula e do material pelo qual ela está passando Em um substrato de Si, cada 3.6 eV de energia produz um par elétron-buraco

4 LET x Distância

5 Geração de cargas Quão mais longe da junção NP, menor a carga coletada (Q coll ) e menor a chance de causar um erro Hoje nodos não isolados – mar de nodos, próximos uns dos outros causam o compartilhamento das cargas e ação bipolar parasita entre as junções Pode influenciar o montante Q coll, além do tamanho e localização de erros de V e I

6 Magnitude de Q coll Depende de: tamanho do dispositivo biasing dos nodos do circuito estrutura do substrato dopagem tipo do íon (energia, trajetória e ocorrência) estado do dispositivo Mas, Q coll é a metade da história...

7 Magnitude de Q coll Sensibilidade depende dos seguintes fatores: capacitância dos nodos tensão de operação resistência dos transistores Todos estes fatores influenciam Q crit : montante de carga necessário para disparar e alterar um estado de um nodo

8 Magnitude de Q crit A resposta do dispositivo à injeção de cargas é dinâmica e depende da magnitude do pulso de radiação e de características temporais Por isso, o efeito é difícil de ser modelado para a determinação de Q crit, que não é constante Q coll >> Q crit : soft error induzido Q coll < Q crit : soft error não ocorre

9 Soft Error Rate – SER Medida para determinar a taxa de existência de erros ocorridos num dado dispositivo Failure in Time – FIT: um erro a cada 10 9 horas de operação Grande preocupação quando não corrigidos: a taxa de erros supera as características de mecanismos confiáveis

10 Memory SER DRAM bit SER diminuiu cerca de 1000x em 7 gerações, mas DRAM system SER permanece + ou - constante SRAM bit SER e SRAM system SER diminuíram pelo não-uso do BPSG aumento da densidade de SRAM: a saturação SRAM bit SER não traduz em SRAM system SER

11 Memory SER

12 Mitigating Soft Errors Duas causas de soft errors são facilmente contornáveis: Partículas-alfa: purificando o processo Interação nêutrons de baixa energia: evitando o uso do BPSG Porém, uma causa não é contornável: Nêutrons de alta energia: radiação cósmica sempre há em qualquer lugar Esta última, é determinante do SER

13 Suavização de erros Modificações no processo e ajustes na tecnologia disponível: isolamento por poços e guard rings; processos caros Simplificações no projeto ou ajustes do layout: aumentar Q crit sem alterar Q coll ; aumento do atraso e área utilizada Detecção e correção de erros: paridade e SEC/DED; alta complexidade e latência introduzida

14 Suavização de erros Design and layout tricks: redundância e votador; custo de área pode ser contornado com um votador multiplexado no tempo Redundância de todo o sistema: replicação completa, execução em paralelo; reinício da execução ou votador (+ caro, mas a taxa de erros cai a praticamente zero)

15 Perspectivas 1 FIT = 1 erro por bilhão de horas de operação 50k FIT para SRAM de alguns Mb (estimado) 1 erro a cada dois anos de operação A quantidade de erros cresce conforme a quantidade de chips no sistema O nível aceitável de erros para atender as expectativas de confiabilidade do consumidor depende muito mais da aplicação final que dos componentes utilizados nos dispositivos