Carlos Oberdan Rolim Ciência da Computação

Slides:



Advertisements
Apresentações semelhantes
Disponibilidade, tolerância a falhas e resiliência
Advertisements

Sistemas distribuídos Metas de Projeto Prof. Diovani Milhorim
Sistemas Distribuídos
Redes de Computadores Wandreson Luiz Brandino
Sistemas operacionais
Arquitetura de Sistemas Operacionais
Participantes do Processo de Desenvolvimento de Software
Sistemas Distribuídos:Definições e Caracteristicas
Confiança.
Microelectrónica Digital Ano lectivo Carlos Beltrán Almeida
Professor Sílder Lamas Vecchi
Tolerância a falhas Módulo 5 [C11,C15,T4.5] (65 p.)
Sistemas Críticos (Confiança)
Tópicos em Engenharia de Software II
Sistemas Operacionais
Avaliação de Sistemas Operacionais
Sistemas Distribuídos e Redes de Computadores
Avaliação de Desempenho Introdução Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas.
HW-SW codesign ou a solução errada para o problema certo CMP /II.
Tolerância a falhas em Sistemas Baseados em FPGAs Reconfiguráveis
Recovery Blocks Paulo Junior Penna Pivetta. Introdução Os Projetos de Tolerância a falhas quase que exclusivamente eram dedicado a hardware Tolerância.
Fabio Notare Martins Pontifícia Universidade Católica do Rio Grande do Sul Programa de Pós-Graduação em Ciências da Computação.
Segurança em Redes Elmar Melcher
1 Sistemas Distribuídos - SDI Caracterização de Sistemas Distribuídos. Introdução. Exemplos de Sistemas Distribuídos. Desafios.
Simple Network Management Protocol (SNMP)
TIPOS DE TESTES APLICÁVEIS E NÃO APLICÁVEIS AO PROJETO
TSDD Teste de segurança durante o desenvolvimento.
Sistemas Distribuídos
YADFS Yet Another Distributed File System
REDUNDÂNCIA POR SOFTWARE
(Reliability) UFRGS-GUARITA-FINEP Desenvolvido por: Pablo Diego Didoné
ENGENHARIA DE PRODUÇÃO Disc. : Gerência de Manutenção Prof
Linguagem de Programação IV
Tópicos em redes e sistemas distribuídos
Sistemas Distribuídos
Tópicos em redes e sistemas distribuídos Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Carlos Oberdan Rolim Ciência da Computação
Carlos Oberdan Rolim Ciência da Computação
Segurança e auditoria de sistemas
Carlos Oberdan Rolim Ciência da Computação
Projete produtos superiores com o COSMOS
Cluster Beowulf.
Tolerância a Falhas em Sistemas Distribuídos
Sistemas Distribuídos
Engenharia de Software
Sistemas Distribuídos Introdução. Conceito Coleção de múltiplos processos que executam sobre uma coleção de processadores autônomos interligados em uma.
Sistemas Distribuídos
BD Distribuído Conceitos Iniciais.
Sistemas Tolerantes a Falhas: Conceitos e Técnicas
Processos.
Testes de Software AULA 02 Eduardo Silvestri
O que é? É o processo de investigação técnica com intuito de identificar a qualidade, a segurança e a exatidão do software desenvolvido. A validação do.
Simulação distribuída e paralela Gabriel Baracuhy Thiago Martins.
Gestão de defeitos.
Testes de Software AULA 03 Eduardo Silvestri
Sistemas Distribuidos
Sistemas Tolerantes a Falhas: Conceitos e Técnicas
PROGRAMAÇÃO DISTRIBUÍDA Prof. Henrique Mongelli
Linguagem de Programação IV Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Tópicos em System-Level
Tolerância a Falhas Carlos Oberdan Rolim Ciência da Computação.
Engenharia de Sistemas Embarcados Aula 5: Um Conjunto Básico de Ferramentas.
Estrutura de Interconexão
Arquitetura de computadores
Sistemas Distribuídos Nadilma Nunes Aula Inicial – Apresentação da disciplina.
Emerson Felipe GOVERNO DO ESTADO DE PERNAMBUCO ESCOLA TÉCNICA ESTADUAL MARIA EDUARDA RAMOS DE BARROS.
1 Estimativa, Teste e Inspeção de Software Gerência de Projetos: Estimativa de Software Marcos Camada
Processos de Software Ludimila Monjardim Casagrande 1º Semestre Desenvolvimento e Qualidade.
Alunas: Ana Paula/ Beatriz / Gracielle / Márci Alunas: Ana Paula/ Beatriz / Gracielle / Márci a Professor Antônio.
Transcrição da apresentação:

Carlos Oberdan Rolim Ciência da Computação Tolerância a Falhas Carlos Oberdan Rolim Ciência da Computação

Conteúdo Conceitos básicos de segurança de funcionamento (dependabilidade). Aplicações de tolerância a falhas. Técnicas para incremento de confiabilidade e disponibilidade. Identificação e seleção de técnicas de projeto tolerante a falhas. Tolerância a falhas em sistemas distribuídos e arquiteturas paralelas. Medidas e ferramentas para avaliação e simulação de sistemas tolerantes a falhas. Arquiteturas de sistemas tolerantes a falhas.

Bibliografia Pradhan, D. K. “Fault-Tolerant System Design”. Englewood Cliffs:Prentice Hall, 1996. SIEWIOREK and SWARZ. “Reliable Computer Systems: Design and Evaluation”. Second Edition. Digital Press, 1992. JALOTE, P. “Fault Tolerance in Distribuited Systems”. Prentice-Hall. Englewood Cliffs, New Jersey, 1994. ANDERSON, T and LEE. P.A. *Fault Tolerance - Principles and Practice*. Second Edition. Springer-Verlag, 1990. Mullender, S. “Distributed Systems”. New York: Addison- Wesley, 1993.

Introdução Uso do computador diariamente em diversas atividades Sistemas robustos em relação a falhas eram preocupação exclusiva de projetistas de sistemas críticos Falhas são inevitáveis, mas as conseqüências das falhas, ou seja o colapso do sistema, a interrupção no fornecimento do serviço e a perda de dados, podem ser evitadas pelo uso adequado de técnicas viáveis e de fácil compreensão Para desenvolvedores de software, projetistas de hardware e gerentes de rede o domínio das técnicas de tolerância a falhas torna essencial na seleção de tecnologias, na especificação de sistemas e na incorporação de novas funcionalidades aos seus projetos

Introdução Problemas com sistemas de computação Necessidade de confiabilidade e disponibilidade Complexidade dos projetos  necessidade não somente de hardwares confiáveis mas também de softwares Desafios: Como evitar, detectar e contornar bugs no projeto de hardware e software? Como gerenciar a altíssima complexidade dos sistemas atuais de computação construídos com dezenas de chips de milhões de transistores e com software de centenas de milhares de linhas de código? Como explorar paralelismo para aumentar o desempenho sem comprometer a qualidade dos resultados mesmo em caso de falha de um ou mais componentes do sistema?

Introdução Desafios: Como aproveitar novas tecnologias mais rápidas, baratas e eficientes (mas ainda não totalmente provadas e testadas) sem saber ainda seu comportamento em situações inesperadas sob falha ou sobrecarga? Como aproveitar, para aplicações críticas e para operação em tempo real, o modelo de sistemas distribuídos construídos sobre plataformas não confiáveis de redes, contornando os problemas de perdas de mensagens, particionamento de rede e intrusão de hackers? Como desenvolver computadores móveis e sistemas embarcados, garantindo confiabilidade e segurança nesses dispositivos, e assegurando simultaneamente baixo consumo de potência, sem recorrer as técnicas usuais de replicação de componentes que aumentam peso e volume? Como conciliar alta confiabilidade e alta disponibilidade com as crescentes demandas por alto desempenho?

Problemas com sistemas de computação Conceitos não consolidados Painéis e discussões a respeito de nomenclatura comum para a área

Conceitos e Termologia Falha (fault): Causa Física ou algorítmica do erro; Erro: O sistema está em estado errôneo, se o processamento posterior a este estado levar a um defeito; Defeito (failure): Desvio da especificação; não podem ser tolerados, mas deve ser evitado que o sistema apresente defeito Interessante observar que uma falha não necessariamente leva a um erro (porção da memória pode nunca ser usada) e um erro não necessariamente conduz a um defeito (a informação de vôo lotado poderia eventualmente ser obtida a partir de outros dados redundantes da estrutura)

Conceitos e Termologia