AutoMan: Gerência Automática no OurGrid

Slides:



Advertisements
Apresentações semelhantes
Projeto Qualified Curriculum
Advertisements

Software Aging em uma Infraestrutura de Cloud Computing
Universidade do Vale do Paraíba Colégio Técnico Antônio Teixeira Fernandes Disciplina Ferramenta de Desenvolvimento Material IV-Bimestre Tratamento de.
Noções de Sistemas Operacionais
Agentes Inteligentes Agentes Inteligentes.
Sistemas Operacionais de Rede Professor: João Paulo de Brito Gonçalves
Prof. Dra. Maria Virginia Llatas
Gerenciamento do escopo do projeto
Gerenciamento de custos do projeto
11. Gerenciamento de riscos do projeto
Marfin sobre o Documentador;. Marfin sobre o Documentador;
Introdução à Informática
Avaliação da Qualidade em Operações de Serviços: uma análise comparativa entre as técnicas SERVQUAL e QUALISERV 17 Aluno: Marcos Rodrigues de Oliveira.
Informática Industrial
Agente Explorador do Mundo Wumpus By Ana Cristina, Ioram e Leonardo.
Avaliação de Desempenho
Administração Organizacional
Sistemas Operacionais
GERENCIAMENTO DE REDES
GERENCIAMENTO DE REDES
Gerência de Redes Áreas Funcionais de Gerenciamento
Alexandre Duarte Walfredo Cirne Francisco Brasileiro Patrícia Machado GridUnit: Using the Computational Grid to Speed up Software Testing Sessão de Ferramentas.
Projeto Final - APGS Adriana P. de Medeiros
Michel David da Costa Orientadora: Patrícia Kayser Vargas Mangan
Visão Geral do Desenvolvimento de Sistemas e Papéis no Desenvolvimento de Software Marcely Dias
1 Felipe L. Severino Geração de Cenários para Desktop Computing Felipe L. Severino paralela e.
1 Felipe L. SeverinoPOD XtremWeb Felipe L. Severino Programação com Objetos Distribuídos paralela e.
Classes e objetos Modelagem
Transparência Total! O Software Secullum TI.Net foi desenvolvido para facilitar o gerenciamento das informações que circulam nos computadores conectados.
AVAYA WEB SUPORTE Jan 07, Avaya Inc. All rights reserved.
Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.
APRESENTAÇÃO Está prevista a utilização de 6 aulas (6 blocos de 90 minutos) para o ensino do Subtema das Funções Quadráticas. Todas as aulas servirão.
Monitoramento de logs e registros de sistemas
Pós-Graduação em TI de A a Z
Sistemas Operacionais
GERENCIAMENTO DE AQUISIÇÕES PMBOK
Criação do Modelo Conceitual
Aluno: Mário Monteiro Orientador: Sérgio Soares 1.
MECÂNICA - ESTÁTICA Esforços Internos Cap. 7.
Cap 4 – Métricas do Processo e Projeto de Software
Cap 2 – Processo de Software
Implantação de um Centro de Processamento de Alto Desempenho sobre recursos não-dedicados Andamento das atividades Abmar Barros.
T r e i n a m e n t o Reparo em Aparelhos Celulares Multimarcas
Universidade São Marcos Curso: Gestão de Negócios Internacionais
PMBOK 5ª Edição Capítulo 5
PMBOK 5ª Edição Capítulo 7
Salas de Matemática.
Sistemas Operacionais
Extranet GRD – Guia de Remessa de Documentos
Planejamento e Implantação de rede: Escritório de Publicidade
Módulo: Gerenciamento de Incidentes e
Arquitetura de computadores
Arquitetura do Software
GERENCIAMENTO DE REDES UTILIZANDO O PROTOCOLO SNMP
Prof. Alexandre Vasconcelos
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Projeto de Banco de Dados
Aula 4: Áreas de Conhecimento em Gerenciamento de Projeto, Escopo
1 2 Observa ilustração. Cria um texto. Observa ilustração.
Universidade Federal de Pernambuco Centro de Informática Aluno: Erica Sousa – Orientador: Paulo Maciel – Modelagem de.
Capítulo 1 Introdução 1.1 O que é um sistema operacional
BD Distribuído Conceitos Iniciais.
Capítulo 8 Controle.
1 © Copyright 2014 EMC Corporation. Todos os direitos reservados. Armazenamento Definido por software Convergência. Escalabilidade.Desempenho.Elasticidade.
© 2004 by Pearson Education Computadores: Ferramentas para a Era da Informação Tema 0 PARTE A.
Nome alunos 1 Título UC. Título – slide 2 Conteúdo Conteúdo 2.
Introdução aos Protocolos de Roteamento Dinâmico
Fathom™ Management: Uma Lição de Eficiência Luis B. Campos System Engineer.
Qualidade de Software Aula 4
Apresentação Assuntos : Grids OurGrid
Transcrição da apresentação:

AutoMan: Gerência Automática no OurGrid Celso Brennand celso@ourgrid.org

Agenda Contexto: OurGrid e sua Gerência. Desafios de Gerência de Grades. Nossa proposta: AutoMan. Avaliação. Lições Aprendidas. Conclusões e Trabalhos Futuros.

Contexto: OurGrid Grade computacional entre-pares. Fácil Implantação. Inexistência de negociação para a entrada de novos pares. Recursos ociosos Poder computacional. Mecanismo de incentivo: Rede de Favores Não apresenta uma solução para gerência de seus componentes.

OurGrid CorePeer User Agent MyGrid Peer

Gerência do OurGrid Um Administrador Um ou vários sites. Checar todas as máquinas e serviços do(s) site(s). Reativar máquinas e serviços falhos.

Cenário de Gerência: Caso LSD Administradores só estão disponíveis em horário de expediente. Se a falha ocorrer à noite, feriado ou fim de semana?

Desafios da Gerência de Grades Demanda grande esforço Gerência de grades é muito ampla Recursos heterogêneos Domínios diferentes Escalablidade Alta disponibilidade Exige-se profissionais especializados para mantê-lo e que estejam sempre disponíveis.

Solução Proposta Mínimo de intervenção humana. Ajudar administradores. Tentar prover disponibilidade 24/7. Desenvolver uma arquitetura de gerência e monitoração automática que: 8

AutoMan Sistema de Monitoração e Gerência. Facilitar a gerência do OurGrid. Baseado nas atividades comuns de gerência dos administratores. Agentes AutoMan Monitores Agregador de dados ( Aggregator ) Analisador e atuador ( Leukocyte )

Monitores Sensores JMX Monitoração hierárquica Serviços ( instrumentação do código ) UserAgent CorePeer Peer Máquinas ( Ganglia ) Carga: CPU, memória. Espaço em disco. JMX Monitoração hierárquica

Aggregator Armazenamento Consulta Publish-subscribe

Leukocyte Diagnosticar ( Detector) Resolver ( Effector ) Analiza as métricas Resolver ( Effector ) Script – ssh Reativar um serviço Limpar /tmp Inscreve-se em certas métricas.

Arquitetura AutoMan Monitor percebe o Peer saiu do ar Envia uma métrica PeerDown para o Aggregator Arquitetura AutoMan Aggregator armazena a métrica e envia para os interessados JMX PeerDown RMI interessado (PeerDown) Interessados inscrevem-se nas métricas Agregador de dados Aggregator JMX PeerDown O Peer está ativo novamente!!! RMI interessado (PeerDown) Monitores Analisador e atuador Leukocyte JMX PeerDown ssh Ssh(PeerUp) Leukocyte analiza (Detector) a métrica recebida e toma uma ação (Effector)

Avaliação Experimental Medindo o Overhead do AutoMan Indisponibilidade dos serviços OurGrid com e sem o AutoMan

Medindo o Overhead do AutoMan Ferramenta que captura o tempo de execução de um Job. Ambiente controlado. OurGrid com e sem a monitoração. Método T-Test para verificar se a diferença é significativa. Overhead 1,86% em um intervalo de confiança de 95%.

Indisponibilidade dos serviços OurGrid com e sem o AutoMan Entidades avaliadas com e sem AutoMan: Peer, Worker e CorePeer. Indisponibilidade: Contornável: falhas do serviço. Inevitável: máquina é desligada ou está em um SO que o serviço não está instalado. Ferramenta que coleta os intervalos de indisponibilidade a partir dos logs do OurGrid e do Nagios.

Indisponibilidade dos serviços OurGrid com e sem o AutoMan Entidade Indisponibilidade Média Sem AutoMan ( unidade de tempo) Com AutoMan Worker 6.198 s ~2 horas 600 s = 10 min Peer 29.237 s ~8 horas 0 s CorePeer 4.719 s ~1h30 min 103 s ~2 min

Lições Aprendidas Cuidado com arquivos de configuração: É muito fácil introduzir erros nesses arquivos. Não assuma que o software que está sendo monitorado está livre de bugs. Gerência Automática não substitui totalmente a gerência manual. Mecanismos de recuperação devem ser escolhidos cuidadosamente.

Conclusões O AutoMan incorpora monitoração e gerência automática ao OurGrid sem introduzir perdas de desempenho consideráveis. Aumento da disponibilidade da grade OurGrid. Torna o OurGrid ainda mais amigável. Arquitetura que pode ser reutilizada em outros sistemas distribuídos.

Trabalhos Futuros Substituir o uso do SSH como mecanismo de recuperação para mecanismos como CDDLM ou SmartFrog. Substituir mecanismo de troca de menssagens JMX (RMI) para um orientado a arquitetura, JIC. Separar completamente o código de gerência (POA).

Projeto OurGrid UFCG/HP Projeto OurGrid LSD/UFCG/HP www.ourgrid.org Celso Brennand celso@ourgrid.org Obrigado!!!

AutoMan: Gerência Automática no OurGrid Celso Brennand Marco Spohn Alvaro Coelho Ayla Dantas Francisco Brasileiro Gustavo Pereira David Candeia Guilherme Germoglio Flavio Santos