SAPOTI SERVIDORES DE APLICAÇÕES CONFIÁVEIS TCP/IP Autores: Egon Hilgenstieler – Emerson F. F. Carara – Roverli Pereira Ziwich – Orientador: Prof. Elias Procópio Duarte Jr. Bacharelado em Ciência da Computação UFPR
Roteiro Diagnóstico & Protocolo SNMP A ferramenta SAPOTI Resultados Experimentais Conclusão
Introdução As organizações dependem do bom funcionamento de suas redes Em muitos casos é necessário que a disponibilidade seja garantida Servidores de aplicações TCP/IP São componentes críticos para o bom funcionamento da rede Diagnóstico como infra-estrutura para a implementação de servidores de aplicações confiáveis
Diagnóstico & Protocolo SNMP Diagnóstico em Nível de Sistema Componentes sem-falha do sistema determinem quais componentes estão falhos e quais estão sem-falha Diagnóstico Hierárquico Distribuído Os próprios nodos que realizam os testes fazem o diagnóstico do sistema Um algoritmo hierárquico adaptativos e distribuídos de diagnóstico em nível de sistema Hi-ADSD with Timestamps O Protocolo SNMP Padrão de gerência de redes da Internet Base de Informações Gerenciáveis (MIB)
A Ferramenta SAPOTI Servidores de Aplicações cOnfiáveis Tcp/Ip Ferramenta que garante a alta disponibilidade de servidores TCP/IP Em particular um servidor Web Atua de forma distribuída em uma rede Rede monitorada pelo algoritmo Hi-ADSD with Timestamps Através das informações de diagnóstico geradas pelo algoritmo Esquema de prioridades – Identificadores Sequenciais A ferramenta disponibiliza o servidor Web na máquina sem-falha de maior prioridade da rede caso exista ao menos uma
A Ferramenta SAPOTI A estratégia é executar o algoritmo como um daemon em cada máquina da rede O algoritmo verifica qual máquina está disponibilizando o servidor Web (Apache), inclusive ela própria É utilizado um endereço IP virtual associado ao servidor Web Todas as informações são obtidas através da MIB local A replicação do conteúdo disponibilizado pelo servidor Web É feita através do RSYNC
Ferramenta SAPOTI Inicialização do servidor Web após a falha da máquina que disponibilizava o serviço.
Interface Interface genérica para a infra estrutura de diagnóstico baseado no algoritmo Hi-ADSD with Timestamps A cada acesso as informações são obtidas da MIB Ponto de Gêrencia da Rede É possível alterar o testador do qual se lê a MIB a qualquer momento
Interface
Resultados Experimentais Realização de dois experimentos Período de observação de cerca de 12 horas Injeção de falhas No primeiro experimento escalonamento de falhas frequentes ocasiona inclusive a falha simultânea de todas as máquinas No segundo experimento algumas máquinas falham frequentemente havia a garantia de sempre uma máquina não estar falha Todas as máquinas estavam aptas a disponibilizar o servidor Web Apache Dados eram coletados de 5 em 5 segundos
Primeiro Experimento Tempo, Injeção de Falhas Puma minutos no ar 10 minutos fora do ar Kenny minutos no ar 9 minutos fora do ar Stan minutos no ar 7 minutos fora do ar- Kyle minutos no ar 6 minutos fora do ar Cartman minutos no ar 5 minutos fora do ar Lenoc minutos no ar 4 minutos fora do ar Tempo de 12 horas e 23 minutos
Primeiro Experimento Resultados Máquinas falharam 218 vezes Servidor Web trocou de máquina 177 vezes
Média ponderada recuperação de 16,4 segundos
Primeiro Experimento Resultados Disponibilidade de 97,35% - Indisponibilidade de 2,65% Das 12 horas e 23 minutos a indisponibilidade não passou de 20 minutos
Segundo Experimento Tempo, Injeção de Falhas Puma minutos no ar 40 minutos fora do ar Kenny minutos no ar 20 minutos fora do ar Stan - 03 Sempre no ar Kyle - 04 Sempre no ar Cartman - 05 Sempre no ar Tempo de 12 horas e 40 minutos
Máquinas falharam 27 vezes Média ponderada recuperação de 14,0 segundos
Segundo Experimento Resultados Disponibilidade de 99,59% - Indisponibilidade de 0,41% Das 12 horas e 40 minutos a indisponibilidade não passou de 4 minutos
Conclusão SAPOTI Atua em uma rede Monitorada pelo algoritmo Hi-ADSD with Timestamps Uma estratégia distribuída Garante a alta disponibilidade de servidores Web Interface Web Visualizar as informações de diagnóstico da rede Resultados Primeiro experimento 12hs 23mins – Ocorreram 218 falhas – 6 máquinas Disponibilidade de 97,35% - Indisponibilidade não passou de 20 minutos Segundo Experimento 12hs 40mins – Ocorreram 27 falhas – 5 máquinas Disponibilidade de 99,59% - Indisponibilidade não passou de 4 minutos Trabalhos Futuros A criação de um framework baseado em diagnóstico para a construção de aplicações distribuídas genéricas com alta disponibilidade