Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne walfredo@dsc.ufcg.edu.br Elizeu Santos-Neto elizeu@dsc.ufcg.edu.br.

Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne Elizeu Santos-Neto Laboratório de Sistemas Distribuídos - LSD Universidade Federal de Campina Grande - UFCG

(fonte de serviços e recursos)
Grids Computacionais A metáfora da Rede Elétrica Grid Computacional (fonte de serviços e recursos)

Para que serve um Grid?

O Impacto de Grids VR Simul MegaCiclos Databank Inc. Embratel
Mastercard Embratel Grid Auditing

Histórico de Grids A idéia de Grid surgiu na comunidade de Computação de Alto Desempenho há pouco menos de 10 anos Agora os primeiros Grids para Alto Desempenho começam a entrar em produção Há 3 anos, o mainstream da computação percebeu a possibilidade de usar tecnologia Grid para transformar computação em serviço A tecnologia Grid está se fundindo com Web Services Grids para Alto Desempenho = Grids de Serviço + Serviço de Execução Remota

Agenda Histórico Grids de Serviços Grids para Alto Desempenho
Aspectos Fundamentais Grids para Alto Desempenho Desafios adicionais

Serviços Computacionais
Definição de Serviço Mercadoria imaterial provida por uma entidade legal para satisfazer as necessidades de outra entidade Arquiteturas Orientadas a Serviços (SOA) Já existiam tecnologias para SOA Ex.: CORBA, RMI, etc... Interoperabilidade é muito importante Padronização Fraco acoplamento Web Services

Grids de Serviços Infra-estrutura de Serviços sob Demanda
Características Heterogeneidade Dispersão Controle Distribuído Vários Domínios Administrativos Interoperabilidade Padronização

Aspectos Fundamentais
Descoberta de Serviços Autenticação e Autorização Auditoria de Serviços Composição de Serviços Incentivos para Disponibilização de Serviços Padronização

Descoberta de Serviços
Fundamental para Serviços sob Demanda Uma visão simples da arquitetura “Catálogo” publica consulta requisição resposta Cliente Provedor de Serviços

Descoberta de Serviços
Universal Description, Discovery and Integration (UDDI)

UDDI Baseado em padrões Tipos de buscas
HTTP, XML, XML Schema e SOAP Tipos de buscas Encontrar implementações que seguem uma dada interface Determinar os protocolos de segurança e transporte suportados por um dado serviço Por palavra chave Permite esquema publish/subscribe

MDS Monitoring and Discovery System Utilização Globus Toolkit 4 (MDS4)
Index Service Trigger Service Aggregator Service Utilização Escalonamento e seleção de réplicas Avaliar estado dos serviços Notificação sobre a situação de serviços e recursos Globus Toolkit 4 (MDS4)

Pesquisa em Descoberta de Serviços
Abordagem P2P WSPDS – Web Service P2P Discovery Service Baseado na especificação do protocolo Gnutella Provê busca semântica Semantic-annotated WSDL é tendência Não permite esquema de publish/subscribe Não provê um esquema semelhante ao Trigger Service

Autenticação e Autorização
Com vários domínios administrativos, como se dá a autenticação e autorização? Idealmente gostaríamos de ter um login único Segurança é um aspecto muito importante Algumas especificações WS-Security Mensagens SOAP assinadas e criptografadas WS-SecureConversation Contexto seguro para troca de mensagens WS-Policy Define políticas de uso do serviço

Globus GSI – Grid Security Infrastructure Transport-level security Privacidade no canal de comunicação Message-level security Proteção das mensagens SOAP Autenticação baseada em: Certificados X.509 / Login Autorização baseada em: grid-mapfile SAML – Security Association Markup Language

Mensagem Autorização SOAP SAML/gridmap gridmap Message Level X.509 Certificates Delegação Autenticação WS-Security WS-SecureContext X.509 WS-Trust X.509 login Proteção da TLS (a.k.a. SSL) Transport Level Login

Auditoria de Serviços Clientes e Provedores desejam garantias
SLA – Service Level Agreements (contrato) Falta de confiabilidade entre as partes Provedor pode não fornecer o serviço como prometido no contrato Cliente pode não cumprir o contrato de utilização do serviço Mecanismos de Auditoria Monitoração de Serviços e Clientes

Auditoria de Serviços O consumidor pode confirmar o cumprimento através de um inspetor

Auditoria de Serviços Ainda é necessário um auditor para tornar o processo de verificação completo A intervenção pode ser indesejada

Auditoria de Serviços Reduzindo a possibilidade de intervenção
Auditor pode sugerir mudanças Ex.: bloqueio na comunicação

Composição de Serviços
Construção de novos serviços através da agregação de funcionalidades Novos serviços baseados em serviços mais básicos Uma agência de turismo fornece o serviço de venda de pacotes de viagens compondo serviços de reserva em hotéis, locadora de carros, consulta em administradoras de cartões de crédito, etc...

Composição de Serviços
Vantagens Abstração da Complexidade Reutilização de funcionalidades Paradigmas de composição Orquestração Coreografia Linguagens para composição Definem um fluxo para integração de serviços XLANG, WSFL, BPEL BPEL = WSFL (IBM) + XLANG (Microsoft)

Algo mais sobre BPEL BPEL é baseada no paradigma de Orquestração
Exemplo de elementos da sintaxe <invoke>, <receive>, <reply>, <assign> <throw>, <wait>, <terminate> <sequence>, <flow>, <switch>, <while>, <pick>

Incentivando Participação
Um Grid é composto por vários sites, de domínios administrativos distintos Usuários querem garantias sobre seus serviços e recursos locais Usuários querem mais serviços e recursos além dos seus locais Como incentivar sites a disponibilizar serviços em um Grid?

Modelos Econômicos Alguns Modelos:
Commodity Market, Posted Price Market, Auction, etc Ex.: GRACE - GRid Architecture for Computational Economy Baseado em Posted Price Market Depende de uma infra-estrutura pesada: Moeda digital, bancos, etc... Nem todas aplicações precisam de garantias de QoS

OurGrid: Um Grid Best Effort
Será que todas aplicações exigem Qos? Será que é possível incentivar a criação de grids sem a motivação financeira? OurGrid: Uma Rede de Favores Usuários locais sempre têm prioridade nos recursos locais Recursos ociosos são doados para comunidade A grande questão é como fazer esta doação de forma justa

Evitando free riders É fundamental ter um mecanismo que incentive os participantes a doarem recursos ociosos Em sistemas como KaZaA, a maioria é free rider OurGrid usa um sistema de reputação peer-to- peer Todos os peers mantém um balanço local de todos os peers conhecidos Peers com maior balanço têm prioridade O comportamento emergente do sistema como um todo é “quanto mais você doa, mais você recebe” Isso funciona sem requerer infra-estrutura adicional

Rede de Favores [1] B 60 D 45 * * A D C E B * = sem recursos ociosos
cliente A ConsumerFavor ProviderFavorReport D * C * B E

Rede de Favores [2] B 60 D 45 E * * A D C E B * = sem recursos ociosos
* = sem recursos ociosos A * ConsumerQuery D ProviderWorkRequest * cliente C cliente B E

E o free rider? Epsilon é a fração dos recursos consumida por free riders

Equidade entre colaboradores

Padronização Open Grid Services Architecture – OGSA
Define padrões arquiteturais e requisitos para a infra-estrutura OGSA = O que? Open Grid Services Infrastructure – OGSI Define o comportamento e relacionamento dos componentes da arquitetura OGSI = Como? Globus Toolkit 3 Alinhamento com Web Services Web Service Resource Framework - WSRF

WSRF Stateless ou Stateful OGSI define: WSRF evoluiu de OGSI
Stateful Web Services = Grid Services WSRF evoluiu de OGSI Stateful Web Services = Web Service + Stateful Resources Introdução do conceito WS Resource Quem possui estado agora é um “Recurso” controlado pelo Serviço Padronização no gerenciamento de estados Recurso tem uma conotação diferente daquela usada pela comunidade de Alto Desempenho, o que torna esta discussão um pouco confusa

Esclarecendo... Apache HTTP Server Microsoft IIS TomCat WebSphere
Application Server SOAP Engine Web Service End Point Reference Apache Axis Apache Addressing WS-Addresing Apache Apollo Globus Toolkit 4 Apache Hermes WSRF WS-Notification WSDM Apache Muse

Agenda Histórico Grids de Serviços Grids para Alto Desempenho
Aspectos Fundamentais Grids para Alto Desempenho Desafios Adicionais

Grids para Alto Desempenho
Grids surgiram como plataformas de execução de aplicações paralelas São os grids para alto desempenho Grids para alto desempenho necessitam do serviço de execução remota Maior flexibilidade Serviço pode ser convertido em qualquer outro Maior complexidade Segurança Escalonamento

Plataformas de Execução de Aplicações Paralelas
SMPs acoplamento MPPs NOWs Grids distribuição

SMP: Symmetric MultiProcessor
Memória CPU CPU ... CPU

MPP: Massive Parallel Processor
CPU Mem. ... Escalonador requisições

NoW: Network of Workstations
requisições requisições requisições CPU CPU CPU ... Mem. Mem. Mem.

Grids CPU CPU CPU ... Mem. Mem. Mem. Internet

Características das Plataformas de Execução
SMPs MPPs NOWs Grids Conectividade excelente muito boa boa média/ruim Heterogeneidade nula baixa média alta Compartilhado não sim Imagem única comum múltipla Escala 10 1.000

Grids podem diferir bastante
TeraGrid 4 centros de supercomputação norte-americanos Cada centro com milhares de processadores dedicados ao TeraGrid Canais de altíssima velocidade (40 GBits/s) Poder agregado de 13,6 TeraFlops Ciclos ociosos de 3.6 milhões de processadores espalhados em 224 países Computa em média a uma velocidade de 14 Teraflops

Desafios Adicionais em Grids para Alto Desempenho
Execução Remota e Identidade Local Imagem do Sistema Proteção dos Recursos e das Aplicações Escalonamento

Globus GRAM e GSI Mapeamento seguro da identificação GSI global para um userid local Global: C=US, O=University of California San Diego, OU=Grid Computing Lab, CN=Walfredo Cirne Local: walfredo (em thing1), u15595 (em bh) Submissão e controle de tarefas via GRAM Independência do escalonador de recurso Proxy para delegação de autenticação

Globus GRAM e GSI

Imagem do Sistema Imagem do sistema são as abstrações que nos permite lidar com um sistema computacional Arquivo, diretório, processo, usuário, grupo, etc Com vários domínios administrativos, a imagem do sistema é heterogênea Complica tremendamente o uso do Grid Soluções Imagem do sistema implementada a nível de usuário [exemplo: Condor] Novas abstrações para se lidar com o Grid [exemplo: MyGrid]

Redirecionamento de System Calls do Condor

Abstrações OurGrid Máquina base  máquina do grid
Tarefa = inicial + remota + final inicial e final rodam na máquina do grid remota roda na máquina do grid Armazenamento Playpen Storage Transferência de arquivos/Espelhamento

Fatorando com OurGrid task: init: put ./Fat.class $PLAYPEN remote: java Fat output-$TASK final: get $PLAYPEN/output-$TASK results task: init: put ./Fat.class $PLAYPEN remote: java Fat output-$TASK final: get $PLAYPEN/output-$TASK results task: init: put ./Fat.class $PLAYPEN remote: java Fat output-$TASK final: get $PLAYPEN/output-$TASK results ....

Segurança Autenticação e Autorização Proteção do Recurso
Requisito de qualquer grid, porém insuficiente quando há execução remota Proteção do Recurso Recurso roda código de terceiros Proteção da Aplicação Aplicação roda em recurso de terceiros Privacidade dos Dados Dado é processado em recurso de terceiros Problema muito complexo!!

Proteção ao Recurso Política por aplicação através de interceptação de system call Fácil de instalar, suporta qualquer linguagem, difícil de configurar para garantir segurança Virtualização específica: Java Fácil de instalar, suporta linguagem específica, fácil de configurar Virtualização geral: VMWare, Virtual PC, Xen Difícil de instalar (especialmente Xen), suporta qualquer linguagem, fácil de configurar

GridBox: Interceptação de System Call
Interceptação pela substituição de shared libraries Define política de acesso por aplicação #Allow read-write access #to "input.txt"and "output.txt" rule fopen allow input.txt rule fopen allow output.txt #Allow read-only access to #/etc/hosts file rule fopen readonly /etc/hosts #Disable all other accesses rule fopen deny * #Limit maximum file size limit FILE_SIZE #Allow connections to trusted machines rule connect allow :80 rule connect allow :80 rule connect allow :80 #Allow SSH connection rule connect allow :22 #Disallow any other connection rule connect deny *:*

SWAN: Segurança no OurGrid
Aplicações Bag-of-Tasks só precisarem se comunicar para receber a entrada e devolver a saída Isto é feito pelo próprio OurGrid A tarefa remota roda dentro de uma máquina virtual Xen, sem acesso a rede, e com acesso a disco limitado “por hardware” a uma partição especifica

Uma segunda linha de defesa
Nós podemos também reiniciamos a máquina para adicionar uma segunda linha de defesa Isto também tem a vantagem extra de possibilitar o uso de um SO diferente Ou seja, mesmo que a máquina seja Windows, nós ainda podemos ter Linux Retornar ao Windows é muito rápido graças a hibernação

Arquitetura SWAN

Escalonamento de Aplicação
Não é possível ter um escalonador controlando o Grid Tamanho e dispersão Múltiplos domínios administrativos Escalonadores de recurso Controlam alguns recursos no Grid Escalonadores de aplicação Escolhem quais recursos usar Particionam o trabalho da aplicação

Escalonamento de Aplicação
Escalonador de Aplicação Escalonador de Recurso

Escalonador de Aplicação
Necessita de informações sobre o Grid Sistemas de monitoramento: NWS, Remos Informações de monitoração são usadas em previsões de performance Necessita de um modelo de performance da aplicação Portanto, funciona apenas para uma classe de aplicações

Distribuição de Trabalho Jacobi para um MPP

Jacobi AppLeS Escalonador pioneiro para Jacobi 2D
Escolhe quais processadores usar Distribui o trabalho entre os processadores escolhidos Usa predições NWS Usa um modelo de performance de Jacobi Ti = Ai  Pi + Ci, onde: Ti é o tempo para o processador i executar uma iteração Ai é a área da submatriz alocada ao processador i Pi é o tempo que o processador i leva para computar um elemento Ci é o tempo que o processador i leva para comunicar suas fronteiras

Distribuição de Trabalho AppLeS Jacobi

Work Queue with Replication
Solução de escalonamento para aplicações Bag of Tasks Não depende de informação sobre o Grid ou sobre as tarefas Envia uma tarefa para cada máquina disponível Quando não há mais tarefas para enviar, as ainda em execução são replicadas Eficiente, mas desperdiça ciclos Escalonador do OurGrid

Desempenho do WRQ

Desperdício do WQR

Escalonando Aplicações Intensivas em Dados
WQR obtém bom desempenho para aplicações intensivas em CPU Todavia, várias aplicações BoT importantes são também intensivas em dados Grandes volumes de dados são hoje a grande razão para processamento de alto desempenho Storage Affinity usa replicação e informação estática (a localização dos arquivos) no escalonamento de aplicações intensivas em dados Storage Affinity X-Suffrage WQR Média (segundos) 57.046 59.523 Desvio Padrão 39.605 30.213

Usando o Grid contra a AIDS
prevalent in Africa O prevalent in Europe and Americas ? HIV-1 N majority in the world M HIV-2 A B C D F G H J K 18% in Brazil B,c,F

HIV protease + Ritonavir
Subtype F Subtype B

OurGrid da luta contra AIDS
55 máquinas em 6 sites no Brasil e EUA Tarefa = 3.3 MB entrada, 1 MB saída, 4 a 33 minutos de execução dedicada Rodou 60 tarefas em 38 minutos Speed-up = 29.2 (com 55 máquinas)

Conclusões e Tendências
Grids de Alta Performance estão se consolidando Grids de Serviços fazem parte do futuro da computação distribuída Interoperabilidade e Padronização são palavras de ordem WSRF e padrões correlatos tendem a se tornar um padrão de fato

Algumas Referências http://www.ourgrid.org http://www.globus.org

Muito Obrigado! Slides em e

Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne walfredo@dsc.ufcg.edu.br Elizeu Santos-Neto elizeu@dsc.ufcg.edu.br.

Apresentações semelhantes

Apresentação em tema: "Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne walfredo@dsc.ufcg.edu.br Elizeu Santos-Neto elizeu@dsc.ufcg.edu.br."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne walfredo@dsc.ufcg.edu.br Elizeu Santos-Neto elizeu@dsc.ufcg.edu.br.

Apresentações semelhantes

Apresentação em tema: "Grids Computacionais: Da Computação de Alto Desempenho a Serviços sob Demanda Walfredo Cirne walfredo@dsc.ufcg.edu.br Elizeu Santos-Neto elizeu@dsc.ufcg.edu.br."— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback