A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Grid Computing DCC/FCUP Inês Dutra sala: 1.47

Apresentações semelhantes


Apresentação em tema: "Grid Computing DCC/FCUP Inês Dutra sala: 1.47"— Transcrição da apresentação:

1 Grid Computing DCC/FCUP Inês Dutra sala: 1.47

2 DCC/FCUP Grid Computing2 Organização da disciplina url: Ementa: grids computacionais e grids de dados: implementação e utilização Avaliação: 1 exame e 1 trabalho Bibliografia: Grid Computing: Making the Global Infrastructure a Reality, F. Berman, G. C. Fox and A. J. G. Hey editors, Wiley, 2003, ISBN The Grid 2: Blueprint for a New Computing Infrastructure (The Elsevier Series in Grid Computing) by Ian Foster and Carl Kesselman (Hardcover - Nov 18, 2003) Artigos diversos (vão estar na página do curso)

3 DCC/FCUP Grid Computing3 O que é um cluster? De forma geral, é um aglomerado de máquinas conectadas em uma rede local ou dedicadas NOWs (Network of Workstations) algumas vezes não são consideradas clusters No nosso contexto, consideraremos cluster como qq aglomerado de máquinas em rede local com serviços básicos de rede (ssh, nfs etc)

4 DCC/FCUP Grid Computing4 Clusters Nível de usuário: políticas de utilização gerenciadores de recursos interface com o usuário Nível de administração: gerência de hardware gerência de software

5 DCC/FCUP Grid Computing5 O que é um grid? Um conjunto de clusters? Mais do que isso: Organização virtual que permite a aglomeração de recursos que estão distantes geograficamente Recursos podem ser: máquinas, dados, instrumentos etc

6 DCC/FCUP Grid Computing6 Grids Nível de usuário: políticas de utilização gerenciadores de recursos locais Gerenciadores de recursos globais Monitoração Autenticação Certificação interface com o usuário Nível de administração (local e global): gerência de hardware gerência de software

7 DCC/FCUP Grid Computing7 Diffs

8 DCC/FCUP Grid Computing8 Por que Grid? Várias razões: Científicas Políticas Econômicas Sociais

9 DCC/FCUP Grid Computing9 Plataformas de computação paralela e distribuída Execução eficiente de aplicações intensivas em dados ou computação Tipos de ambientes: HPC (High Performance Computing) HTC (High Throughput Computing) Exs de apps HPC: meteorologia, processamento matemático em geral Exs de apps HTC: HEP, bioinformática, finanças etc

10 DCC/FCUP Grid Computing10 Tipos de plataformas PBS NQE Condor IBM sp2, SGI Origin 2000 Beowulf clusters High spped networks More: Instruments BDs

11 DCC/FCUP Grid Computing11 Exemplos de RMSs

12 DCC/FCUP Grid Computing12 NQE (Network Queue Environment)

13 DCC/FCUP Grid Computing13 NQE FTA: File Transfer Agent NQS: Networking Queueing System./prog.out snow

14 DCC/FCUP Grid Computing14 NQE user commands cevent Posts, reads, and deletes job-dependency event information. cqdel Deletes or signals to a specified batch request. cqstatl Provides a line-mode display of requests and queues on a specified host cqsub Submits a batch request to NQE. ftua Transfers a file interactively (this command is issued on an NQE server only). ilb Executes a load-balanced interactive command. nqeProvides a graphical user interface (GUI) to NQE functionality. Commands issued on an NQE server only: qalter Alters the attributes of one or more NQS requests qchkpnt Checkpoints an NQS request on a UNICOS, UNICOS/mk, or IRIX system qdel Deletes or signals NQS requests qlimit Displays NQS batch limits for the local host qmsg Writes messages to stderr, stdout, or the job log file of an NQS batch request qping Determines whether the local NQS daemon is running and responding to requests qstat Displays the status of NQS queues, requests, and queue complexes qsub Submits a batch request to NQS rft Transfers a file in a batch request Fonte:

15 DCC/FCUP Grid Computing15 SGE (Sun Grid Engine) Um único recurso pode desempenhar Mais de uma atividade

16 DCC/FCUP Grid Computing16 SGE Comandos similares aos do NQE Exemplo: g.job #!/bin/csh gaussian < testDFT.in To run: qsub –pe smp 4 –M –m ae –r n Ou...

17 DCC/FCUP Grid Computing17 SGE Arquivo g.job #!/bin/csh #$ -pe smp 4 #$ -M #$ -m ae #$ -r n gaussian < testDFT.in To run: qsub g.job

18 DCC/FCUP Grid Computing18 SGE Usuário pode especificar requisitos (tipo de cpu, qtde de disco, memória etc) SGE registra a tarefa, requisitos e informação de controle (usuário, grupo, depto, data/hora de submissão etc) Possui um planejador de execução de tarefas Assim que uma fila fique disponível, SGE lança a execução de uma das tarefas que estão aguardando A tarefa com > prioridade ou > tempo de espera, segundo a configuração do planejador de tarefas Se houver várias filas dsponíveis escolhe a menos carregada Podem haver várias filas por cluster

19 DCC/FCUP Grid Computing19 SGE Políticas de planejamento: Baseada em tickets (Usuário) Qto + tickets um usuário tiver, > a sua prioriade Tickets são atribuídos de forma estática de acordo com a política de filas e prioridades atribuídos a cada usuário Baseada em urgência (tarefas) Hora limite para terminar a tarefa (que pode ser estipulada pelo usuário) Tempo de fila da tarefa Recursos requisitados Personalizada: permite a atribuição arbitrária de prioridade às tarefas (similar ao nice)

20 DCC/FCUP Grid Computing20 SGE Ciclo de vida de uma tarefa: Submissão Master armazena tarefa e informa planejador Planejador insere a tarefa na fila apropriada Master envia tarefa ao host correspondente Antes de executar, o daemon de execução: Troca para o diretório da tarefa Inicializa o ambiente (variáveis) Inicializa o conjunto de processadores Muda o uid para o uid do dono da tarefa Inicializa limites de recursos do processo Coleta info de contabilidade Ao terminar estes passos, armazena a tarefa à sua base de dados e espera que a tarefa termine Uma vez que a tarefa esteja terminada, avisa ao master e elimina a entrada da base de dados.

21 DCC/FCUP Grid Computing21 SGE Alguns comandos: qconf: config do cluster qsub: submissão de tarefas qdel: eliminar tarefas qacct: estatísticas de utilização qhost: inspeciona estado dos hosts qstat: inspeciona estado das filas

22 DCC/FCUP Grid Computing22 SGE GUI

23 DCC/FCUP Grid Computing23 SGE GUI

24 DCC/FCUP Grid Computing24 Condor It is a specialized job and resource management system. It provides: Job management mechanism Scheduling Priority scheme Resource monitoring Resource management

25 DCC/FCUP Grid Computing25 Condor The user submits a job to an agent. The agent is responsible for remembering jobs in persistent storage while finding resources willing to run them. Agents and resources advertise themselves to a matchmaker, which is responsible for introducing potentially compatible agents and resources. At the agent, a shadow is responsible for providing all the details necessary to execute a job. At the resource, a sandbox is responsible for creating a safe execution environment for the job and protecting the resource from any mischief.

26 DCC/FCUP Grid Computing26 Condor UserProblem SolverAgentResource Matchmaker ShadowSandbox Job Plan of jobs job ClassAds claim Details of the job Environment

27 DCC/FCUP Grid Computing27 Condor Gateway Flocking Gateway pass information about participants between pools, M(A) sends request to M(B) through gateways, M(B) returns a match

28 DCC/FCUP Grid Computing28 Condor Direct Flocking A also advertises to Condor Pool B

29 DCC/FCUP Grid Computing29 RMSs Cada um possui sua própria interface Não proporcionam integração Falta de interoperatividade Requerem habilidades específicas de administração Incrementam custos operacionais Geram sobre-aprovisionamento e desbalanceamento global de carga

30 DCC/FCUP Grid Computing30 Parte da infra-estrutura de produção


Carregar ppt "Grid Computing DCC/FCUP Inês Dutra sala: 1.47"

Apresentações semelhantes


Anúncios Google