Evaluating the Performance of Lustre File System

Slides:



Advertisements
Apresentações semelhantes
«Forte do Bom Sucesso (Lisboa) – Lápides 1, 2, 3» «nomes gravados, 21 de Agosto de 2008» «Ultramar.TerraWeb»
Advertisements

UNICAMP Universidade Estadual de Campinas Centro Superior de Educação Tecnológica Divisão de Telecomunicações Propagação de Ondas e Antenas Prof.Dr. Leonardo.
INFORMAÇÕES COMPLEMENTARES
O Modelo de Jesus para Crescimento e Serviço
A busca das mulheres para alcançar seu espaço dentro das organizações
Material pedagógico Multiplicar x 5 Clica!
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
Capa Disciplina: Ajustamento de Observações
CARACTERIZAÇÃO E IMPLEMENTAÇÃO DE MECANISMOS DE RESILIÊNCIA A ATAQUES Alex Borges Outubro de
Exercício do Tangram Tangram é um quebra-cabeças chinês no qual, usando 7 peças deve-se construir formas geométricas.
Nome : Resolve estas operações começando no centro de cada espiral. Nos rectângulos põe o resultado de cada operação. Comprova se no final.
Realizado no Curso EFA Cozinha – Valença
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
Sumário Bem ou serviço compósito = dinheiro Exercícios 2 Exercícios 3.
Curso de ADMINISTRAÇÃO
EXPRESSÕES ARITMÉTICAS
EXPRESSÕES ARITMÉTICAS
Francieli Zanon Boito Rodrigo Virote Kassick
Capítulo 6 Sistemas de Arquivos 6.1 Arquivos 6.2 Diretórios
Estudo de Caso 1: UNIX e LINUX
Aula 4 Nomes, Vinculações, Tipos e Escopos
Linguagens de Programação
HellermannTyton Brasil Sistema de Gerenciamento Integrado HellermannTyton Brasil Sistema de Gerenciamento Integrado Alexandre Martins Consultor de Negócios.
O que é 5(S)? ? 5(S) É a prática de hábitos que permitem mudanças nas relações... É a base de qualquer programa de qualidade. 1.
EXEMPLOS DE ESTRUTURAS PROTENDIDAS
Questionário de Avaliação Institucional
Experiments with Strassen’s Algorithm: from sequential to parallel
Mecânica dos Sólidos não Linear
Classes e objetos P. O. O. Prof. Grace.
Provas de Concursos Anteriores
APRESENTAÇÃO Está prevista a utilização de 6 aulas (6 blocos de 90 minutos) para o ensino do Subtema das Funções Quadráticas. Todas as aulas servirão.
Renda até 2 SM.
Hamburgo, Alemanha Definir o caminho que irá permitir a Lions Clubs International alcançar o seu potencial pleno como organização.
MECÂNICA - ESTÁTICA Cabos Cap. 7.
Diagnósticos Educativos = Diagnósticos Preenchidos 100% = 1.539
(CESPE/ Técnico Judiciário do TRT 17ª Região/ES) O Superior Tribunal de Justiça entende que o candidato aprovado em concurso público dentro do limite.
MECÂNICA - DINÂMICA Exercícios Cap. 13, 14 e 17. TC027 - Mecânica Geral III - Dinâmica © 2013 Curotto, C.L. - UFPR 2 Problema
MECÂNICA - ESTÁTICA Vetores Forças Cap. 2.
Object Oriented Software Construction (MEYER, Bertrand)
1 CENTRO DE DESENVOLVIMENTO E PLANEJAMENTO REGIONAL – 2006 P Ó S-GRADUA Ç ÃO EM ECONOMIA Microeconomia I Prof.: Edson Domingues Cap í tulo II: Escolha.
CATÁLOGO GÉIA PÁG. 1 GÉIA PÁG. 2 HESTIA PÁG. 3.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO IV – Nº 06.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO IV – Nº 11.
Trabalho sobre Cor Thiago Marques Toledo.
FISCALIZAÇÃO DIRECIONADA CONDUTA - AUXILIAR ANO III – Nº 05.
Coordenação Geral de Ensino da Faculdade
Medidas de posição  Estudando as distribuições de  frequência,  percebe-se que existe uma  posição de  concentração dos valores, que podem estar mais concentrados no início, no meio ou no 
Coordenação Geral de Ensino da Faculdade
Plataforma Brasil – Submissão de pesquisa
Estudo dos Gases Prof. Fabio Costa.
Projeto Marcas que Eu Gosto 1 PROJETO MARCAS QUE EU GOSTO Estudos Quantitativo de Consumidores Janeiro / 2005.
Modelagem Estatística
Núcleo de Estatística e Gestão Estratégica- NEGEST.
1/40 COMANDO DA 11ª REGIÃO MILITAR PALESTRA AOS MILITARES DA RESERVA, REFORMADOS E PENSIONISTAS - Mar 06 -
1 Copyright © 2010 The Nielsen Company. Confidential and proprietary. Title of Presentation Copyright © 2012 The Nielsen Company. Confidential and proprietary.
Irradiações 1- Definição 2- Mecânica da Irradiação
Projeto Medindo minha escola.
C ORROPIOS, C ARDINCHAS E C ÃES G RANDES O LIVRO de José Paixão em imagens – com pistas de leitura propostas por por www.joraga.net.
1 2 Observa ilustração. Cria um texto. Observa ilustração.
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
MATRICIAL CONSULTORIA LTDA. PREFEITURA MUNICIPAL DE GARIBALDI 23/10/ : ATENÇÃO Os locais descritos nas planilhas anexas não correspondem ao total.
Estatística Aula 9 – 28/02/2011.
Redes Neuronais/Neurais/ Conexionistas Introdução
1 Aplicações do Fecho Regular. 2 A interseção de uma linguagem livre de contexto e uma linguagem regular é uma linguagem livre de contexto livre de contexto.
Olhe fixamente para a Bruxa Nariguda
Máquina de Turing Universal
3ª PESQUISA DE REMUNERAÇÃO
Equipe Bárbara Régis Lissa Lourenço Lucas Hakim Ricardo Spada Coordenador: Gabriel Pascutti.
AM020C A interface entre Meio Ambiente, Sociedade e Economia Indicadores de produtividade e empregabilidade da agricultura do Brasil. Aluna Andressa Santos.
Sistemas de Arquivos Paralelos Alternativas para a redução do gargalo no acesso ao sistema de arquivos Roberto Pires de Carvalho carvalho arroba ime ponto.
Transcrição da apresentação:

Evaluating the Performance of Lustre File System Francieli Zanon Boito Rodrigo Virote Kassick Philippe O. A. Navaux VII Workshop de Processamento Paralelo e Distribuído Instituto de Informática – UFRGS Porto Alegre, 21 de agosto de 2009.

Roteiro Introdução Lustre File System Testes propostos Resultados Conclusões

Clusters de computadores são uma realidade. Introdução Clusters de computadores são uma realidade.

As aplicações científicas geram grandes quantidades de dados. Introdução As aplicações científicas geram grandes quantidades de dados. Esses dados podem precisar ser acessados em todos os nós.

Eles devem prover acesso a dados remotos como se fossem locais. Introdução Eles devem prover acesso a dados remotos como se fossem locais. Uma solução bastante empregada é o uso de Sistemas de Arquivos Distribuídos (SADs)

6 de 96 Introdução Muitas opções de projeto podem ser tomadas em relação a arquitetura, comunicação, compartilhamento, sincronização, cache, tolerância a falhas, segurança, ...

7 de 96 Introdução Dependendo das opções de projeto, o sistema terá comportamento diferente para padrões de acesso diferentes. Para obter um bom desempenho, a forma com que as aplicações fazem I/O deve combinar com as otimizações oferecidas pelo sistema de arquivos.

8 de 96 Introdução Portanto, estudar o desempenho de sistemas de arquivos sob cargas de trabalho observadas na prática é importante, pois provê ferramentas para:

9 de 96 Introdução Que a aplicação escolha um sistema “compatível”, ou que se adapte ao já escolhido. Que os projetistas de SADs guiem o seu trabalho para favorecer aplicações alvo

O objetivo desse trabalho Introdução O objetivo desse trabalho

11 de 96 Introdução Estudar o desempenho do sistema de arquivos Lustre sob padrões de acesso observados na prática.

Roteiro Introdução Lustre File System Testes propostos Resultados Conclusões

13 de 96 Lustre F.S. O Lustre é um sistema desenvolvido desde o início com o objetivo de prover alto desempenho e escalar bem para clusters de milhares de nós.

Camada de sistema de arquivos virtual. Lustre F.S. Clientes; A arquitetura do Lustre é composta por... Clientes, onde o serviço é oferecido por uma camada de sistema de arquivos virtual, que faz o encaminhamento de requisições a arquivos locais e remotos. Servidor de metadados centralizado, o MDS. Esse servidor centralizado foi uma opção de projeto: eles consideraram que as opções sobre metadados não eram volumosas o suficiente para “pagar” uma distribuição. Servidores de dados, os OSTs, que são responsáveis pelas operações sobre os dados, por gerenciar lockings (travamentos, para garantir a consistência quando de acessos concorrentes) e pela interação com os ... Dispositivos de armazenamento, os OBD – Object-Based Disks, que não precisam ser discos, porque o driver que ele usa pra se comunicar com o OST mascara a sua identidade. Podem ser empregadas diversas tecnologias de armazenamento, bem como sistemas de arquivos locais (ext3, RaiserFS). Todos os servidores podem manter cópias sincronizadas. O metasservidor redundante mantém com o original um registro transacional de todas as operações sobre os metadados. Existe um serviço chamado MGS que pode Camada de sistema de arquivos virtual. Arquitetura

Servidor de metadados (MDS); Lustre F.S. Clientes; Servidor de metadados (MDS); A arquitetura do Lustre é composta por... Clientes, onde o serviço é oferecido por uma camada de sistema de arquivos virtual, que faz o encaminhamento de requisições a arquivos locais e remotos. Servidor de metadados centralizado, o MDS. Esse servidor centralizado foi uma opção de projeto: eles consideraram que as opções sobre metadados não eram volumosas o suficiente para “pagar” uma distribuição. Servidores de dados, os OSTs, que são responsáveis pelas operações sobre os dados, por gerenciar lockings (travamentos, para garantir a consistência quando de acessos concorrentes) e pela interação com os ... Dispositivos de armazenamento, os OBD – Object-Based Disks, que não precisam ser discos, porque o driver que ele usa pra se comunicar com o OST mascara a sua identidade. Podem ser empregadas diversas tecnologias de armazenamento, bem como sistemas de arquivos locais (ext3, RaiserFS). Todos os servidores podem manter cópias sincronizadas. O metasservidor redundante mantém com o original um registro transacional de todas as operações sobre os metadados. Existe um serviço chamado MGS que pode

Servidor de metadados (MDS); Lustre F.S. Clientes; Servidor de metadados (MDS); Servidores de dados (OST); A arquitetura do Lustre é composta por... Clientes, onde o serviço é oferecido por uma camada de sistema de arquivos virtual, que faz o encaminhamento de requisições a arquivos locais e remotos. Servidor de metadados centralizado, o MDS. Esse servidor centralizado foi uma opção de projeto: eles consideraram que as opções sobre metadados não eram volumosas o suficiente para “pagar” uma distribuição. Servidores de dados, os OSTs, que são responsáveis pelas operações sobre os dados, por gerenciar lockings (travamentos, para garantir a consistência quando de acessos concorrentes) e pela interação com os ... Dispositivos de armazenamento, os OBD – Object-Based Disks, que não precisam ser discos, porque o driver que ele usa pra se comunicar com o OST mascara a sua identidade. Podem ser empregadas diversas tecnologias de armazenamento, bem como sistemas de arquivos locais (ext3, RaiserFS). Todos os servidores podem manter cópias sincronizadas. O metasservidor redundante mantém com o original um registro transacional de todas as operações sobre os metadados. Existe um serviço chamado MGS que pode

Os OBDs não precisam ser discos. 17 de 96 Lustre F.S. Clientes; Servidor de metadados (MDS); Servidores de dados (OST); Dispositivos de armazenamento (OBD); A arquitetura do Lustre é composta por... Clientes, onde o serviço é oferecido por uma camada de sistema de arquivos virtual, que faz o encaminhamento de requisições a arquivos locais e remotos. Servidor de metadados centralizado, o MDS. Esse servidor centralizado foi uma opção de projeto: eles consideraram que as opções sobre metadados não eram volumosas o suficiente para “pagar” uma distribuição. Servidores de dados, os OSTs, que são responsáveis pelas operações sobre os dados, por gerenciar lockings (travamentos, para garantir a consistência quando de acessos concorrentes) e pela interação com os ... Dispositivos de armazenamento, os OBD – Object-Based Disks, que não precisam ser discos, porque o driver que ele usa pra se comunicar com o OST mascara a sua identidade. Podem ser empregadas diversas tecnologias de armazenamento, bem como sistemas de arquivos locais (ext3, RaiserFS). Todos os servidores podem manter cópias sincronizadas. O metasservidor redundante mantém com o original um registro transacional de todas as operações sobre os metadados. Existe um serviço chamado MGS que pode Os OBDs não precisam ser discos.

Serviço MGS Clientes; Servidor de metadados (MDS); Lustre F.S. Clientes; Servidor de metadados (MDS); Serviço MGS Servidores de dados (OST); Dispositivos de armazenamento (OBD); A arquitetura do Lustre é composta por... Clientes, onde o serviço é oferecido por uma camada de sistema de arquivos virtual, que faz o encaminhamento de requisições a arquivos locais e remotos. Servidor de metadados centralizado, o MDS. Esse servidor centralizado foi uma opção de projeto: eles consideraram que as opções sobre metadados não eram volumosas o suficiente para “pagar” uma distribuição. Servidores de dados, os OSTs, que são responsáveis pelas operações sobre os dados, por gerenciar lockings (travamentos, para garantir a consistência quando de acessos concorrentes) e pela interação com os ... Dispositivos de armazenamento, os OBD – Object-Based Disks, que não precisam ser discos, porque o driver que ele usa pra se comunicar com o OST mascara a sua identidade. Podem ser empregadas diversas tecnologias de armazenamento, bem como sistemas de arquivos locais (ext3, RaiserFS). Todos os servidores podem manter cópias sincronizadas. O metasservidor redundante mantém com o original um registro transacional de todas as operações sobre os metadados. Existe um serviço chamado MGS que pode Réplicas.

Os clientes empregam cache de metadados e de dados com read-ahead. Lustre F.S. Os servidores de dados não possuem cache, mas ela pode estar presente no dispositivo de armazenamento utilizado. Os clientes empregam cache de metadados e de dados com read-ahead.

20 de 96 Lustre F.S. A comunicação é feita através da LNET, que provê suporte a diferentes tecnologias de rede através de drivers conectáveis (LNDs).

Roteiro Introdução Lustre File System Testes propostos Resultados Conclusões

Elas focam em dois aspectos: cache e distribuição de dados. Testes Foram elaboradas classes de testes representando padrões de acesso verificados na prática. Elas focam em dois aspectos: cache e distribuição de dados.

Todos os nós podem acessar um arquivo, ou cada um o seu. Testes Todos os nós podem acessar um arquivo, ou cada um o seu. Single File, SF Multiple Files, MF

Todo o conteúdo do arquivo pode ser acessado, ou só segmentos. Testes Todo o conteúdo do arquivo pode ser acessado, ou só segmentos. Whole Access, WA Segmented Access, SA Resultando em...

As classes inspiradas em (Kotz et al.): 25 de 96 Testes As classes inspiradas em (Kotz et al.): Single File, Segmented Access SFSA Single File, Whole Access SFWA Multiple Files, Whole Access MFWA

As classes inspiradas em (Kotz et al.): 26 de 96 Testes As classes inspiradas em (Kotz et al.): SFWA: todos os clientes lêem concorrentemente todo o conteúdo de um grande arquivo compartilhado. Single File, Whole Access SFWA

As classes inspiradas em (Kotz et al.): 27 de 96 Testes As classes inspiradas em (Kotz et al.): MFWA: cada cliente escreve e lê em seu próprio arquivo. Multiple Files, Whole Access MFWA

As classes inspiradas em (Kotz et al.): 28 de 96 Testes As classes inspiradas em (Kotz et al.): SFSA: cada cliente possui um segmento próprio para suas operações em um arquivo compartilhado. Single File, Segmented Access SFSA

Os testes foram realizados com auxílio da ferramenta MPI-IO Test. 29 de 96 Os testes foram realizados com auxílio da ferramenta MPI-IO Test. Testes

O teste desejado é descrito através de parâmetros passados à ferramenta. Número de arquivos; Operação realizada; Barreiras; Distribuição do arquivo entre os processos: strided ou non-strided. Testes

Número de segmentos (e tamanho deles) por cliente. Testes Número de segmentos (e tamanho deles) por cliente.

32 de 96 Metodologia Testes

Striping em blocos de 64KB, circular começando em servidor aleatório. Testes Cluster Helios (Grid5000), nodos biprocessados com AMD Opteron 2.2GHz, 4GB de memória RAM e rede Gigabit Ethernet. 4 servidores de dados; Até 40 clientes; Striping em blocos de 64KB, circular começando em servidor aleatório. Sistema de arquivos Lustre.

Cada cliente opera sobre 2GB. 34 de 96 Cada cliente opera sobre 2GB. Servidores de dados armazenam no sistema de arquivos local (ext3). Testes Coletados resultados o número de vezes necessário para ter confiança de 90% e erro relativo de 10% (mínimo de 4 execuções);

Granularidade das operações; Testes Testes variando: Granularidade das operações; Número de clientes.

Roteiro Introdução Lustre File System Testes propostos Resultados Conclusões

Variando tamanho de bloco Resultados Comando dd do Unix; 40 clientes; Tamanho do bloco utilizado varia de 1KB a 4MB; Erro máximo de 5%. Single File, Whole Access SFWA Variando tamanho de bloco

Não é sensível ao tamanho do bloco. 38 de 96 Resultados Não é sensível ao tamanho do bloco. Variando tamanho de bloco

Variando número de objetos Resultados Ferramenta MPI-IO Test; 40 clientes; De 2 a 2K objetos, adaptando o seu tamanho para manter a quantidade de dados acessados; Multiple Files, Whole Access MFWA Variando número de objetos

Variando número de objetos Resultados Variando número de objetos

41 de 96 Resultados Quando uma grande área contígua é acessada, não faz diferença fazer o acesso em uma ou várias requisições.

Variando número de clientes Resultados Ferramenta MPI-IO Test; De 1 a 40 clientes; 32 objetos de 64MB. Multiple Files, Whole Access MFWA Variando número de clientes

Estabiliza e não sofre degradação. Resultados Estabiliza e não sofre degradação. Variando número de clientes

Variando número de objetos Resultados Ferramenta MPI-IO Test; 40 clientes; De 2 a 2K objetos, adaptando o seu tamanho para manter a quantidade de dados acessados. Single File, Segmented Access SFSA Variando número de objetos

Variando número de objetos Resultados Com a opção strided, quanto mais granular, pior o desempenho; Com a opção non- strided, desempenho constante. Variando número de objetos

Acessos mais granulares possuem menor desempenho. Resultados Usando um arquivo compartilhado, é melhor delegar um grande segmento por processo. Acessos mais granulares possuem menor desempenho.

Leitura non-strided tem desempenho melhor que MFWA. Resultados ~20% Leitura non-strided tem desempenho melhor que MFWA. Variando número de objetos Comparado com o resultado do MFWA

48 de 96 Resultados Utilizar um arquivo compartilhado (delegando segmentos) é melhor do que múltiplos.

Variando número de clientes Resultados Single File, Segmented Access SFSA Ferramenta MPI-IO Test; De 1 a 40 clientes; 32 objetos de 64MB. Variando número de clientes

Variando número de clientes Resultados Non-strided possui melhor desempenho, mas degrada com o aumento de clientes. Mesma diferença já observada no teste anterior; Ambos estabilizam rapidamente; Variando número de clientes

Lustre possui boa escalabilidade. Resultados Lustre possui boa escalabilidade. Exceção: segmento único em arquivo compartilhado.

Leitura possui melhor desempenho que a escrita. Resultados Leitura possui melhor desempenho que a escrita. ~20%

Roteiro Introdução Lustre File System Testes propostos Resultados Conclusões

54 de 96 Conclusões Esse trabalho apresentou um estudo sobre o comportamento do desempenho do sistema de arquivos Lustre sob diferentes padrões de acesso.

55 de 96 Conclusões Para simular os padrões de acesso, foram sugeridas e aplicadas classes de testes inspiradas em aplicações científicas: SFWA, MFWA e SFSA. Single File, Segmented Access SFSA Single File, Whole Access SFWA Multiple Files, Whole Access MFWA

56 de 96 Conclusões Para ter bom desempenho com o Lustre File System, é desejável que a aplicação possua as seguintes características:

Os nós realizam leituras de grandes áreas contíguas. Conclusões Os nós realizam leituras de grandes áreas contíguas.

58 de 96 Conclusões Se os nós acessam uma área contígua de dados, não faz diferença em quantas requisições.

59 de 96 Conclusões Se os nós possuem dados exclusivos, eles são armazenados em segmentos de um arquivo compartilhado.

60 de 96 Conclusões Os resultados permitem a adequação de aplicações para que tirem melhor proveito do Lustre, obtendo um melhor desempenho.

61 de 96 Conclusões Os resultados também podem ser utilizados para uma melhor comparação do Lustre com outros sistemas de arquivos.

Obrigada pela atenção! Perguntas?

Evaluating the Performance of Lustre File System Francieli Zanon Boito Rodrigo Virote Kassick Philippe O. A. Navaux VII Workshop de Processamento Paralelo e Distribuído Instituto de Informática – UFRGS Porto Alegre, 21 de agosto de 2009.

As quatro classes inspiradas em (Kotz et al.): 64 de 96 Testes As quatro classes inspiradas em (Kotz et al.): Aplicações que precisam ler todos os dados de um arquivo (de checkpoint ou resultados anteriores) por todos os nós antes de iniciar a computação. Single File, Whole Access SFWA Exemplo: MESSKIT, método Hartree-Fock para calcular densidade de elétrons.

As quatro classes inspiradas em (Kotz et al.): 65 de 96 Testes As quatro classes inspiradas em (Kotz et al.): Aplicações em que cada nó guarda seus dados em arquivos próprios, que serão usados num pós-processamento. Multiple Files, Whole Access MFWA ESCAT, aplicação para simular colisões de baixa energia entre moléculas e elétrons.

As classes inspiradas em (Kotz et al.): 66 de 96 Testes As classes inspiradas em (Kotz et al.): Mesma situação da classe MFWA, porém em escala de segmentos, não de arquivos. Single File, Segmented Access SFSA Flash, aplicação da Astrofísica.