Relatório geral das atividades da T2-UERJ (projeto HEPGrid)
Infraestrutura atual Cluster Três racks contendo 53 servidores de processamento; Um total de 440 núcleos e 390 TB para armazenamento de dados; Servidores adicionais dedicados a disponibilização dos serviços de Grid: o Transferência de dados (PhEDEx + GridFTPs); o Submissão de jobs (computing elements + Condor); o Armazenamento distribuído (dCache); o Servidor web, servidor de nomes, servidor de contas dos usuários, servidor de autenticação dos usuários da Grid, servidor de monitoramento; Infraestrutura atual Imagem da sala do cluster com os servidores distribuídos em racks AnoNúcleosArmazenamentoHEP - SPEC Final TB4,20 K Final 2012 (Estimativa) TB6,20 K
Infraestrutura atual Sala de controle e de terminais do CMS Dois monitores de grande visibilidade Quatro estações de monitoramento com seis monitores de 22 polegadas. Seis terminais de submissão e análise de jobs Imagens da sala de controle (abaixo) e de análise de dados (a direita) do CMS.
Total de jobs para o CMS na T2_BR_UERJ ( ) nosso link externo ficou indisponível por dois longos períodos que perfazem 3 MESES E MEIO devido a indisponibilidades da fibra da Oi que conecta a UERJ ao PoP-RJ (RNP). a capacidade do link foi elevada a 10Gbps, ainda por ser inteiramente avaliada. ainda assim, apesar deste problema GRAVE, até agora foram analisados em 2011 aproximadamente 7x mais eventos do que no ano de 2010 por nossa T eventos analisados jobs de análise
Resultados suficientes ? Resposta: NÃO o prof. Nelson Simões (diretor geral da RNP), a pedido do prof. Santoro, está tomando as atitudes necessárias para que a estabilidade da nossa conexão seja garantida de uma vez por todas; precisamos nos reafirmar entre os sites que fazem produção MC (time USCMS), pois tivemos a credibilidade SERIAMENTE afetada devido aos problemas com a rede. Testes feitos no 1º. Semestre foram bem sucedidos; é importante o aumento da transferência de datasets “populares” para a T2-UERJ, desde, é claro, que eles pertençam aos grupos com que trabalhamos (ex. forward physics); em Agosto último, havia contatos com o grupo de forward para que algumas samples fossem colocadas aqui, mas a nossa conexão caiu antes disso... preparar o cluster para atender a ambientes mais complexos é interessante, tais como jobs com MPI (Message Passing Interface), bem como a outras aplicações no contexto do OSG (Open Science Grid);
atualmente, estamos envolvidos em um projeto de uma T2 distribuída, cuja idéia é integrar conjuntos de máquinas nas instituições participantes (além da UERJ, o CBPF, a UNESP e a USP) através de uma conexão externa de alta velocidade. Embora as máquinas já tenham chegado, o projeto se encontra estagnado devido aos problemas de rede mencionados anteriormente. desde o início do nosso (longo) downtime, o Dashboard do CMS teve problemas em publicá-lo corretamente, por causa de diversos bugs neste sistema. Eis o link com uma descrição dos últimos: para 2012, a UERJ conta com 11 “shifters” CSP (computação) oficiais, e dois na lista de espera, ainda a serem devidamente treinados e ambientados. Havendo necessidade, não hesitem em entrar em contato conosco para informações técnicas. nossos sinceros agradecimentos aos nossos técnicos do lado de lá do oceano, no momento - Alan, Diego, Marko e Samir - pela constante cooperação e pelo companheirismo. Outros tópicos
Coordenador: Alberto Santoro Gerente de Datasets: Wagner Carvalho Técnicos: Eduardo Revoredo (sup.), José Afonso Sanches (sup.), Douglas Milanez Estagiários: Luiz Gustavo Dornelas, Renata Salles Colaboradores atualmente no CERN: Alan Malta, Diego Gomes, Marko Petek, Samir Cury Equipe da T2