Implementação de pipeline de sequenciamento configurável

Slides:



Advertisements
Apresentações semelhantes
Padrão de Projeto Iterator
Advertisements

DESENVOLVIMENTO DE SISTEMAS PARA INTERNET
Support.ebsco.com Tutorial do Meu EBSCOhost Tutorial.
UML Visões – Parte 2.
BANCO DE DADOS Transparências baseadas no capítulo 1 do livro de KORTH e SILBERCHATZ e 1 e 2 do livro de ELMASRI e NAVATHE. Juliana Amaral e Rodrigo Baroni.
SISTEMAS DE INFORMAÇÃO
Sistema de Arquivos - PROTEÇÃO DE ARQUIVOS
Um Processo Baseado em MDA para a Especialização de Mecanismos de Persistência Fabio Seixas Marques Seminário LES – 7 de abril de.
Gerenciamento de Configuração
Sistema Web para Departamentos
CAPÍTULO Sistemas de supervisão 2. Sistema SCADA
Ferramentas CASE ERwin
Professor Victor Sotero
TOpico Especial 1: Banco de Dados Geográfico
TIPOS DE TESTES APLICÁVEIS E NÃO APLICÁVEIS AO PROJETO
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
Documentação da Neptus Framework
Engenharia de Software
Conheça o iManager Apresenta a interface do iManager, mostrando
7 - Criação de Páginas Web
Configuração de manutenção
DIAGRAMA DE COMPONENTES
Introdução ao ArcGIS Iana Alexandra A. Rufino
Arquitetura e Linguagens
A área de banco de dados Cristina Paludo Santos –
Sistema de Gerenciamento de Pessoas e Projetos
Mello, F.O. 1 ; MitsuoIi, F. A. 2 * 1 CPTEC/INPE, Cachoeira Paulista, SP, CEP: – 2 ECMWF, Reading, Shinfield Park,
Treinamento do Microsoft® Access® 2010
Eric, Fabrício, João Vicente
Laboratório de Programação I Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Tópicos de Sistemas de Informação A
Laboratório de Programação I Carlos Oberdan Rolim Ciência da Computação Sistemas de Informação.
Usando Microsoft Access 2010
Web Services Uninorte Semana de Tecnologia da Informação
É um conjunto de registos dispostos numa estrutura regular que possibilita a reorganização dos mesmos e a produção de informação com a menor redundância.
Nova solução CRM da Riosoft
ACESSO A BASE DE DADOS.
POWER POWER POINT POINT.
DC - UFC Copyright © 2003 Misael Santos e Rossana Andrade 1 Padrões de Projeto para Sistemas Web Misael Santos e Rossana Andrade Universidade.
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Projeto de Banco de Dados
Banco de Dados 4P/SI – 2010/02 Prof. Carlos Alberto Seixas.
Professor: Márcio Amador
Programação Orientada à Objetos
Contexto da disciplina
A abordagem de banco de dados para gerenciamento de dados
Top Systems Alexandre Kourbatov. 2 T-FLEX é o sistema CAD/CAPP/CAM/CAE/PDM integrado paramétrico que permite fazer preparação construtiva e tecnológica.
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Introdução a Banco de Dados Aula 04
Padrões de Interação com o Usuário
Padrão de Projeto Iterator Projeto de Sistemas de Software Thiago Pinheiro de Araújo.
Trabalho de Engenharia de Software II
TECNOLOGIAS E LINGUAGENS PARA BANCO DE DADOS I
Análise e Projeto de Sistemas
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Sistemas de Arquivos Sistemas Operacionais Profa. Priscila Facciolli
Daniel Paulo Banco de dados: é uma coleção/conjunto de registros relacionados.  Exemplo: O banco de dados de uma Universidade.
Projeto Supervisionado no Desenvolvimento de Aplicações Profissionais na Web Servidores.
Gerenciamento de Configuração de Software
* Com o avanço das descobertas acerca dos Ácidos Nucléicos e das Proteínas surgiu o Dogma da biologia Molecular; * Surgimento dos métodos de sequenciamento.
Plano de Ensino Conceitos e Características Tipos de Banco de Dados
COMPUTAÇÃO MÓVEL Prof.: Jean Carlo Mendes
Professora: Kelly de Paula Cunha
Programação para Web I AULA 2 BANCO DE DADOS.
Fundamentos de Engenharia de SW Diagramas da UML Usados no Projeto de Software.
Desenvolvimento WEB II Ajax – Utilização de Frameworks Javascript Professora: Kelly de Paula Cunha.
Mauricio Barbosa e Castro.  A construção de um produto multimídia se faz através de um projeto.  O escopo e a complexidade de um projeto de multimídia.
Conceitos Importantes nos Sistemas de Informação
1 Especificação de Sistemas de Software e a UML. 2 Modelagem de sistema A modelagem de sistema auxilia o analista a entender a funcionalidade do sistema.
Apresentação TI Alunos: Isadora Bernardo, Lucas Medeiros, Marcela Muniz e Renata Coutinho.
Transcrição da apresentação:

Implementação de pipeline de sequenciamento configurável KASHIWABARA, AndréYoshiaki1; DURHAM, Alan Mitchell1 & GRUBER, Arthur2 - PIBIC - CNPq 1Departamento de Ciência da Computação, IME-USP 2Laboratório de Biologia Molecular, Departamento de Patologia, FMVZ–USP RESUMO O principal objetivo deste trabalho foi o desenvolvimento de dois bancos de dados para suporte a atividades de bioinformática: SCARdb e EGeneDB. SCARdb é um banco de dados para registro de marcadores genéticos do tipo SCAR (Sequence Characterized Amplified Regions). EGeneDB é um banco que visa dar suporte ao EGene, uma ferramenta de construção de pipelines de sequenciamento genético. Além do desenvolvimento desses dois bancos de dados também foi feita uma melhora do Co-Ed, um editor de configurações utilizado para configuração do sistema EGene. Uma reengenhara parcial do Co-Ed permitiu que os ícones, botões utilizados, bem como os componentes utilizados, possam ser especificados por um arquivo de configuração. SCARDB Banco SCARdb Interface de busca Resultados de algumas consultas O SCARdb vai dar apoio a qualquer pesquisa que visa desenvolver marcadores genéticos do tipo SCAR. Essa base de dados permite o registro dos experimentos, dos resultados, das pessoas que são responsáveis pelo experimento, dos fenótipos quando o marcador esta ligado a alguma característica genotípica e do próprio SCAR. O banco foi desenhado para facilitar a consulta dos fenótipos associados, evitando o uso de um único campo de texto para o seu registro. Os grupos de pesquisas devem registrar um grupo de fenótipos que serão usados no projeto, cada elemento desse grupo deve conter o nome e sua respectiva descrição. A abordagem resulta em consultas mais eficientes, ou seja, basta selecionar o nome do grupo e olhar a descrição de cada fenótipo, para então, selecionar aquele que interessa. Além disso, quando o banco combina informações de especificidade obtidas pelos experimentos com informações sobre as classes taxonômicas, é possível buscar dinamicamente pelos SCARs específicos a qualquer classe de seres vivos. O SCARdb fornece uma interface que permite a busca de SCARs, pelo nome, especificidade ou comandos SQL. Podemos olhar com detalhes informações de cada seqüência, possibilitando, até mesmo, consultar resultados de Blast que estão pré-processados. As atualizações são feitas numa parte com acesso restrito, por medida de segurança, essa página só pode ser vista no laboratório. EGENE e CO-ED EGeneDB – Breve descrição. O EGeneDB foi criado para armazenar os resultados de todas as operações efetuadas sobre a seqüência durante a execução de um pipeline, o que possibilita desenvolver novas consultas a estes resultados, facilitando a geração de novos relatórios visando aprimorar o sequenciamento. EGene e Co-Ed - Criação modular visual de pipelines As leituras de DNA geradas pelos projetos de sequenciamento devem ser processadas por diversos programas para serem analisadas. EGene[2] é um sistema de geração de pipelines para análise automática de seqüências de DNA. O usuário tem à sua disposição inúmeros componentes que podem ser conectados em qualquer ordem de maneira totalmente modular. Toda a configuração do sistema é feita utilzando Co-Ed um editor gráfico. A arquitetura do EGene determina que toda a manipulação das seqüências seja feita por um módulo separado, SequenceObject.pm, que garante a total independência dos seus vários componentes em relação ao mecanismo e ao formato de entrada e saída de dados. O banco de dados consiste nas entidades Sequence, Operation e Program. A aplicação da operação sobre a seqüência está sendo representada pelo relacionamento cujo atributo ordem guarda a ordem em que a operação foi executada. Para facilitar o rastreamento das operações, todos os parâmetros dos programas estão sendo armazenados. Cada operação representa o resultado obtido pela execução de algum programa. No momento, o pipeline contém apenas três tipos de operação, trimming, filtering e masking.. O EGene configurando o pipeline do projeto Eimeria Na primeira implementação de SequenceObject, toda a entrada e saída era feita através de uma flatfile, tendo como conseqüência a geração de um arquivo para cada placa processada pelo sequenciador. O problema dessa abordagem é que ela torna a análise global de dados de um projeto bem mais complexa, e cria a necessidade de uma estrutura de diretórios e arquivos para a armazenagem de resultados e relatórios Novas operações poderão ser adicionados ao EGene, assim, optamos pela utilização do conceito de especialização, deixando o banco mais completo Os próximos passos serão a criação de um conjunto de consultas pré-definidas, por web, para geração de relatórios e a ampliação do banco para incluir dados de anotação. Até o momento o banco foi utilizado para reprocessar 19.000 seqüencias de um projeto de ESTs de Eimeria spp. Co-Ed Neste trabalho, esta componente passou por uma reengenharia, tornando possível a adição da especificação de novos módulos do pipeline simplesmente editando um arquivo de configuração onde são especificados quais parâmetros precisam ser de cada componente, eventuais valores default e os arquivos com imagens do botão e do ícone associados ao componente. O uso de padrões de projetos[1] foi utilizado para a implementação de várias funcionalidades, por exemplo, o padrão Observer esta presente na arquitetura MVC utilizado no trabalho. REFERÊNCIAS [1] GAMA, E.; HELLM, R.; JOHSON, R.; VLISSIDES, J. Design Patterns: Elements of Reusable Object-Oriented Software. Addinson-Wesley,1994 [2] GRUBER, A.; AHAGON P. H.; RAINONE F.; KASHIWABARA, A. Y. & DURHAM, A. M. EGene – A modular and configurable pipeline system for automatic DNA sequence analysis, ICOBICOBI, 2003.