Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.

Slides:



Advertisements
Apresentações semelhantes
Algoritmos em Grafos.
Advertisements

TÉCNICAS DE REGISTRO DO ESTUDO DOS MÉTODOS
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
Organização Gênica de Eucariotos
Amintas engenharia.
UBAIII Biologia Molecular
UPCII Microbiologia Teórica 2-3
UBAIII Biologia Molecular
Pesquisa em profundidade
Software Básico Silvio Fernandes Universidade Federal Rural do Semi-Árido Departamento de Ciências Exatas e Naturais Ciência da Computação Aula.
Empreendorismo para Computação Criando Negócios de Tecnologia
Universidade Federal de Viçosa
Montagem e análise de genomas
Seqüenciamento parcial de transcritos
Uso da bioinformática na análise genômica
Introduction of RefSeq and LocusLink: resources at the NCBI
Sequenciamento inicial e análises do genoma humano
Genômica e Proteômica Montagem de genomas.
ORGANIZAÇÃO FUNCIONAL do GENOMA
ORGANIZAÇÃO do GENOMA - 2
Serial Analysis of Gene Expression (SAGE)
Evolução Molecular Metodologias de Análise
Balanceamento de Linhas
Licenciatura em Ciências da Saúde
Arquitectura de Computadores II
Polimorfismos de nucleotídeos únicos em espécies poliplóides
Disciplina: Bioinformática Aplicada ao Estudo de Doenças Parasitárias
Genómica Licenciatura em Ciências Biomédicas
Genómica Licenciatura em Ciências Biomédicas
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
Licenciatura em Ciências Biomédicas
UPCII M Microbiologia Teórica 10
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
UPCII M Microbiologia Teórica 5 2º Ano 2012/2013.
UBA VII – Genética Molecular Genética Molecular e Humana
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
UPCII M Microbiologia Teórica 4-5 2º Ano 2011/2012.
UPCII M Microbiologia Teórica 5 2º Ano 2013/2014.
UPCII M Microbiologia Teórica 7
UBAIII Biologia Molecular (MIMD) Biologia Molecular (LCB)
UBA III – Biologia Molecular
UPCII M Microbiologia Teórica 18
UPCII M Microbiologia Teórica 17
Carlos Oberdan Rolim Ciência da Computação
Genómica Licenciatura em Ciências Biomédicas
TEORIA DA PRODUÇÃO.
Genómica Licenciatura em Ciências Biomédicas
ESTUDO SOBRE A CORRELAÇÃO DO POLIMORFISMO DO GENE DE REPARO XRCC7 EM MULHERES COM ENDOMETRIOSE E MULHERES NORMAIS INTRODUÇÃO A endometriose consiste no.
UPCII M Microbiologia Teórica 12
1 Contributos para uma Boa Apresentação Luis M. Correia Instituto Superior Técnico / INOV-INESC Universidade Técnica de Lisboa, Portugal (2001/06/22, revisto.
Elementos da Cartografia
UBAIII Biologia Molecular 1º Ano 2014/ /out/2014UBAIII MJC Sumário:  Capítulo II. A relação entre genes e proteínas  O fluxo de informação genética.
Sistemas Operacionais
UPCII M Microbiologia Teórica 20
Fontes de Erros Aula 1 Introdução; Erros em processos numéricos;
UPCII M Microbiologia Teórica 33 2º Ano 2013/2014.
UPCII M Microbiologia Teórica 34
Introdução à Montagem de Genomas
CAP3 (Contig Assembly Program)
Bioinformática Nuno Santos a25303 Bioengenharia 2011/2012.
RepeatMasker Aluno: Fred Ulisses maranhão Professora: Kátia S. Guimarães Algoritmos p/ processamento de Cadeias, Cin, UFPE - 1/2001.
Clusterização de sequências biológicas : PHRAP e CAP3
Fragment Assembly Analyzer Erico Teixeira e Francisco do Nascimento Maio, 2003 FAAz.
CAP3 (Contig Assembly Program)
RNA-SEQ: CONCEITO E APLICAÇÕES
Alinhamentos Múltiplos
tópicostópicos itens 01. Terminologia 02. Operações básicas 03. Representação de linguagens 04. Formalização de gramáticas 05. Processo de derivação 06.
Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.
ANÁLISE EM LARGA ESCALA DE EXPRESSÃO GÊNICA DIFERENCIAL ENTRE DIVERSAS
Fundamentos de ENGENHARIA GENÉTICA.
Transcrição da apresentação:

Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013

Sumário 3. Montagem de genomas Montagem hierárquica Montagem de genomas completos Montagem de genomas com base em modelos Problemas associados à montagem dos genomas – Controlo de qualidade Genómica MJC2

Aumenta o número de peças para 2-3 triliões. Sobreposições em média de duas centenas de pares de bases. Equivale a ter um puzzle de 30 milhões de peças Montagem de genomas Após a sequenciação temos fragmentos (de tamanhos que vão de 1000 a 40 pbs) que é preciso reordenar na sequência original Genómica MJC3

Algumas das peças… Faltam – Problemas na construção das bibliotecas – Problemas com a amplificação por PCR Têm erros – Zonas repetitivas – Erros no PCR Genómica MJC4 Aumentamos o nº de vezes que cada peça é sequenciada! Entre 8 e 100 vezes

A sequência (read) ideal É longa Não tem erros Genómica MJC5

Podemos considerar 2 tipos Única (single read) – Resulta da sequenciação do fragmento em si. Emparelhada (paired read) – Nestas leituras eu sei a sequência das pontas e a que distância estão uma da outra Genómica MJC6

MONTAGEM HIERÁRQUICA OU DE CLONES Genómica MJC7

Abordagem usada para alinhar grandes inserções clonadas – Primeiro é feito o mapeamento dos clones por padrões de digestão, marcadores de linkage ou mutações induzidas Genómica MJC8

Desse mapeamento… Genómica MJC9 Escolhem-se os fragmentos a vermelho pois implicam a menor sobreposição. É feita a sequenciação desses fragmentos: – Cada sequenciação (read) é avaliada quanto à sua qualidade. – É reconstruida a sequencia inicial usando as sobreposições.

MONTAGEM DE GENOMAS COMPLETOS Genómica MJC10

Método mais aplicado atualmente Uma vez que a maioria da sequenciação já não implica clonagem. Dispensa o passo do mapeamento. São sequenciadas as extremidades dos vários fragmentos que são depois alinhadas. Genómica MJC

Desse alinhamento surge o contig Genómica MJC 12 Inclui 3 fases: – Sobreposição – Alinhamento – Consenso

Desse alinhamento surge o contig Genómica MJC 13 A localização vai ser determinada pela homologia

Vários contigs dão um scaffold Genómica MJC 14

Genómica MJC15

ALGUNS ALGORITMOS DE MONTAGEM DE GENOMAS Genómica MJC16

Greedy Como a homologia é a única condição este tipo de algoritmos é muito influenciado pelas sequências repetitivas ou homologias Genómica MJC17

Overlap-Layout-Consensus Todas as sobreposições são mapeadas (Overlap) É eliminada a informação redundante (Layout) Usando a teoria de grafos é desenhado o mapa mais simples e que corresponderá à organização inicial Genómica MJC18

Overlap-Layout-Consensus Pode ser substituído pelo: Align-Layout-Consensus pois já há vários genomas de referência sequenciados Genómica MJC19

CONTROLO DE QUALIDADE Genómica MJC20

Em genomas de novo Não se sabe quase nada – Nº de scaffolds e contigs que representam o genoma. – A proporção de reads que consegue ser – O comprimento dos contigs e scaffolds relativamente ao comprimento do genoma Genómica MJC21

N50 Tamanho do contig mais curto acima do qual se inclui 50% do genoma Genómica MJC22

Os vários algoritmos devem ser comparados Foi feita uma comparação no artigo GAGE: Genómica MJC23

O algoritmo deve ter em conta Dependendo do organismo – Tamanho diferente dos genomas – Heterozigotia diferente Humanos (1 par de bases pair/1000) Lesmas do mar 1/50– Genómica MJC24

Independentemente do algoritmo… Entra lixo Sai lixo – Muitos sequenciadores têm controlos de qualidade para contaminações, quimeras e erros de leitura Genómica MJC25

MONTAGEM COMPARATIVA Genómica MJC26

Genomas de referência Genomas de mesma espécie ou espécies semelhantes que servem de modelo. Os algoritmos tentam alinhar as sequências obtidas ao que já está sequenciado Genómica MJC27

PROBLEMAS NA MONTAGEM DE GENOMAS Genómica MJC28

Dificuldades Contaminação – Sequências que não pertencem ao genoma que se quer sequenciar. Erros de montagem – As sequências repetidas podem induzir os algoritmos de montagem em erro. As secções podem ser montadas como mais curtas ou sobrepostas pelo que desaparecem do genoma final. Homologia em grande escala. – Nos genomas dos mamíferos há zonas com uma grande percentagem de homologia (>90%) mas que são zonas diferentes do genoma. Como a homologia éusada para fazer os alinhamentos as montagens ficammal feitas. Polimorfismo genómico – Dado que muitos genomas são poliploides a montagem de genomas muitas vezes não consegue distinguir estes polimorfismos como possibilidades alternativas do mesmo locus Genómica MJC29

Efeito das zonas repetidas Genómica MJC30

Genómica MJC31

Bibliografia e/assembly/assembly.shtml e/assembly/assembly.shtml _primer.shtml _primer.shtml Artigo: de novo genome assembly; GAGE ambos na pasta Genómica MJC32