A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013.

Apresentações semelhantes


Apresentação em tema: "Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013."— Transcrição da apresentação:

1 Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013

2 Sumário 3. Montagem de genomas Montagem hierárquica Montagem de genomas completos Montagem de genomas com base em modelos Problemas associados à montagem dos genomas – Controlo de qualidade Genómica MJC2

3 Aumenta o número de peças para 2-3 triliões. Sobreposições em média de duas centenas de pares de bases. Equivale a ter um puzzle de 30 milhões de peças Montagem de genomas Após a sequenciação temos fragmentos (de tamanhos que vão de 1000 a 40 pbs) que é preciso reordenar na sequência original Genómica MJC3

4 Algumas das peças… Faltam – Problemas na construção das bibliotecas – Problemas com a amplificação por PCR Têm erros – Zonas repetitivas – Erros no PCR Genómica MJC4 Aumentamos o nº de vezes que cada peça é sequenciada! Entre 8 e 100 vezes

5 A sequência (read) ideal É longa Não tem erros (tem bons algoritmos de base calling) Genómica MJC5

6 Podemos considerar 2 tipos Única (single read) – Resulta da sequenciação do fragmento em si. Emparelhada (paired read) – Nestas leituras eu sei a sequência das pontas e a que distância estão uma da outra Genómica MJC6

7 Tendo as sequências o desafio é ordená-las Genómica MJC7

8 Ordená-la limpá- la Obter a sequência Genómica MJC8

9 A forma como a montagem é feita Depende de haver ou não um genoma de referência: – Se há usa-se como modelo – Se não há deve usar-se outras informações como informações do exoma por exemplo Genómica MJC9

10 Alguns algoritmos de montagem Genómica MJC10

11 Problemas na montagem de short reads E as que não encaixam? – Sequencias repetidas no genomade referência? – Errosd de sequenciação – Balanço entre encontrar o emparelhamento e gerar o mapa? É assim tão importante que encaixem todas as reads? – A capacidade/ resultados dependem não só do algoritmo usado como dos parâmetros descritos para cada algoritmo Genómica MJC11

12 Quando a montagem é de novo Genómica MJC12

13 MONTAGEM HIERÁRQUICA OU DE CLONES Genómica MJC13

14 Abordagem usada para alinhar grandes inserções clonadas – Primeiro é feito o mapeamento dos clones por padrões de digestão, marcadores de linkage ou mutações induzidas Genómica MJC14

15 Desse mapeamento… Genómica MJC15 Escolhem-se os fragmentos a vermelho pois implicam a menor sobreposição. É feita a sequenciação desses fragmentos: – Cada sequenciação (read) é avaliada quanto à sua qualidade. – É reconstruida a sequencia inicial usando as sobreposições.

16 MONTAGEM DE GENOMAS COMPLETOS Genómica MJC16

17 Método mais aplicado atualmente Uma vez que a maioria da sequenciação já não implica clonagem. Dispensa o passo do mapeamento. São sequenciadas as extremidades dos vários fragmentos que são depois alinhadas. Genómica MJC

18 Desse alinhamento surge o contig Genómica MJC 18 Inclui 3 fases: – Sobreposição – Alinhamento – Consenso

19 Desse alinhamento surge o contig Genómica MJC 19 A localização vai ser determinada pela homologia

20 Vários contigs dão um scaffold Genómica MJC 20

21 Genómica MJC21

22 ALGUNS ALGORITMOS DE MONTAGEM DE GENOMAS Genómica MJC22

23 Greedy Como a homologia é a única condição este tipo de algoritmos é muito influenciado pelas sequências repetitivas ou homologias Genómica MJC23

24 Overlap-Layout-Consensus Todas as sobreposições são mapeadas (Overlap) É eliminada a informação redundante (Layout) Usando a teoria de grafos é desenhado o mapa mais simples e que corresponderá à organização inicial Genómica MJC24

25 Overlap-Layout-Consensus Pode ser substituído pelo: Align-Layout-Consensus pois já há vários genomas de referência sequenciados Genómica MJC25

26 CONTROLO DE QUALIDADE Genómica MJC26

27 Em genomas de novo Não se sabe quase nada – Nº de scaffolds e contigs que representam o genoma. – A proporção de reads que consegue ser – O comprimento dos contigs e scaffolds relativamente ao comprimento do genoma Genómica MJC27

28 N50 Tamanho do contig mais curto acima do qual se inclui 50% do genoma Genómica MJC28

29 Os vários algoritmos devem ser comparados Foi feita uma comparação no artigo GAGE: Genómica MJC29

30 O algoritmo deve ter em conta Dependendo do organismo – Tamanho diferente dos genomas – Heterozigotia diferente Humanos (1 par de bases pair/1000) Lesmas do mar 1/50– Genómica MJC30

31 Independentemente do algoritmo… Entra lixo Sai lixo – Muitos sequenciadores têm controlos de qualidade para contaminações, quimeras e erros de leitura Genómica MJC31

32 MONTAGEM COMPARATIVA Genómica MJC32

33 Genomas de referência Genomas de mesma espécie ou espécies semelhantes que servem de modelo. Os algoritmos tentam alinhar as sequências obtidas ao que já está sequenciado Genómica MJC33

34 PROBLEMAS NA MONTAGEM DE GENOMAS Genómica MJC34

35 Dificuldades Contaminação – Sequências que não pertencem ao genoma que se quer sequenciar. Erros de montagem – As sequências repetidas podem induzir os algoritmos de montagem em erro. As secções podem ser montadas como mais curtas ou sobrepostas pelo que desaparecem do genoma final. Homologia em grande escala. – Nos genomas dos mamíferos há zonas com uma grande percentagem de homologia (>90%) mas que são zonas diferentes do genoma. Como a homologia éusada para fazer os alinhamentos as montagens ficammal feitas. Polimorfismo genómico – Dado que muitos genomas são poliploides a montagem de genomas muitas vezes não consegue distinguir estes polimorfismos como possibilidades alternativas do mesmo locus Genómica MJC35

36 Efeito das zonas repetidas Genómica MJC36

37 Genómica MJC37

38 Bibliografia e/assembly/assembly.shtml e/assembly/assembly.shtml _primer.shtml _primer.shtml Artigo: de novo genome assembly; GAGE ambos na pasta Genómica MJC38


Carregar ppt "Genómica Licenciatura em Ciências Biomédicas Departamento de Ciências da Saúde, UCP Fevereiro 2013."

Apresentações semelhantes


Anúncios Google