A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Genómica Licenciatura em Ciências Biomédicas

Apresentações semelhantes


Apresentação em tema: "Genómica Licenciatura em Ciências Biomédicas"— Transcrição da apresentação:

1 Genómica Licenciatura em Ciências Biomédicas
Departamento de Ciências da Saúde, UCP Fevereiro 2013

2 Sumário 3. Montagem de genomas Montagem hierárquica
Montagem de genomas completos Montagem de genomas com base em modelos Problemas associados à montagem dos genomas Controlo de qualidade Genómica MJC

3 Montagem de genomas Após a sequenciação temos fragmentos (de tamanhos que vão de 1000 a 40 pbs) que é preciso reordenar na sequência original. Sobreposições em média de duas centenas de pares de bases. Equivale a ter um puzzle de 30 milhões de peças Aumenta o número de peças para 2-3 triliões. Genómica MJC

4 Aumentamos o nº de vezes que cada peça é sequenciada!
Algumas das peças… Faltam Problemas na construção das bibliotecas Problemas com a amplificação por PCR Têm erros Zonas repetitivas Erros no PCR Aumentamos o nº de vezes que cada peça é sequenciada! Entre 8 e 100 vezes Genómica MJC

5 A sequência (read) ideal
É longa Não tem erros (tem bons algoritmos de “base calling”). Genómica MJC

6 Podemos considerar 2 tipos
Única (single read) Resulta da sequenciação do fragmento em si. Emparelhada (paired read) Nestas leituras eu sei a sequência das pontas e a que distância estão uma da outra. Genómica MJC

7 Tendo as sequências o desafio é ordená-las
Genómica MJC

8 Ordená-la “limpá-la” Obter a sequência Genómica MJC

9 A forma como a montagem é feita
Depende de haver ou não um genoma de referência: Se há usa-se como modelo Se não há deve usar-se outras informações como informações do exoma por exemplo. Genómica MJC

10 Alguns algoritmos de montagem
Genómica MJC

11 Problemas na montagem de short reads
E as que não “encaixam”? Sequencias repetidas no genomade referência? Errosd de sequenciação Balanço entre encontrar o emparelhamento e gerar o mapa? É assim tão importante que encaixem todas as reads? A capacidade/ resultados dependem não só do algoritmo usado como dos parâmetros descritos para cada algoritmo. Genómica MJC

12 Quando a montagem é de novo
Genómica MJC

13 Montagem hierárquica ou de clones
Genómica MJC

14 Abordagem usada para alinhar grandes inserções clonadas
Primeiro é feito o mapeamento dos clones por padrões de digestão, marcadores de linkage ou mutações induzidas. Genómica MJC

15 Desse mapeamento…. Escolhem-se os fragmentos a vermelho pois implicam a menor sobreposição. É feita a sequenciação desses fragmentos: Cada sequenciação (read) é avaliada quanto à sua qualidade. É reconstruida a sequencia inicial usando as sobreposições. Genómica MJC

16 Montagem de genomas completos
Genómica MJC

17 Método mais aplicado atualmente
Uma vez que a maioria da sequenciação já não implica clonagem. Dispensa o passo do mapeamento. São sequenciadas as extremidades dos vários fragmentos que são depois alinhadas. Genómica MJC

18 Desse alinhamento surge o “contig”
Inclui 3 fases: Sobreposição Alinhamento Consenso Genómica MJC

19 Desse alinhamento surge o “contig”
A localização vai ser determinada pela homologia Genómica MJC

20 Vários contigs dão um scaffold
Genómica MJC

21 Genómica MJC

22 Alguns algoritmos de montagem de genomas
Genómica MJC

23 Greedy Como a homologia é a única condição este tipo de algoritmos é muito influenciado pelas sequências repetitivas ou homologias. Genómica MJC

24 Overlap-Layout-Consensus
Todas as sobreposições são mapeadas (Overlap) É eliminada a informação redundante (Layout) Usando a teoria de grafos é desenhado o mapa mais simples e que corresponderá à organização inicial. Genómica MJC

25 Overlap-Layout-Consensus
Pode ser substituído pelo: Align-Layout-Consensus pois já há vários genomas de referência sequenciados. Genómica MJC

26 Controlo de qualidade Genómica MJC

27 Em genomas de novo Não se sabe quase nada
Nº de scaffolds e contigs que representam o genoma. A proporção de reads que consegue ser O comprimento dos contigs e scaffolds relativamente ao comprimento do genoma. Genómica MJC

28 N50 Tamanho do contig mais curto acima do qual se inclui 50% do genoma. Genómica MJC

29 Os vários algoritmos devem ser comparados
Foi feita uma comparação no artigo GAGE: Genómica MJC

30 O algoritmo deve ter em conta
Dependendo do organismo Tamanho diferente dos genomas Heterozigotia diferente Humanos (1 par de bases pair/1000) Lesmas do mar 1/50–100 Genómica MJC

31 Independentemente do algoritmo…
Entra lixo Sai lixo Muitos sequenciadores têm controlos de qualidade para contaminações, quimeras e erros de leitura. Genómica MJC

32 Montagem comparativa Genómica MJC

33 Genomas de referência Genomas de mesma espécie ou espécies semelhantes que servem de modelo. Os algoritmos tentam alinhar as sequências obtidas ao que já está sequenciado Genómica MJC

34 Problemas na Montagem de Genomas
Genómica MJC

35 Dificuldades Contaminação Erros de montagem
Sequências que não pertencem ao genoma que se quer sequenciar. Erros de montagem As sequências repetidas podem induzir os algoritmos de montagem em erro. As secções podem ser montadas como mais curtas ou sobrepostas pelo que desaparecem do genoma final. Homologia em grande escala.  Nos genomas dos mamíferos há zonas com uma grande percentagem de homologia (>90%) mas que são zonas diferentes do genoma. Como a homologia éusada para fazer os alinhamentos as montagens ficammal feitas. Polimorfismo genómico Dado que muitos genomas são poliploides a montagem de genomas muitas vezes não consegue distinguir estes polimorfismos como possibilidades alternativas do mesmo locus. Genómica MJC

36 Efeito das zonas repetidas
Genómica MJC

37 Genómica MJC

38 Bibliografia Artigo: de novo genome assembly; GAGE ambos na pasta Genómica MJC


Carregar ppt "Genómica Licenciatura em Ciências Biomédicas"

Apresentações semelhantes


Anúncios Google