Biotecnologia LZT 310 Antonio Figueira Laboratório de Melhoramento de Plantas Centro de Energia Nuclear na Agricultura Universidade de São Paulo 19-3429-4814 figueira@cena.usp.br
Marcadores Moleculares Introdução e Histórico Descrição de Marcadores Comparação entre Marcadores Moleculares Classificação de Marcadores Moleculares Características do Genoma de Planta Aplicações diversidade genética mapeamento e seleção assistida
INTRODUÇÃO E HISTÓRICO Marcadores Moleculares
Genética “arte” e seleção inconsciente da invenção da agricultura até séc. XIX 1900s - Descoberta dos princípios genéticos 1920-50 - Melhoramento genético científico genética quantitativa e biometria (fenótipo é previsor ruim do valor genético!) 1970-80 - Utilização de marcadores genéticos moleculares
Marcadores genéticos são unidades herdáveis simples Sucesso no melhoramento depende da capacidade de distinguir fatores genéticos herdáveis dos ambientais Marcadores genéticos são unidades herdáveis simples marcadores cromossoma
Polimorfismo de DNA resulta acúmulo de mutações pontual ou inserção/deleção macro-rearranjos: translocações, inversões, deleções
Origem do Polimorfismo Molecular 1. Mutações pontuais - SNPs A. ATCTCGTGATTCCTAGTCGTA TAGAGCACTAAGGGATCAGCAT ex. Sítio EcoRI B. ATCTCGTGATTATAGTCGTA TAGAGCACTAATATCAGCAT 2. Pequenas deleções e/ou inserções - InDels A. ATCTCGTCTAGTCGTA TAGAGCAGATCAGCAT B. ATCTCGT---GTCGTA TAGAGCA---CAGCAT
Marcadores genéticos quando associados a características de interesse aumentam a eficiência de seleção Função da ligação, pleiotropia e ambiente R cromossomo
Mapa de Piracicba “Marcadores” ???
População de São Paulo 9.291.000 habitantes em 2.600.00 domicílios Como achar alguém? E se fosse Tokyo?
Histórico de Marcadores 1. Karl Sax (1923): propôs método para localização de QTLs ligação entre genes de característica qualitativa (cor de semente) e quantitativa (peso de semente); Problema: ausência de mutações múltiplas em estoque de elite, baixa viabilidade 2. Hunter & Markert (1957) - marcas bioquímicas desenvolveram isoenzimas em gel de amido
Histórico de Marcadores 3. Hubby & Lewotin (1966) demonstraram que 30% de loci de isoenzimas exibiam polimorfismo em populações selvagens de Drosophila; 4. 1970’s - ferramentas moleculares desenvolvimento de vetores de clonagem; enzimas de restrição; polimerases; ligases; Southern (1977);
Histórico de Marcadores 5. RFLP proposto por Botstein et al. (1980) descrito para humanos 6. PCR proposto por Mullis & Faloona (1987) 7. VNTR por Jeffrey (1987) 8. RAPD por Rafalski et al. (1990)
Histórico de Marcadores 9. SSR em plantas por Akkaya et al. (1992) 10. AFLP por Zabeau & Vos (1993) 11. CAPS por Konieczny & Ausubel (1993) 12. SCAR por Paran & Michelmore (1993) 13. Cho et al. (1999) - SNPs em Arabidopsis
DESCRIÇÃO DOS MARCADORES MOLECULARES
Marcadores Moleculares RFLP VNTR (minissatélite) RAPD, AP-PCR, DAF PCR-específico - SSR, ISSR, CAPS, SCARs AFLP SNPs
Restriction Fragment Length Polymorphism - RFLP RFLP examina diferença em tamanho de fragmentos de restrição de DNA específicos Polimorfismo deriva de mutação pontual, inserção, deleção Utiliza-se DNA celular total Requer DNA puro de alto peso molecular
Metodologia de RFLP 1 . Digerir DNA em fragmentos pequenos 2. Separação dos fragmentos por gel eletroforese 3. Transferência de fragmentos de DNA para filtro Fonte: IPGRI
Metodologia de RFLP 4. Visualização dos fragmentos de DNA sondas marcadas (32P) ou a frio 5. Análise dos resultados bandas analisadas para alelos e/ou presença/ausência diferenças em padrão de bandas reflete diferenças genéticas A escolha de sonda/enzima de restrição é crucial Fonte: IPGRI
Digestão de DNA Genômico e Separação em Gel 2 5 digestão 4 3 DNA 1 Separação em gel 1 2 3 4 5
Transferência para Membrana de Nylon ou Nitrocelulose 2 3 5 1 4
Hibridização em Nylon ou Nitrocelulose
Construção de biblioteca genômica ou de cDNA mRNA ou DNA Clone cDNA Biblioteca de cDNA
Eletroforese
Hibridização com sonda marcada Exposição em filme de Raios-X
Interpretação de resultados 1 2 3 4 5 6 1 2 3 4 5 6 Sítio alvo para sonda Sítio de restrição Inserção Fonte: IPGRI
RFLP em Cana de Açúcar Sorgo Cana
Hibridização com sonda de sorgo P1 P2 1:1 3:1 Hibridização com sonda de sorgo
Hibridização com sonda de Cana 1:1 3:1 Hibridização com sonda de Cana
Herança de RFLPs A B F1 F2 8 Kb 6 Kb 8 Kb 6 Kb 8 Kb 8 Kb 8 Kb 6 Kb
Análise de Diversidade e Filogenia por RFLP 13 5 6 2 8 A B C 13 11 A B C 9 8 6 5 4 2
RFLP: sondas de locos único DNA Nuclear biblioteca genômica biblioteca de cDNA DNA Citoplasmático biblioteca de DNA cloroplástico e mitocondrial Sondas de RFLP são: locos-específica, co-dominante espécie-específica
RFLP: sondas multi-locus Repetições em linha (tandem) - útil encontrada em vários loci altamente polimórficas Sequência de Minissatélite VNTR: variable number of tandem repeats uso em “DNA fingerprinting” uso de seqüências repetidas de fago M13
Interpretação dos resultados A1A1 A1A2 A2A3 A1 A1 A1 A2 A2 A3 Repetição Sítio de Restrição Fonte: IPGRI
Vantagens e Desvantagens de RFLP Reprodutível Marcadores co-dominantes Simples Trabalhoso Caro Uso de sondas radioativas* Fonte: IPGRI
Random Amplification of Polymorphic DNA - RAPD Amplifica seqüências anônimas de DNA usando primers arbitrários 10 bases com >50% G+C PCR com um único primer Método rápido para detecção de polimorfismos Marcador dominante Problemas de reproducibilidade The random amplified polymorphic DNA (RAPD) technique is a PCR based method which uses one or sometimes two short arbitrary primers (usually 8-10 bases) to amplify anonymous stretches of DNA which are then separated and visualised by gel electrophoresis. The key point about this technique is that nothing is known about the identity of the amplification products. The amplification products are however extremely useful as markers in genetic diversity studies. Other important features of the technique are: The number of fragments. Many different fragments are normally amplified using each single primer, and the technique has therefore proved a fast method for detecting polymorphisms. The majority of commercially produced primers result in 6 to 12 fragments; some primers may fail to give any amplification fragments from some material. Simplicity of the technique. RAPD analysis does not involve hybridisation/autoradiography or high technical expertise. Only tiny quantities of target DNA are required. Arbitrary primers can be purchased. Unit costs per assay are low. This has made RAPD analysis very popular. RAPD markers are dominant. Amplification either occurs at a locus or it does not, leading to scores of band presence/absence; this means that homozygotes and heterozygotes cannot be distinguished. Problems of reproducibility - RAPD does suffer from a sensitivity to changes in PCR conditions resulting in changes to some of the amplified fragments. Reproducible results can be obtained if care is taken to standardise the conditions used (Munthali et al., 1992; Lowe et al., 1996).
RAPD AA AA Aa aa Aa The random amplified polymorphic DNA (RAPD) technique is a PCR based method which uses one or sometimes two short arbitrary primers (usually 8-10 bases) to amplify anonymous stretches of DNA which are then separated and visualised by gel electrophoresis. The key point about this technique is that nothing is known about the identity of the amplification products. The amplification products are however extremely useful as markers in genetic diversity studies. Other important features of the technique are: The number of fragments. Many different fragments are normally amplified using each single primer, and the technique has therefore proved a fast method for detecting polymorphisms. The majority of commercially produced primers result in 6 to 12 fragments; some primers may fail to give any amplification fragments from some material. Simplicity of the technique. RAPD analysis does not involve hybridisation/autoradiography or high technical expertise. Only tiny quantities of target DNA are required. Arbitrary primers can be purchased. Unit costs per assay are low. This has made RAPD analysis very popular. RAPD markers are dominant. Amplification either occurs at a locus or it does not, leading to scores of band presence/absence; this means that homozygotes and heterozygotes cannot be distinguished. Problems of reproducibility - RAPD does suffer from a sensitivity to changes in PCR conditions resulting in changes to some of the amplified fragments. Reproducible results can be obtained if care is taken to standardise the conditions used (Munthali et al., 1992; Lowe et al., 1996). aa
Interpretação de RAPDs Marcadores RAPD são anônimos Dados binários (presença x ausência) RAPD são dominantes (AA = Aa) Problemas de co-migração mesma banda, mesmo fragmento? uma banda, um fragmento? Questionamento para filogenia banda homólogas?
PCR com primers arbitrários: acúmulo de siglas! RAPD Random Amplified Polymorphic DNA DAF DNA Amplification Fingerprinting AP-PCR Arbitrarily Primed Polymerase Chain Reaction MAAP Multiple Arbitrary Amplicon Profiling (sugerido por incluir todas as pequenas variações na técnica) All of the following techniques use one or two, short, GC-rich primers of arbitrary sequence. RAPD was the first to become available (Williams et al., 1990) and is by far the most commonly used of these techniques. DAF - DNA amplication fingerprinting Differences between DAF (Caetano-Anolles, et al., 1991a,b) and RAPD: higher primer concentrations in DAF shorter primers used in DAF (5-8 nucleotides) two-temperature cycle in DAF compared to 3-temperature cycle in RAPD DAF usually produces very complex banding patterns AP-PCR - arbitrarily primed polymerase chain reaction Differences between AP-PCR (Welsh and McClelland, 1990) and RAPD: in AP-PCR the amplification is in three parts each with its own stringency and concentrations of constituents high primer concentrations are used in the first PCR cycles primers of variable length, and often designed for other purposes are arbitrarily chosen for use (e.g. M13 universal sequencing primer) MAAP is only an acronym proposed by Caetano-Anolles et al. (1992) to encompass all of these closely related techniques, but which is not commonly used. Fonte: IPGRI
Diferenças entre ensaios com primers arbitrários RAPD 10mers, gel de agarose corado com brometo DAF 5mers, gel de acrilamida e reação marcada 32P AP-PCR 10mers, gel de acrilamida e reação marcada 32P All of the following techniques use one or two, short, GC-rich primers of arbitrary sequence. RAPD was the first to become available (Williams et al., 1990) and is by far the most commonly used of these techniques. DAF - DNA amplication fingerprinting Differences between DAF (Caetano-Anolles, et al., 1991a,b) and RAPD: higher primer concentrations in DAF shorter primers used in DAF (5-8 nucleotides) two-temperature cycle in DAF compared to 3-temperature cycle in RAPD DAF usually produces very complex banding patterns AP-PCR - arbitrarily primed polymerase chain reaction Differences between AP-PCR (Welsh and McClelland, 1990) and RAPD: in AP-PCR the amplification is in three parts each with its own stringency and concentrations of constituents high primer concentrations are used in the first PCR cycles primers of variable length, and often designed for other purposes are arbitrarily chosen for use (e.g. M13 universal sequencing primer) MAAP is only an acronym proposed by Caetano-Anolles et al. (1992) to encompass all of these closely related techniques, but which is not commonly used.
RAPD - resumo Rápido Simples Baixo custo Sem uso de radio-isótopos Marcador dominante Problemas de reproducibilidade Problemas de interpretação Fonte: IPGRI
RAPD - primer OPJ04 - Bananeira 1500 pb
RAPD - Feijoeiro OPY04 OPAM13
Sítio de Seqüência Dirigida (Sequence-tagged sites) Sequence-Tagged Microssatélites (STMS) ou SSR ou Microssatélites Microssatélites ancorados Inter-Simple Sequence Repeat (ISSR) Sequence-characterized amplified regions (SCARs) Cleaved amplified polymorphic sequence (CAPS) More and more sequence information is becoming available from different sources and can be located in widely available databases. This information is extremely useful for developing new strategies for the analysis of genetic variation. A sequence-tagged site (STS) is the general term given to a marker which is defined by its primer sequences (Olsen et al., 1989). STSs have been used extensively for mapping of the human genome. Examples of STSs are given in the following slides, namely: Sequence-tagged microsatellites (STMS) also known as Simple Sequence Repeat Polymorphisms (SSRP) Anchored microsatellite oligonucleotides including inter-simple sequence repeat (ISSR) primers Sequence-characterised amplified regions (SCARs) Cleaved amplified polymorphic sequence (CAPS) Fonte: IPGRI
Microssatélites (SSR) Sequence-Tagged Microsatélites (STMS) também conhecido como microssatélite ou Simple Sequence Repeat (SSR) Normalmente locus simples e multi-alélico Co-dominante Altamente reprodutível
Microssatélites STMS ou SSRs Seqüências curtas (1 a 6 bases) repetidas em tandem Presentes em procariotos e eucariotos Presentes em regiões codificantes e não codificantes Maioria das repetições são dinucleotídeos (AC) n (AG) n (AT)n
Microssatélites Polimorfismo devido a diferenças no número de repetições Escorregamento da DNA polimerase durante a replicação Crossing-over desigual entre cromátides irmãs Codominantes Normalmente locos simples e multi-alélico
Microssatélites (SSR) altamente informativo - vários alelos por locos detecção por PCR facilmente transferível entre labs distribuição homogênea no genoma
Microssatélites (SSR) Primer FOR NNNNNNNNNNNNNNNNNNNNN CACACACACACACACACAC NNNNNNNNN NNNNN NNNNNNNNNNNNNNNNNNNNN GTGTGTGTGTGTGTGTGTG NNNNNNNNNNNNNN Repetição CA Primer REV
Microssatélites (SSR) Obtenção de seqüências: a partir de banco de dados de genoma ou cDNA hibridação com biblioteca genômica, identificação de clones e seqüenciamento construção de biblioteca enriquecida por afinidade com seqüência da matriz
Microssatélites Detecção do polimorfismo Géis de agarose Géis de acrilamida (detecta diferenças de até 2pb) coloração direta: nitrato de prata (barato) Coloração indireta: marcação radioativa ou fluorescente
Microssatélites Problemas Custo e trabalho envolvidos no desenvolvimento dos primers Construção de bibliotecas genômica sequenciamento Triagem dos melhores primers Possibilidade de se usar seqüências depositadas em banco de dados
Microssatélites (SSR) Primer FOR NNNNNNNNNNNNNNNNNNNNN CACACACACACACACACAC NNNNNNNNN NNNNN NNNNNNNNNNNNNNNNNNNNN GTGTGTGTGTGTGTGTGTG NNNNNNNNNNNNNN Repetição CA Primer REV
Enriquecimento e Seleção Amplificação após enriquecimento Digestão DNA genômico total Seqüência microssatélite Ligação Adaptadores Nicotiana tabacum Adaptadores Amplificação ssDNA Sonda biotinilada Enriquecimento e Seleção ssDNA Coluna Bolinha magnética-estratividina Amplificação após enriquecimento
Enriquecimento e Seleção 95°C / 15 min ssDNA Sonda biotinilada Biotina IIIII(CT)8 ou Biotina IIIII(GT)8 Temperatura ambiente / 20 min água Coluna Magnética
Amplificação após enriquecimento Digestão com RsaI Amplificação após enriquecimento Dna Total Amplificação Nicotiana ripanda N. sylvestris N. tabacum “Coker 176” N. tabacum “Ky 14 RMI” Ligação com adaptadores
Transformação e Seleção Transferência e Southern blot Clonagem Transformação e Seleção Vetor Meio LB + amp + X-gal + IPTG PCR Transferência e Southern blot Sequenciamento Desenho de primers
Até 24/02/05 Todas as placas foram testadas N. tabacum “Coker 176” N. sylvestris
Microssatélites (SSR) Southern blot - clones SSR’s positivos 32P Amplificação insertos clonados
Microssatélites (SSR) (AG)14 (TC)15
(AG)30 >ZZFIGCO001g_A04_.g_033_Rome.ab1 CHROMAT_FILE: CGATTGGGCCGACGTCCATGCTCCGGNNCGCATGTCGGCCGCGGGAATTCGATTCTCTTGCTTACGCGTGGACTAGCTTACAATAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGTTTTGGCTGATGCCTTATCTCAAAAGAAGAAACGACCCTATATATAGAAAAGAAAAAAACAGAAAGAATCTATGCACAGTAAAGTAGGTCCCATATGTGGGTCCCTTATACAGTGTATTTACTGTGTATACAATATTTCTACTATATAAACAATGTATCTACTGTTGAGTGGGTCGGCGGCCTCACTGTTGATCATATTCCACGTCTCTCTAATTCTTTCATCTGTTGGATGAAATCTTCCGCATTTTCTACAGCTTCGTCAGATAATATCTTCTCCGATTGAATAGGCTGAGAATCTTCTGCAATATCATCGTTGCTTGTTTCACTTCGCATTAAAGTGTCAGATTTTTCATACTGGTTAATAGATTGAAGTAAGTTTCTTTTTACTTCTTCCAAATACTTATTAATCAATTTCTATAAGATAAACATATAAGTTCAGATCCAGGCACATAATTATAACCATGCGTTTTCACACGTATTTGTCAAAATAAGTCTGCATTTCTCACTTCTTTTTCCTGGTTAAGACCCGTTATACCCTCCAATTATACTTGGAACACCTTTTATCGGCGCTATTTATCCTTTTACTAGCATAGATTCTAAAGGATTTACCACAACTTATAAAAATAAAAGAATAGGTTATACCTTTGTTACCGATCCCGTAACTAGGGGATATAATGGCTTTATTAGATATAAATCCAAAATATATT (AG)30
Microssatélites Bananeira 3x e 4x Cir 24.25
Microssatélites Seta: alelos genoma B
Microssatélites Ancorados ISSR Amplificação de segmentos genômicos flanqueados por repetições Anelamento locos-específico Inter-simple sequence repeats (ISSR) ancorados na extremidade 3’ ou 5’ Marcadores dominantes Microssatélites mais úteis que minissatélites
Microssatélites Ancorados ISSR NNNNN (CA) n (CA) n NN NNNNNNNNN CACACACACACACAC NNNNNNNNNNNN CACACACACACACAC NNNNN NNNNNNNNNGTGTGTGTGTGTGTG NNNNNNNNNNNN GTGTGTGTGTGTGTG NNNNN Repetição CA (CA) n NN NNNNN (CA) n ISSR 5’ ou 3’ancorado
Nanicão Jangada Control ISSR UBC 811 UBC 816 Variante Anão Nanicão Jangada Control N A
SCARs SCARs - sequence-characterised amplified regions proposto por Paran & Michelmore (1993) marcador locus-único derivado de fragmentos sequenciados de RAPD, ISSR, AFLP maior estabilidade - primers específicos analisado para presença/ausência possibilidade de simplificação de análise e automação
SCARs R S * clonar Primer específico Seqüenciar
SCAR - Feijoeiro ROC20460
CAPS ou PCR-RFLP CAPS - cleaved amplified polymorphic sequence marcador locus-específico produto amplificado por PCR e analisado por RFLP seqüência de banco de dados, clones de cDNA ou genômico codominante
CAPS Locus Seqüenciado - primers específicos Enzimas de Restrição AluI HaeIII MboI PCR específico A B A B A B A B locus 1 Digestão com Enzimas Corte freqüente 2
CAPS - Feijoeiro
CAPS - Feijoeiro
Amplified Fragment Length Polymorphism - AFLP Combinação de RFLP e PCR Resulta em padrões muito informativos Marcador dominante Método cada vez mais usado
digestão com duas enzimas EcoRI MseI DNA genômico digestão com duas enzimas EcoRI adaptadores MseI EcoRI ligação pré-amplificação amplificação seletiva
DNA digestão ligação pré- amplificação primer +1 amplificação GAATTCCN NTTAA CTTAAGCN NAATT digestão ATTCCN NT MseI EcoRI GCN NAAT ATTCCN NT TA ligação TAA GCN N AT A pré- amplificação primer +1 ATTCCN NTTA TAAGCN NAAT C AAC amplificação primer +3 ATTCCA GTTA TAAGCT CAAT AAC
AFLP de cana com 33P
AFLP de feijão gel desnaturante corado com prata
COMPARAÇÃO ENTRE MARCADORES MOLECULARES
Marcadores derivados de Retrotransposons
Escolha de Marcadores Característica RFLP RAPD SSR AFLP ISSR CAPS Polimorfismo Pontual Pontual # Pontual Pontual Pontual InDel InDel Rep. InDel InDel InDel Nível de Polimorfismo médio médio alto médio médio baixo Abundância alta m.alta média m.alta média alta Dominância CoDom Dom CoDom Dom Dom CoDom [DNA] 10 mg 25 ng 50 ng 500 ng 25 ng 25 ng Seqüência não não sim não não sim Marcação sim/não não não sim/não não não Repetibilidade alta baixa alta média baixa alta
CLASSIFICAÇÃO DE MARCADORES MOLECULARES
Classificação por Tipo de Técnica Métodos sem uso de PCR RFLP VNTR Métodos com uso de PCR PCR com primers arbitrários RAPD, AP-PCR, DAF, MAAP; Polimorfismo de Tamanho de Fragmento Amplificado AFLP; ISSR PCR sítio-específico CAPS, SCAR SSRs (microssatélites) TGGE, SSCP, DGGE
Classificação por Número de Cópias da Seqüência Alvo Seqüência de poucas cópias - codificante RFLP Seqüência com cópias repetidas VNTR SSRs (microssatélites) ISSR Seqüência com número de cópias indefinido RAPD, AP-PCR, DAF, MAAP; AFLP; CAPS, SCAR
Zucchi, M. 2004
Zucchi, M. 2004
Arabidopsis – Single Nucleotide Polymorphism comparação de seqüência entre 82 Mb de Columbia x 92,1 Mb Landsberg SNPs: 25.274 (1 SNP por 3,3 kbp) exon = 3,1 kb intron = 2,2 kb intergênico = 3,5 kb InDels: 14.570 (1 InDel por 6,1 kbp) 98% < 50 pb http://www.arabidopsis.org/cereon 37.344 SNPs/18.579 Indels AGI et al. 2000. Nature 408:796
arroz indica x japonica Nipponbare GLA (japonica) (indica) 11,8 Mb 0,9 Mb SNPs em seqüência repetida (%) 0,88 0,65 InDels em seqüência repetida (%) 0,33 0,27 SNPs em seqüência única (%) 0,50 0,50 InDels em seqüência única(%) 0,14 0,15 Fração de seqüência repetida (%) 24,1 22,8 Fração de seqüência única (%) 74,8 74,1 Parte não alinháveis por BLAST (%) 1,1 3,1 Diferenças em nt arroz indica x japonica Yu et al. 2002. Science 296:79
Milho seqüências de 21 locos cromossomo 1 16 landraces exóticas + 9 linhas média: 1 SNPs por 28 pb entre dois genótipos: 1 SNP por 104 pb InDels: 24% de 14,42 kb Milho = 1,4 X mais variável do que Drosophila = 11 X mais variável do que humanos Tenaillon et al. 2001. PNAS 98:9161
APLICAÇÕES DOS MARCADORES MOLECULARES
Aplicações no Melhoramento Diversidade genética e filogenia Conservação e caracterização de germoplasma Identificação de acessos Seleção de genitores Filogenia Mapeamento genômico Seleção Assistida por Marcadores - MAS Clonagem de genes por caminhamento
Zucchi, M. 2004
Diversidade genética Marcadores Multialélicos locos de RFLP = região hibridizada com sonda endonuclease: sítios de restrição interno na sonda locos parálogos = família de genes Microssatélites = loco definido pelos primers duplicação de locos Marcadores Binários -> presença x ausência RADP, AFLP, ISSR: cada banda, um loco sem definição de homologia, apenas no primer
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Zucchi, M. 2004
Diversidade genética Marcadores Multialélicos - RFLP e SSR parâmetros de genética de populações % de locos polimórficos, # médio de alelos/locos; índice de diversidade de Nei, etc. Marcadores Binários - RADP e AFLP número de alelos = 2 (presença x ausência) frequência alélica: depende equilíbrio HW ou homozigoze total utiliza-se similaridade genética
Análise de Relações Genéticas Marcadores Binários Vários índices de similaridade Nei & Li, Dice, Jaccard, Simples Métodos Fenéticos: similaridade entre amostras -> análise de agrupamento (cluster) dendrograma por UPGMA, Neighbor-Join -> análise de Coordenadas Principais mutlidimensional (2D ou 3D) Programas: NtSys-Pc (Exeter Software) WinBoot - análise de bootsrap
Análise de Relações Genéticas Marcadores Binários Dissimilaridade = (1 – Similaridade) Baseada em dados binários (presença x ausência) portanto marcadores dominantes Distância Genética = utiliza freqüências alélicas – marcadores co-dominantes Utiliza conceito genéticos e/ou geométricos
Zucchi, M. 2004
Análise de Relações Genéticas Marcadores Binários número de alelos = 2 (presença x ausência) utiliza-se similaridade genética Construção de matriz amostra x estado marcador A 1 0 1 1 1 1 B 1 0 1 1 1 0 C 1 1 0 1 0 1 Construção de matriz de similaridade A B C A 1.0 -- -- B 0,88 1,0 -- C 0,66 0,5 1,0
Diversidade genética Frequência alélica permite estimar medidas de diversidade genética e estrutura genética de populações % de locos polimórficos, # médio de alelos/locos; índice de diversidade de Nei, Estatísticas F de Wright, etc. Programas: PAUP, TFPGA, PHYLLIP, Genetix
Marcadores no Mapeamento Genético
Mapeamento Genético Mapa genômico define arranjo dos vários locos Representação gráfica de cromossomos Distância entre locos definida por recombinação cMorgans -taxa de recombinação
Drosophila – mapa genético com marcas morfológicas
Aplicações do Mapeamento Genético Mapas genéticos possibilitam: Cobertura e análise completa do genoma Decomposição de características genéticas complexas nos seus componentes mendelianos Localização de regiões genômicas que controlam características de importância econômica Quantificação do efeito destas regiões sobre a característica
Mapeamento Genético Requisitos Básicos: Reprodução sexuada e produção de descendentes Marcadores devem apresentar segregação Mendeliana na progênie avaliada Produzir gerações em desequilíbrio de ligação para os locos segregantes, permitindo a análise da ligação
Mapeamento Genético Desequilíbrio de ligação desvio das freqüências alélicas observadas em relação às freqüências esperadas sob a hipótese da segregação independente, sugerindo uma associação entre locos
Mapeamento Genético 2 (fo – fe)2 = fe Associação entre dois locos localizados num mesmo cromossomo, para os quais as proporções genotípicas esperadas após um determinado cruzamento se afastam das proporções mendelianas Teste: 2 (fo – fe)2 fe =
Principais delineamentos Seleção de população a ser mapeada genitores de elite x exótico F2 BC1 linhas recombinantes endógenas (RI) (>F8) haplóides duplicados F1 - pseudo-testcross
Principais delineamentos Populações F2 F1 AB Ab aB ab Genitor A x Genitor B AB/AB ab/ab AB/ab F2 F1 AB Ab aB ab AB/AB ab/Ab AB/aB AB/ab Ab/AB Ab/Ab Ab/aB Ab/ab aB/AB aB/Ab aB/aB aB/ab Ab/AB ab/Ab ab/aB ab/ab
Populações F2 Ex. Marcador RFLP Segregação 1:2:1 AA aa Aa Aa Aa AA aa Aa aa AA aa Aa AA aa Aa AA Aa Segregação 1:2:1
Principais delineamentos Populações obtidas por retrocruzamentos (backcross) Parental A x Parental B AB/AB ab/ab F1 x Parental B AB/ab ab/ab F1 AB Ab aB ab AB/ab Ab/ab aB/ab ab
Populações obtidas por retrocruzamento Ex. Marcador RFLP AA aa Aa AA AA AA Aa Aa Aa AA Aa AA AA Aa Aa Aa Aa Segregação 1:1
Principais delineamentos Pseudo-testcross usado para espécies heterozigotas (fruteiras e florestais) e espécies poliplóides Gerações F1 semelhante a geração F2 Usado com marcadores dominantes P1 = Aa bb Cc dd x P2 = aa Bb cc Dd Aa:aa bb:Bb Cc:cc dd:Dd Segregação 1:1 presença/ausência
Construindo um mapa de locos de herança simples
Ex. marcador RFLP
Genótipos parentais para os locos A e B Parental 1 = AA BB Parental 2 = aa bb Marcadores para cada loco (A e B) segregam mendelianamente? Loco A: 50% AA, 50% aa Loco B: 50% BB, 50% bb Teste 2 Aa Bb F1 dihaplóides
Ex. marcador RFLP
Genótipos parentais para os locos A e B gametas Parental 1 = AA BB Parental 2 = aa bb Genótipos segregam mendelianamente para os locos A e B conjuntamente? Delineamento dihaplóide – genótipos AABB, aabb, AAbb, aaBB (1:1:1:1) Se não ligados Ab + aB = 50% Aa Bb F1 AB ab Ab aB
Ex. marcador RFLP
A proporção dos genótipos observados difere do esperado? 2 (fo – fe)2 fe = (O) (E) (O – E)2 (O – E)2/E AABB 6 3,75 5,06 1,3 aabb 7 10,56 2,8 aaBB 1 7,56 2,0 AAbb 2 = 8,1* (P) (R) Gl = 3
Freqüência de recombinantes (c) total cAB = 2/15 = 0,133 c = B A 13,3 cM
Para um terceiro loco (C) Parental 1 = AA CC Parental 2 = aa cc F1 AaCc (P) AA CC 6 (P) aa cc 6 (R) AA cc 2 (R) aa CC 1 cAC = 3/15 cAC = 0,2 C A B 13,3 6,7 20 cM
Freqüências de recombinação entre dois locos não são aditivas! Interferência: ocorrência de um crossing reduz a probabilidade de outro crossing em regiões adjacentes CAC = CAB + CBC – 2CABCBC CAC = 0,133 + 0,067 – 2(0,133)(0,067) CAC = 0,182 C A B 13,3 6,7 18,2 cM
Funções de mapeamento Propriedades corrigem distâncias calculadas em cM para porcentagem de recombinantes (c) 1 cM = 1% recombinação Propriedades Distâncias entre os locos aditivas (AC = AB + BC) Distâncias > 50 cM: fração recombinação 50% (locos não ligados)
Funções de Mapeamento Função de Haldane (1919) Propriedades Permutas ocorrem ao acaso ao longo do cromossomo Ocorrência de permutas independentes, sem interferência d = - ½ ln (1 – 2c)
Funções de Mapeamento Função de Kosambi (1954) Propriedades Interferência completa entre regiões muito próximas, interferência menor locos mais distantes e I = 0 para locos independentes. d = ¼ ln [ (1 + 2c) (1 – 2c)]
Programas computacionais para mapeamento Linkage 1 (Suiter et al., 1983) MapMaker (Lander et al. 1987) GMendel (Liu & Knapp, 1992) JoinMap (Stam, 1993) QTL Cartographer (Basten et al., 1999)
Mapa genético de Musa acuminata, obtidos a partir de 373 marcadores Mapa publicado (Fauré et al., 1993). Progênies de SFB5, M53 e SF265 autofecundado Mapa genético de Musa acuminata, obtidos a partir de 373 marcadores (isoenzimas, RAPD, RFLPs, AFLP e SSR).
GL 7 transgene Cor do fruto
Mapeamento de Caracteres quantitativos Características Quantitativas: Segregação de grande número de genes para o caráter Cada gene contribui com pequeno efeito para o valor fenotípico total Genes apresentam ações gênicas aditiva, dominante e sobredominante A expressão do fenótipo é altamente influenciada pelo ambiente Os dados apresentam distribuição normal Pode-se caracterizar o tipo de ação gênica comparando-se as médias fenotípicas das gerações segregantes com as médias parentais
Mapeamento de Caracteres quantitativos QTL: genes ou locos cromossômicos que controlam uma determinada característica quantitativa Exemplos: produção, teor de sacarose, altura da planta, rendimento de madeira, ciclo, peso Marcadores moleculares possibilitam identificar, mapear e medir a magnitude do efeito dos principais fatores genéticos envolvidos no controle do caráter
Mapeamento de Caracteres quantitativos A capacidade de se detectar um QTL depende: Magnitude se seu efeito sobre o caráter Tamanho da população segregante Freqüência de recombinação entre o marcador e o QTL Herdabilidade da característica
Mapeamento de Caracteres quantitativos Uso do Mapeamento genético Identificação de QTLs Seleção assistida Clonagem por posicionamento