A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA

Apresentações semelhantes


Apresentação em tema: "COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA"— Transcrição da apresentação:

1 COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA
CAPES Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA Sousa1, T.H.S.;Delbem2, A.C.B.; Policastro2, A.C.; Garrat, 4R. C. 1Bioengenharia-São Carlos-USP; 2ICMC-São Carlos-USP, 4IFSC- São Carlos - USP

2 sumário Motivação Introdução Objetivo Materiais e Métodos Resultados
Conclusão

3 _________________________________________________________MOTIVAÇÃO
Evolução in vitro Método laboratorial para a evolução de moléculas por meio de mutações. Obtenção de propriedades desejadas. Evolução de proteínas in vitro. descobrimento de novas drogas. cura de muitas doenças de origem genética. Técnica de alto custorequer longo período de tempo.

4 PROTEÍNAS Componentes fundamentais de todos os seres vivos.
______________________________________________________INTRODUÇÃO PROTEÍNAS macromoléculas direta ou indiretamente responsáveis pelo desempenho de praticamente todas as funções metabólicas, estruturais, imunológicas e reprodutivas nos organismos vivos. Componentes fundamentais de todos os seres vivos. Moléculas orgânicas mais abundantes das células. LEHNINGER, 1976

5 PROTEÍNAS Algumas de suas principais funções:
______________________________________________________INTRODUÇÃO PROTEÍNAS Principais elementos: C, H, N , O e S. Elementos adicionais: P, Fe, Zn e Cu. Elementos liberados por hidrólise: Aminoácidos ou -aminoácidos Algumas de suas principais funções: Catálize enzimática; Transporte e armazenamento; Sustentação mecânica; Proteção imunitária e outras.

6 Conformação das proteínas
______________________________________________________INTRODUÇÃO Conformação das proteínas Proteínas fibrosas Proteína Globulares

7 ______________________________________________________INTRODUÇÃO
AMINOÁCIDOS 20 aminoácidos são encontrados nas proteínas (padrão) Classificados Grupamentos R Polaridade: Hidrofóbicos, Hidrofílicos, Básicos e Ácidos

8 ______________________________________________________INTRODUÇÃO
HEMOGLOBINA Proteínas, contidas nas hemácias, responsáveis pelo transporte de O2 , CO2, e íons de H+ . A Hb contém 2 cadeias  (141 a.a) e 2 cadeias  (146 a.a) liga-se a cada cadeia um grupo heme

9 ________________________________________________________INTRODUÇÃO
HEMOGLOBINA Desoxihemoglobina Estado T Oxiemoglobina Estado R

10 Aprendizado de Máquina
________________________________________________________INTRODUÇÃO Aprendizado de Máquina AM é uma área de pesquisa computacional  objetivo é desenvolvimento de sistemas computacionais capazes de aprenderem e adquirirem conhecimento de forma automática. Algoritmos de Aprendizado: Programa computacional capaz de tomar decisões baseadas em soluções de problemas anteriores. Exemplos de técnicas de AM: Redes Neurais, SVM, técnica de Árvores de Decisão e Algoritmos Genéticos.

11 ______________________________________________________OBJETIVO
Propomos neste trabalho investigar técnicas computacionais inteligentes capazes de determinar a funcionalidade de proteínas mutantes a partir das seqüências de aminoácidos e classificar de maneira correta as mutações da proteína hemoglobina para em seguida predizer as características de uma nova mutação.

12 1) Proteínas (Hemoglobinas - Hb).
________________________________________________MATERIAIS E MÉTODOS Foram realizados dois estudos: 1) Proteínas (Hemoglobinas - Hb). Foram utilizadas as cadeias alfa e beta da proteína HB  Com 141 e 146 aminoácidos respectivamente. Um cojunto de dados de proteínas disponíveis em: e adquiridas estruturas primárias da Hb (mutantes) associadas ou não a uma patologia com suas respectivas classificações seqüência original da proteína estudada.

13 2) Técnicas computacionais inteligentes.
________________________________________________MATERIAIS E MÉTODOS 2) Técnicas computacionais inteligentes. A técnica computacional (AM) Algoritmos C 4.5, Algoritmo SMO, Random Forest, Kstar e FLR para a verificação da funcionalidade de hemoglobinas. Programa Weka (Waikato Environment Knowledge Analysis) versão 3.2, composto por um conjunto de algoritmos de AM implementados em Java, disponível no site index.htm.

14 ________________________________________________MATERIAIS E MÉTODOS
METODOLOGIA Os experimentos seguiram a metodologia 10-fold-cross-validation. As seqüências foram aleatoriamente separadas em 10 grupos de tamanhos aproximadamente iguais Um grupo foi utilizado como conjunto de novas seqüências apresentadas ao sistema para o aprendizado 9 grupos restantes foram utilizados como seqüências de treinamento dos demais algoritmos. Após cada treinamento utilizando os 9 grupos, o grupo de teste foi apresentado ao sistema e a média dos erros foi calculada esse processo foi repetido para os 9 grupos restantes.

15 Testes realizados  AM e AG
________________________________________________________RESULTADOS RESULTADOS Testes realizados  AM e AG A Tabela 1  apresenta os resultados dos testes que foram realizados com a cadeia alfa da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos. A Tabela 2  apresenta os resultados dos testes que foram realizados com a cadeia beta da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos.

16 ________________________________________________________RESULTADOS
Tabela 1 - Erro médio para os indivíduos Heterozigotos da cadeia alfa Algoritmo Erro Médio Boas Ruins Total C 4.5 17.9% 114 25 139 SVM 18.7% Random Forest Kstar 19.4% FLR 23.7% Tabela 2 - Erro médio para os indivíduos Heterozigotos da cadeia beta Algoritmo Erro Médio Boas Ruins Total C 4.5 36.2% 88 50 138 SVM 29.7% Random Forest 33.3% Kstar 26.8% FLR 31.8%

17 ________________________________________________________RESULTADOS
A Tabela 3  apresenta os testes que foram realizados com a cadeia beta da proteína Hemoglobina com o Algoritmo Genético  Filtro objetivo era selecionar ainda mais as entradas para os classificadores. A Tabela 4  apresenta os resultados dos testes realizados com a cadeia beta da proteína HemoglobinaAlgoritmo Genético.

18 ________________________________________________________RESULTADOS
Tabela 3 -Algoritmos Genéticos/ Cadeia Beta/ Filtro Algoritmo Erro Médio Boas Ruins Total C 4.5 3.6% 197 186 383 SVM 2.1% 383 Tabela 4 - Algoritmos Genéticos/ Cadeia Beta Algoritmo Erro Médio Boas Ruins Total C 4.5 SVM 1.8 % 197 186 383 197 186 383 1.6 %

19 __________________________________________________________ CONCLUSÃO
Os testes realizados com os algoritmos escolhidos apresentaram um resultado esperado quando se utilizam técnicas de aprendizado que requerem bancos de dados numerosos. A utilização de técnicas de aprendizado de máquina, por exemplo, o C 4.5, permite a construção de árvores de decisões que podem revelar a lógica de como é determinada a função de proteínas.

20 __________________________________________________________ CONCLUSÃO
Como apresentado nos resultados experimentais o uso do Algoritmo Genético permitiu que se alcançassem resultados bastante significativos. Como etapa futura a ser investigada está a criação de um software capaz de predizer futuras mutações da proteína estudada, a partir dos conhecimentos adquiridos.


Carregar ppt "COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA"

Apresentações semelhantes


Anúncios Google