COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA

Slides:



Advertisements
Apresentações semelhantes
Sistema robótico baseado em controladores de redes neurais
Advertisements

Agenda Introdução Justificativa Objetivo Detecção de Spam
Aprendizado de Máquina
INTELIGÊNGIA COMPUTACIONAL
LOT-SIZE PROBLEM   PROBLEMA DE DIMENSIONAMENTO DE LOTES COM VÁRIOS CENTROS DE PRODUÇÃO. Sheila Souza Lino.
Mineração de Dados Avaliação de Classificadores
Construção de modelos tridimensionais de macromoléculas
Araken de Medeiros Santos Anne Magály de Paula Canuto
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
INTRODUÇÃO À BIOQUÍMICA DA CÉLULA
COMPOSIÇÃO MOLECULAR DA CÉLULA
INTRODUÇÃO A INFORMÁTICA
Aprendizado de Máquina
Inteligência Artificial
Instituto de Computação - UNICAMP
Sistemas Baseados em Conhecimento
Informática Industrial
Computação Evolutiva: Programação Genética
Modelagem e simulação de sistemas
O Surgimento dos Sistemas de Bioinformática
Aluno: Julio César Barbieri Gonzalez de Almeida
Metabolismo de Construção.
Inteligência Artificial Redes Neurias
J. Landeira-Fernandez Ética e Ciência
A Framework for Robots Development and Programming Based on Genetic Algorithms Palmeira P.F.M Silvino J.S. de Melo J.C.D DEE-UFMG DELT-UFMG.
Emanuel Teixeira Nº24924 Bioengenharia
Aprendizado de Máquina Aula 8
As proteínas 1ª parte.
A Hybrid Method for Robust Car Plate Character Recognition.
Sistemas Distribuídos
Redes Neurais Prof. Alex F. V. Machado.
BIOLOGIA MOLECULAR (BIOQUÍMICA DA CÉLULA)
INF 1771 – Inteligência Artificial
Sistemas Inteligentes
Aprendizado de Máquina - Introdução
A Base Molecular da Vida Prof(a): Alexsandra Ribeiro
PROTEÍNAS:.
Tópicos especiais em controle inteligente e distribuído Professor: Jorge Dantas de Melo Rafael Marrocos Magalhães.
Marcílio C. P. de Souto DIMAp/UFRN
PSBD II Projeto de Sistemas de Banco de Dados II
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
SVMSharp – Uma implementação didática de uma SVM
Sistemas Baseados em Aprendizado (Aprendizado de Máquina)
Testes de Software AULA 02 Eduardo Silvestri
Análise de padrões de uso em grades computacionais oportunistas
WEKA Jacques Robin João Batista Marcelino Pereira junho/2001.
INSTITUTO FEDERAL DE SANTA CATARINA- IFSC METODOLOGIA CIENTÍFICA Profa
Universidade Federal de Lavras Departamento de Ciência da Computação
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Mecanismo de sugestão e processo de caracterização de redes sociais
Aprendizado da rede O aprendizado, na maioria das vezes, constitui no ajuste do conjunto de pesos de modo que a rede consiga executar uma tarefa específica.
Transferência Horizontal de Genes: um Survey de Métodos Computacionais Instituto de Computação Universidade Estadual de Campinas Karina Zupo de Oliveira.
Luana Bezerra Batista Redes Neurais Luana Bezerra Batista
Feature Learning for Image Classification via Multiobjective Genetic Programming Seminários de Inteligência Artificial Felipe de Paula Wanderley Barros.
Material gentilmente cedido por vinícius almeida.
Algoritmos e Programação I
Maria do Socorro Nogueira Rangel DCCE
Inteligência Artificial
Professora Michelle Luz
Cap. 03 – Água e Sais Minerais
APSI II Análise e Projeto de Sistemas de Banco de Dados II.
INTRODUÇÃO À BIOQUÍMICA
Softwares Faculdade de Ciências Aplicadas e Sociais de Petrolina - FACAPE Ciência da Computação Professora: Cynara Carvalho
BIOQUÍMICA TEMPO ESPAÇO ENERGIA.
PROTEÍNAS.
Objetivo Este projeto destina-se ao estudo e à elaboração de modelos neurais artificiais, com o auxílio do programa Matlab. O objetivo principal deste.
18/09/ /12/20082 Testes Baseados Em Modelo Diana Rúbia Paulo César Qualidade, Processos e Gestão de Software Alexandre Vasconcelos {drrr, pco,
Aulas 13 e 14 Biologia A Caderno 2 página 161.   Proteínas e vida  todos os seres vivos (inclusive os vírus, que são acelulares), tem proteínas em.
Transcrição da apresentação:

COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA CAPES Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA Sousa1, T.H.S.;Delbem2, A.C.B.; Policastro2, A.C.; Garrat, 4R. C. 1Bioengenharia-São Carlos-USP; 2ICMC-São Carlos-USP, 4IFSC- São Carlos - USP

sumário Motivação Introdução Objetivo Materiais e Métodos Resultados Conclusão

_________________________________________________________MOTIVAÇÃO Evolução in vitro Método laboratorial para a evolução de moléculas por meio de mutações. Obtenção de propriedades desejadas. Evolução de proteínas in vitro. descobrimento de novas drogas. cura de muitas doenças de origem genética. Técnica de alto custorequer longo período de tempo.

PROTEÍNAS Componentes fundamentais de todos os seres vivos. ______________________________________________________INTRODUÇÃO PROTEÍNAS macromoléculas direta ou indiretamente responsáveis pelo desempenho de praticamente todas as funções metabólicas, estruturais, imunológicas e reprodutivas nos organismos vivos. Componentes fundamentais de todos os seres vivos. Moléculas orgânicas mais abundantes das células. LEHNINGER, 1976

PROTEÍNAS Algumas de suas principais funções: ______________________________________________________INTRODUÇÃO PROTEÍNAS Principais elementos: C, H, N , O e S. Elementos adicionais: P, Fe, Zn e Cu. Elementos liberados por hidrólise: Aminoácidos ou -aminoácidos Algumas de suas principais funções: Catálize enzimática; Transporte e armazenamento; Sustentação mecânica; Proteção imunitária e outras.

Conformação das proteínas ______________________________________________________INTRODUÇÃO Conformação das proteínas Proteínas fibrosas Proteína Globulares

______________________________________________________INTRODUÇÃO AMINOÁCIDOS 20 aminoácidos são encontrados nas proteínas (padrão) Classificados Grupamentos R Polaridade: Hidrofóbicos, Hidrofílicos, Básicos e Ácidos

______________________________________________________INTRODUÇÃO HEMOGLOBINA Proteínas, contidas nas hemácias, responsáveis pelo transporte de O2 , CO2, e íons de H+ . A Hb contém 2 cadeias  (141 a.a) e 2 cadeias  (146 a.a) liga-se a cada cadeia um grupo heme

________________________________________________________INTRODUÇÃO HEMOGLOBINA Desoxihemoglobina Estado T Oxiemoglobina Estado R

Aprendizado de Máquina ________________________________________________________INTRODUÇÃO Aprendizado de Máquina AM é uma área de pesquisa computacional  objetivo é desenvolvimento de sistemas computacionais capazes de aprenderem e adquirirem conhecimento de forma automática. Algoritmos de Aprendizado: Programa computacional capaz de tomar decisões baseadas em soluções de problemas anteriores. Exemplos de técnicas de AM: Redes Neurais, SVM, técnica de Árvores de Decisão e Algoritmos Genéticos.

______________________________________________________OBJETIVO Propomos neste trabalho investigar técnicas computacionais inteligentes capazes de determinar a funcionalidade de proteínas mutantes a partir das seqüências de aminoácidos e classificar de maneira correta as mutações da proteína hemoglobina para em seguida predizer as características de uma nova mutação.

1) Proteínas (Hemoglobinas - Hb). ________________________________________________MATERIAIS E MÉTODOS Foram realizados dois estudos: 1) Proteínas (Hemoglobinas - Hb). Foram utilizadas as cadeias alfa e beta da proteína HB  Com 141 e 146 aminoácidos respectivamente. Um cojunto de dados de proteínas disponíveis em: http://us.expasy.org e http://globin.cse.psu.edu. adquiridas estruturas primárias da Hb (mutantes) associadas ou não a uma patologia com suas respectivas classificações seqüência original da proteína estudada.

2) Técnicas computacionais inteligentes. ________________________________________________MATERIAIS E MÉTODOS 2) Técnicas computacionais inteligentes. A técnica computacional (AM) Algoritmos C 4.5, Algoritmo SMO, Random Forest, Kstar e FLR para a verificação da funcionalidade de hemoglobinas. Programa Weka (Waikato Environment Knowledge Analysis) versão 3.2, composto por um conjunto de algoritmos de AM implementados em Java, disponível no site http://www.cs.waikato.ac.nz/ml/weka/ index.htm.

________________________________________________MATERIAIS E MÉTODOS METODOLOGIA Os experimentos seguiram a metodologia 10-fold-cross-validation. As seqüências foram aleatoriamente separadas em 10 grupos de tamanhos aproximadamente iguais Um grupo foi utilizado como conjunto de novas seqüências apresentadas ao sistema para o aprendizado 9 grupos restantes foram utilizados como seqüências de treinamento dos demais algoritmos. Após cada treinamento utilizando os 9 grupos, o grupo de teste foi apresentado ao sistema e a média dos erros foi calculada esse processo foi repetido para os 9 grupos restantes.

Testes realizados  AM e AG ________________________________________________________RESULTADOS RESULTADOS Testes realizados  AM e AG A Tabela 1  apresenta os resultados dos testes que foram realizados com a cadeia alfa da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos. A Tabela 2  apresenta os resultados dos testes que foram realizados com a cadeia beta da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos.

________________________________________________________RESULTADOS Tabela 1 - Erro médio para os indivíduos Heterozigotos da cadeia alfa Algoritmo Erro Médio Boas Ruins Total C 4.5 17.9% 114 25 139 SVM 18.7%   Random Forest Kstar 19.4% FLR 23.7% Tabela 2 - Erro médio para os indivíduos Heterozigotos da cadeia beta Algoritmo Erro Médio Boas Ruins Total C 4.5 36.2% 88 50 138 SVM 29.7%   Random Forest 33.3% Kstar 26.8% FLR 31.8%

________________________________________________________RESULTADOS A Tabela 3  apresenta os testes que foram realizados com a cadeia beta da proteína Hemoglobina com o Algoritmo Genético  Filtro objetivo era selecionar ainda mais as entradas para os classificadores. A Tabela 4  apresenta os resultados dos testes realizados com a cadeia beta da proteína HemoglobinaAlgoritmo Genético.

________________________________________________________RESULTADOS Tabela 3 -Algoritmos Genéticos/ Cadeia Beta/ Filtro Algoritmo Erro Médio Boas Ruins Total C 4.5 3.6% 197 186 383 SVM 2.1% 383 Tabela 4 - Algoritmos Genéticos/ Cadeia Beta Algoritmo Erro Médio Boas Ruins Total C 4.5 SVM 1.8 % 197 186 383 197 186 383 1.6 %

__________________________________________________________ CONCLUSÃO Os testes realizados com os algoritmos escolhidos apresentaram um resultado esperado quando se utilizam técnicas de aprendizado que requerem bancos de dados numerosos. A utilização de técnicas de aprendizado de máquina, por exemplo, o C 4.5, permite a construção de árvores de decisões que podem revelar a lógica de como é determinada a função de proteínas.

__________________________________________________________ CONCLUSÃO Como apresentado nos resultados experimentais o uso do Algoritmo Genético permitiu que se alcançassem resultados bastante significativos. Como etapa futura a ser investigada está a criação de um software capaz de predizer futuras mutações da proteína estudada, a partir dos conhecimentos adquiridos.