A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

The MORPHOSAURUS Medical Subword Lexicon: Lexicographic and Semantic Aspects Stefan Schulz 12, Kornél Markó 14, Percy Nohama 23, Roosewelt Leite de Andrade.

Apresentações semelhantes


Apresentação em tema: "The MORPHOSAURUS Medical Subword Lexicon: Lexicographic and Semantic Aspects Stefan Schulz 12, Kornél Markó 14, Percy Nohama 23, Roosewelt Leite de Andrade."— Transcrição da apresentação:

1 The MORPHOSAURUS Medical Subword Lexicon: Lexicographic and Semantic Aspects Stefan Schulz 12, Kornél Markó 14, Percy Nohama 23, Roosewelt Leite de Andrade 23, Edson José Pacheco 23, Udo Hahn 4, Martin Romacker 5 1 Freiburg University Hospital, Department of Medical Informatics, Freiburg, Germany 2 Paran´a Catholic University, Health Informatics Laboratory, Curitiba, Brazil 3 CEFET-PR, Graduate Program in Electrical Engineering and Industrial Informatics, Curitiba, Brazil 4 Jena University, Computational Linguistics Research Group, Jena, Germany 5 Text Mining in Life Sciences Informatics at Novartis, Basel, Switzerland O Léxico MORPHOSAURUS de Subwords Médicas: Aspectos lexicográficos e semânticos

2 Introdução Necessidade de acesso a informação multi- lingue na área da saúde –Cenário brasileiro: Prontuários de pacientes em Português Líteratura relevante em Inglês,Português, Espanhol Objetivo: Indexação Semântica de documentos para facilitar recuperação e extração de informação

3 Desafios lingüísticos da linguagem médica: –Derivação, neologismos: „nefrótico“, „antiinflamatórios“, „parkinsoniana“, „aidéticos“, –Composição: „musculoesqueletico“, „esplenomegalia“, „transfosforribosidasa“, „polyradiculoneuropathy“ –Sinonímia: … –Ambiguidade:…

4 Granularidade ideal para indexação de documentos médicos Problema: high bloodpressure hipertensãoarterial meningoencefalite Bluthochdruck EntzündungvonHirnhäutenGehirnund meningocerebralinflammation Usar para indexação: –termos complexos ? –palavras inteiras ? –radicais ? –morfemas ?

5 Proposta: Átomos semânticos ou „subwords“ Definição: sequência de caracteres cujo significado não decorre dos significados dos componentes: „diafise“ mas não „dia“ + „fise“ „diáfise“ = haste do osso, „fise“ (gr. physis) = natureza „neur“ + „ite“, mas não „neur“ + „ose“ „neur…“ = nervo, „-ite“ = inflamação, „-ose“ = doença: Uma neurite é uma inflamação de nervo(s), mas neurose não é uma doença do nervo(s)


Carregar ppt "The MORPHOSAURUS Medical Subword Lexicon: Lexicographic and Semantic Aspects Stefan Schulz 12, Kornél Markó 14, Percy Nohama 23, Roosewelt Leite de Andrade."

Apresentações semelhantes


Anúncios Google