A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Extracção Automática de Ontologias a Partir de Texto

Apresentações semelhantes


Apresentação em tema: "Extracção Automática de Ontologias a Partir de Texto"— Transcrição da apresentação:

1 Extracção Automática de Ontologias a Partir de Texto
Parte I Introdução Olá. Hoje vou falar sobre extracção automática de ontologias a partir de texto Knowledge Discovery and Management Group

2 Knowledge Discovery and Management Group
O Plano a longo prazo…. Apresentações (+/-) sistemáticas Revisão Bibliográfica Demonstrações de protótipos .... Discussão de Ideias A minha ideia para destas apresentações é de poder ir partilhando com vocês aquilo que for fazendo para poder receber algum feedback. Como Knowledge Discovery and Management Group

3 Knowledge Discovery and Management Group
Agenda Definições de Ontologias Tipos de Ontologias Extracção Automática de Ontologias a partir de Texto Métodos Avaliação Aplicações Para hoje a minha ideia era começar por rever algumas das definições mais citadas na literatura. Depois passar a uma possível categorização de ontologias segundo um autor. Knowledge Discovery and Management Group

4 Ontologia – Definições
Filosóficas Tenta identificar e categorizar tudo que existe. O que caracteriza existir? O que significa existir? Aristóteles – Primeiro sistema de classificação (taxionomia) que ordenou os animais pelo tipo de reprodução. Do ponto de vista filosófico uma ontologia identificar e organizar tudo o que existe. Isto obriga necessariamente a que se dê resposta às seguintes questões.... Aristóteles foi provavelmente um dos primeiros a travar esta batalha... E ele acabou por estabelecer/criar um taxionomia de classificação para os animais em que o critério que de classificação tido em conta era o tipo de reprodução. Mais tarde no século 18 von Linn voltou a categorização de seres vivos utilizando uma taxionomia.... E existem vários outros sistemas taxonomicos de classificação presentes no nosso dia-a-dia... Knowledge Discovery and Management Group

5 Ontologia – Definições
Computacionais Um artefacto constituído por um vocabulário específico para descrever uma certa realidade. E um conjunto de assunções sobre o significado de cada item do vocabulário. Knowledge Discovery and Management Group

6 Ontologia – Definições (Fensel)
Computacionais É uma especificação explicita e formal de uma conceptualização partilhada. Conceptualização – Os conceitos pertencentes ao domínio de interesse. Explícito – O tipo de conceitos e as restrições de utilização estão explicitamente definidas. Formal – “Machine Readable”. Partilhada – Consensual e aceite por um grupo de pessoas. Fensel atribui outra categorização.... Knowledge Discovery and Management Group

7 Tipos de Ontologias (Buitelaar et al.)
Abstracto Ontologias de Nível superior Ontologias de Domínio Ontologias de Tarefa Ontologias de Aplicação Específico Knowledge Discovery and Management Group

8 Extracção Automática de Ontologias a partir de Texto (EAOT)
Introdução Knowledge Discovery and Management Group

9 Extracção Automática de Ontologias a partir de Texto (EAOT)
Pode ser encarado como um processo de “reverse-engineering” Knowledge Discovery and Management Group

10 EAOT- Pilha de Entidades (Buitelar et al.)
AXIOMAS membro_de(médico, hospital) RELAÇÕES é_uma(médico, pessoa) TAXONOMIA doença=<Intensão, Extensão, Lemmas> CONCEITOS {doença}, {médico, doutor} SINONIMOS TERMOS doença, médico, doutor Knowledge Discovery and Management Group

11 Módulo Reconhecimento de Entidades Mencionadas
Termos Esta seção traz de volta um pouco da longa história do DCC. O DCC-Departamento de Cultura Científica do Centro Acadêmico Pereira Barretto (DCC/CAPB), órgão responsável pela representação e encaminhamento científico dos alunos da UNIFESP/EPM, fundado em 1937, atua junto aos alunos promovendo vários cursos extracurriculares, palestras, conferências e discussões de interesse à área médica. Módulo Reconhecimento de Entidades Mencionadas Knowledge Discovery and Management Group

12 Knowledge Discovery and Management Group
Sinónimos Podemos utilizar recursos lexicais; (e.g, WordNet) Abordagens estatísticas de co-ocorrência Co-ocorrências de 2ª ordem (e.g, LSA) (carro, [p1,p2,p3,p4]) (automóvel, [p1,p3,p4,p5]) carro e automóvel são sinónimos (??) Knowledge Discovery and Management Group

13 Knowledge Discovery and Management Group
Conceitos Doença Intenção: “é um nome que se dá a todo um conjunto de sinais e sintomas que o corpo ou a pessoa apresenta.” Extensão: Cancro, Malária, Febre Amarela,... Lemmas: Doença, ... Knowledge Discovery and Management Group

14 Conceitos – Intensão (Navigli et al.)
festival – “a day or period of time set aside for feasting and celebration” jazz – “a style of dance music popular in the 1920s; similar to New Orleans jazz but played by large bands” jazz festival – “a kind of festival, a day or period of time set aside for feasting and celebration, related to jazz, a style of dance music popular in the 1920s” Knowledge Discovery and Management Group

15 Conceitos – Extensão (Etzioni et al.)
Procurar padrões léxico-sintáticos num corpus ... doenças tais como, [d1,d2,d3]..... ... actores tais como, [a1,a2,a3]..... Knowledge Discovery and Management Group

16 Knowledge Discovery and Management Group
Conceitos - Lemmas Os métodos semelhantes aos utilizados para extracção de sinónimos. Knowledge Discovery and Management Group

17 Knowledge Discovery and Management Group
Taxionomia Considerado a “coluna vertebral” de qualquer Ontologia. Relações do tipo é_um (is_a). Exemplo de extracção: Procura em corpora de padrões léxico-sintáticos indicando relações de “é_um”(Hearst et al.) Knowledge Discovery and Management Group

18 Knowledge Discovery and Management Group
Relações Já temos: Sinónimos Hipónimos/Hiperónimos (“é_um”) Que outras relações modelar? Que nome dar à relação entre: “Companhia” e “Produto” Knowledge Discovery and Management Group

19 Knowledge Discovery and Management Group
Relações Podemos recorrer à utilização de padrões/heurísticas específicos: KnowItAll MindNet (Microsoft) Técnicas estatísticas (Kavavlec et al) Procurar triplos(Verbo_x, Conceito1, Conceito2) numa janela de n palavras em texto. Utilização de uma métrica, “above expectation”, para escolher o melhor verbo (etiqueta) para a relação. Knowledge Discovery and Management Group

20 Knowledge Discovery and Management Group
Axiomas Servem para estabelecer equivalências entre relações. (bastante útil em RAP) Governo Resolveu Crise Alguém encontrou solução para a crise? Knowledge Discovery and Management Group

21 "X encontrou uma solução para Y"
Axiomas Procurar sintagmas que partilham o mesmo contexto. (Lin et al.) "X encontrou uma solução para Y" "X resolveu Y" comissão greve governo problema crise ela mistério ele investigador juiz disputa encontrar uma solução para ≈ resolver Knowledge Discovery and Management Group

22 Extracção Automática de Ontologias a Partir de Texto
FIM Knowledge Discovery and Management Group


Carregar ppt "Extracção Automática de Ontologias a Partir de Texto"

Apresentações semelhantes


Anúncios Google