Semântica em Integração de Dados – Ontologia Contextual

Slides:



Advertisements
Apresentações semelhantes
Operações sobre o Texto
Advertisements

Modelos e Sistemas de Reputação
Engenharia de Software
Indexação Automática de Documentos
Sistemas de Informação Redes de Computadores
Interfaces Conversacionais
Amanda Meincke Melo RA:
Ontologia para Sistemas Configurarionais Urbanos
SMA: ORGANIZAÇÃO.
Revisões de Software Parte 1
Grupo 5: Fernando Lourenço Pinho Costa Rafael de Souza Santos
Interoperabilidade semântica no domínio de Engenharia de Software
Principios e Conceitos de Projeto
Sistema de Informação Gerencial (SIG)
Tecnologias de Linguagens para Banco de Dados
O NTOLOGY M ATCHING Thiago Pachêco. R OTEIRO Motivação Ontology matching Definição Conceitos Processo Técnicas Álgebra Ferramentas existentes OAEI Aplicações.
Aprendizado Baseado em Instâncias – Algoritmo k-NN
II Workshop de Dissertação Pós-Graduação em Ciência da Computação Faculdade de Computação – FACOM Universidade Federal de Uberlândia – UFU Dezembro/2008.
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
DAVIDE BUSCALDI PAULO ROSSO
Prof. Kelly E. Medeiros Bacharel em Sistemas de Informação
MapReduce Conceitos e Aplicações
Preparação dos documentos Flávia Barros
Recuperação de Informação
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Data Mining: Conceitos e Técnicas
UTILIZANDO A ABORDAGEM DIRIGIDA A RESPONSABILIDADES PARA A CRIAÇÃO DO SUBFRAMEWORK DE ANÁLISE SINTÁTICA E SEMÂNTICA DE FÓRMULAS Rodolfo Adamshuk Silva.
Recuperação de Informação
Elaborado por: Francisco Covas nº Manuel Felício nº
Análise de Sistemas de Informação
Classificacao de Texto Projeto Spam Filter
A abordagem de banco de dados para gerenciamento de dados
Banco de Dados Aplicado ao Desenvolvimento de Software
Normas Internacionais: Metadados (ISO/IEC 11179)
Matching de Esquemas: 10 anos depois Nicolle Chaves Cysneiros.
Integração Semântica de Esquemas
Disciplina : Tópicos Avançados em Inteligência Artificial Simbólica Professores: Dr. Fred Freitas / Dra. Bernadette Farias Aluno: Clovis Holanda Introdução.
LIG - Université Grenoble Mineração de Preferências Contextuais sobre dados de preferência “pairwise” Data Mining AULA 19 – Parte I Sandra de Amo.
Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web.
A Lexicon-Enhanced Method for Sentiment Classification: An Experiment on Online Product Reviews Bruno Andrade.
Uma proposta para OLAP ontológica Adriana Ribeiro.
Plataforma para desenvolvimento de Aplicações baseadas em Ontologias para o projeto LAriisa Aluno: Taciano Pinheiro Orientador: Prof. Dr. Mauro Oliveira.
Ferramentas de Manipulação de Ontologias (Protégé)
Controle de Acesso e Privacidade em Sistemas Sensíveis ao Contexto Carlos Eduardo Andrião.
A Linguagem Formal de Especificação VDM-SL
Sumarização Ontologias Paulo Orlando V. Q. Sousa.
Ferramenta de Modelagem de Requisitos e Agentes (TAOM4e) Laís Xavier Prof.: Jaelson Castro.
Web Semântica Thiago José Marques Moura. Roteiro Problemática; Descrição; Arquitetura Proposta; Conclusão sobre Web Semântica; Linguagens de Anotação.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Candidato: Lucas Santos de Oliveira Orientador: Marco Aurélio Gerosa
The Petri Net Markup Language (PNML) Wellington João da Silva Mestrado Ciência da Computação.
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
METHONTOLOGY Sandro Rautenberg
Utilização de Ontologias para Integração de Heterogeneidade Semântica
Resolução de Anáforas Pronominais Apresentação da Proposta de Projeto Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática INF.
Um Classificador Baysesiano para a Análise das Relações Sociais em Blogs Allan Lima –
Uso de Ontologias em Data Warehousing
UML (Unified Modeling Language) Linguagem Unificada de Modelagem
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Integração Semântica: uma pesquisa sobre abordagens baseadas em ontologias Túlio Lages
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.
1 Memória Auditiva: implicações para o modelo de interação (limites no tamanho de menus para navegação baseada na interação por voz) Grupo GJN MO622 –
Uma Abordagem Bottom-Up para a Integração Semântica de Esquemas XML Tese de Doutorado por Ronaldo dos Santos Mello Prof. Carlos Alberto Heuser Orientador.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
1 Especificação de Sistemas de Software e a UML. 2 Modelagem de sistema A modelagem de sistema auxilia o analista a entender a funcionalidade do sistema.
18/09/ /12/20082 Testes Baseados Em Modelo Diana Rúbia Paulo César Qualidade, Processos e Gestão de Software Alexandre Vasconcelos {drrr, pco,
FFLCH/USP30/03/2016.  INSERÇÃO DE DADOS NO DELPo.
ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO Nelsi Warken, Luiz A.
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
QUALIDADE DE DADOS EM SISTEMAS DE INTEGRAÇÃO DE DADOS VÍTOR ARRAIS DE SÁ SEMINÁRIO IDW– Cin/UFPE
Transcrição da apresentação:

Semântica em Integração de Dados – Ontologia Contextual Vinícius Torres

Roteiro Integração de Esquemas Pré-processamento para Integração Word Sense Disambiguation Spell Check Expansão de abreviação e acrônimos Contexto Modelagem Contextual Ontologia Contextual Ontologia Contextual para pré-processamento

Integração de Esquemas Integração de Informação: começou com integração de BD, e tem sido estudado pela comunidade de Banco de Dados desde a década de 80. Problema: schema matching, que lida com 2 (ou mais) esquemas de banco de dados para produzir um mapeamento entre seus atributos. Objetivo: merging dos esquemas em um esquema global único.

Integração de Esquemas Integração de esquemas é o processo que recebe esquemas de fontes de dados distintos e produz um esquema unificado.

Integrando 2 esquemas Ex1: S1 S2 Cust Customer Code Number Name First Name Phone Last Name Phone Number Sistemas de Integração de dados assumem que os atributos estejam normalizados Ex2: S1 S2 Cust Customer CNo CustID CompName Contact FirstName Phone

Pré-processamento para Integração Tokenização: A tokenização é o processo de identificar e transformar os atributos em palavras. Remoção de caracteres: “-”, “_”, ”.” ….. UpperCase: FirstName, MyHouse Stop-words: Remoção de palavras sem relevância semântica(artigos, preposições, etc).

Pré-processamento para Integração Spell-check: Um problema adicional na normalização é a correção ortográfica. expansion of abbreviations and acronyms; schema element sense disambiguation; 4 tipos de erros inserção(computter, com letras a mais); deleção(com letras a menos, hous); substituição(housi, com o i no lugar do e) ; transposição(dgo, com o g e o em posições invertidas).[Chan, 2005]

Pré-processamento para Integração Expansão de Abreviações e Acrônimos: escolher o sentido correto de acordo com o contexto onde o termo é apresentado ; difícil, pois pode existir mais de sugestão de expansão, ou ainda, nenhuma.

Pré-processamento para Integração Expansão de Abreviações e Acrônimos: 2 categorias de abreviações (Hill, 2008) Simples: Única Palavra Prefixo: ‘attri’(attribute) Aleatório: ‘msg’(Message) e src(Source) Composta: Multi-palavas Acrônimos: ‘ssn’(Social Security Number) Partes das Palavras: doctype(Document Type)

Pré-processamento para Integração Expansão de Abreviações e Acrônimos: Expansão baseada em dicíonários: mais de um termo encontrado; problema expandido quando de utiliza a web; dicionário precisa ser constantemente atualizado.

Pré-processamento para Integração Ferramentas para normalização: (Belian, 2008) Cupid Tokenização, expansão e eliminação(prepositions) Thesaurus Embley et al. Expansão Wordnet COMA++ OntoBuilder Tokenização

WordNet Alguns relacionamentos do synset car.

Contexto Contexto é definido como um informação contextual usada para representar circunstâncias envolvendo certas entidades, onde a entidade pode ser uma pessoa, lugar, objeto ou um procedimento que é considerado relevante na interação entre usuários e aplicação. [Strang et al., 2003].

Contexto Sistemas Sensíveis ao Contexto auxiliam pessoas nas tarefas diárias adaptando seu comportamento baseado em informações contextuais do usuário. Contexto Computacional é qualquer informação relevante descrevendo entidades em um interação homem-máquina. [Neto, 2005].

Contexto (Fases)

Modelagem Contextual Definir e usar contexto em aplicações computacionais requer um modelo contextual bem definido que deve representar e lidar com o conhecimento contextual. [Strang et al., 2003] Compartilha um entendimento comum da estrutura da informação; Reuso de conhecimento contextual; Raciocínio.

Contexto Ontologia Contextual para Integração precisa incluir informações contextuais: Fontes de Dados; Esquemas; Vocabulario(significado, relacionamentos semânticos, léxico) Elementos Contextuais Usuário; Ambiente; Dados; Associações; Procedimentos; e Aplicação.

Ontologia Contextual para Integração [Belian, 2008]

Ontologia Contextual para Integração [Belian, 2008]

Ontologia Contextual para Integração [Belian, 2008]

Ontologia Contextual para Integração [Belian, 2008]

Ontologia Contextual - Raciocínio A utilização de Ontologias para representação contextual nos permite inferências: Se “paciente” = {any}; Se “cliente” = {saúde privada}; Se “usuário” = {saúde pública, tratamento de drogas}.

Contexto para resolução semântica O processo de integração de esquemas geralmente é baseado nas seguintes etapas: Pre- Integração(processemento) ; Comparação de Esquemas; Merging entre as diversas fonte de dados. [Belian, 2008].

Contexto para resolução semântica Pré-Integração: Expansão de abreviações e acrônimos. Desambiguação de significado; Spell-check.

Contexto para resolução semântica Expansão de abreviação e acrônimos: Exemplo: “PA”

Contexto para Word Sense Disambiguation Word sense disambiguation é determinar qual o significado da palavra em questão a depender do contexto.[Jurafksy, 2000] Exemplo Clássico: Word: “Manga” Dicionário Aurélio On-line manga 1 sf. 1. Parte do vestuário onde se enfia o braço. 2. Qualquer peça de forma tubular que reveste ou protege outra peça. 3. O fruto da mangueira

Contexto para Word Sense Disambiguation Outro Exemplo: Word: “Usuário” Usuário de Computador. Usuário de drogas em tratamento. Usuário do SUS.(na esfera particular pode ser cliente ou paciente). Domínio de Saúde. Porém subdomínios diferentes: Psicologia SUS

Contexto para Word Sense Disambiguation Ainda no exemplo: Word: “Usuário”

“Aplicação” Exemplo Normalização: Atributo: “diag_code” Entidade: “office_visit” Obtem-se o termo completo formado pelos tokens “diag” e “code”; O termo “diag code” é classificado na ontologia levando em consideração os elementos contextuais; Diag é expandido na ontologia para Diagnoses; O termo “Diagnoses Code” é classificado na ontologia. [Belian, 2008]

“Aplicação” Exemplo [Belian, 2008]

Referências [Chan, 2005] Chan, S., He, B. & Ounis, I. (2005), An in-depth survey on the automatic detection and correction of spelling mistakes, in ‘Proceedings of the 5th Dutch-Belgian Information Retrieval Workshop (DIR)’. [Hill, 2008] Hill, E. et al. AMAP: Automatically Mining Abbreviation Expansions in Programs to Enhance Software Maintenance Tools. MSR. 2008 [Strang et al. 2003] Strang, T., Linnhoff-Popien, C., Frank, K.: CoOL: A Context Ontology Language to enable Contextual Interoperability. Proceedings of 4th IFIP WG 6.1, International Conference on Distributed Applications and Interoperable Systems, DAIS, 2003. [Belian, 2008]Belian, Rosalie Barreto A context-based name resolution approach for semantic schema integration - Tese. – Recife – 2008.

Dúvidas ? [Belian, 2008]