Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouLuís Figueiredo Osório Alterado mais de 8 anos atrás
1
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO
2
Roteiro Motivação Objetivos Conceitos fundamentais Técnicas Ferramentas atuais Desafios
3
Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas
4
Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas Operação complexa!
5
Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas Operação complexa! Por envolver diversos modelos de dados e domínios de aplicação, o problema deve ser estudado de forma genérica.
6
Objetivos Introduzir o problema de casamento de esquemas; apresentar as abordagens e ferramentas para resolvê-lo.
7
Conceitos fundamentais Esquema ◦Descrição em linguagem formal ◦Conjunto de elementos que se relacionam ◦Ex.: SQL Schema, XML Schema, descrição de ontologia Operação de “casamento” (matching): ◦Toma dois esquemas como entrada e devolve um mapeamento (correspondências entre os elementos). ◦Mapeamento é expresso em sintaxe específica ◦Problema: encontrar correspondências entre elementos de dois esquemas!
8
Técnicas Taxonomia
9
Técnicas Abordagens iniciais… ◦ Casamento linguístico (Linguistic matching) ◦Algoritmos de processamento e casamento entre strings ◦Substrings, tokenização, stemização
10
Técnicas Abordagens iniciais… ◦ Casamento linguístico (Linguistic matching) ◦Algoritmos de processamento e casamento entre strings ◦Substrings, tokenização, stemização ◦ Uso de informações adicionais! ◦Dicionários, tesauros (dicionário de ideias afins)
11
Técnicas Abordagens iniciais… ◦ Casamento baseado em estrutura ◦Grupos de elementos com estrutura semelhante ◦Relacionamentos semelhantes
12
Técnicas Abordagens iniciais… ◦ Casamento baseado em estrutura ◦Grupos de elementos com estrutura semelhante ◦Relacionamentos semelhantes ◦ Casamento baseado em restrições ◦Ex.: Correspondência UF/Estado: restritos a {AC, AL, …., TO}
13
Técnicas Abordagens iniciais… ◦ Casamento baseado em instâncias
14
Técnicas Abordagens iniciais… ◦ Casamento baseado em instâncias ◦ Casamento baseado em regras ◦Lógica de primeira ordem
15
Técnicas Novos tipos de informação…
16
Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.
17
Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.
18
Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las. ◦ Top-k matching: “melhores matches” são apresentados ao usuário.
19
Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las. ◦ Top-k matching: “melhores matches” são apresentados ao usuário. ◦ Matching incremental: usuário seleciona um elemento do esquema e algoritmo devolve melhor correspondência (ou melhores, como no top-k).
20
Técnicas Casamento de esquemas de grande porte?...
21
Técnicas Casamento de esquemas de grande porte… ◦ Matching em paralelo ◦ Baseado em partições ◦ Redução do espaço de busca ◦ Otimizações diversas: matrizes de similaridade, otimizações no casamento de strings
22
Técnicas Correspondências com tags… ◦ Tagging semântico ◦Correspondências são marcadas quanto ao seu sentido ◦Ex.: igualdade ◦ Tagging condicional ◦Correspondências válidas apenas quando um elemento assume certo valor ◦Ex.: “code” equivale a “ISRC” somente para “music”
23
Ferramentas atuais Comparação (2011)
24
Ferramentas atuais COMA
25
Ferramentas atuais Harmony
26
Ferramentas atuais Agreement-maker
27
Ferramentas atuais Benchmarking: XBenchMatch
28
Ferramentas atuais Benchmarking: XBenchMatch
29
Desafios Facilitar o reuso de mapeamentos Melhoria da visualização gráfica dos mapeamentos
30
Referências http://dbs.uni-leipzig.de/file/10yearBestPaper-BernsteinMadhavanRahm.pdf http://disi.unitn.it/~p2p/RelatedWork/Matching/FabienDuchateau_540.pdf http://dbs.uni-leipzig.de/file/VLDBJ-Dec2001.pdf http://research.microsoft.com/pubs/69875/tr-2001-58.pdf
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.