A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Apresentações semelhantes


Apresentação em tema: "Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO."— Transcrição da apresentação:

1 Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

2 Roteiro Motivação Objetivos Conceitos fundamentais Técnicas Ferramentas atuais Desafios

3 Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas

4 Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas Operação complexa!

5 Motivação Aplicações ◦Aplicações web: alinhar catálogos de produtos. ◦Web semântica: alinhar ontologias ◦Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de outro. ◦Ex.: Mapeamento objeto-relcional ◦Aplicações médicas Operação complexa! Por envolver diversos modelos de dados e domínios de aplicação, o problema deve ser estudado de forma genérica.

6 Objetivos Introduzir o problema de casamento de esquemas; apresentar as abordagens e ferramentas para resolvê-lo.

7 Conceitos fundamentais Esquema ◦Descrição em linguagem formal ◦Conjunto de elementos que se relacionam ◦Ex.: SQL Schema, XML Schema, descrição de ontologia Operação de “casamento” (matching): ◦Toma dois esquemas como entrada e devolve um mapeamento (correspondências entre os elementos). ◦Mapeamento é expresso em sintaxe específica ◦Problema: encontrar correspondências entre elementos de dois esquemas!

8 Técnicas Taxonomia

9 Técnicas Abordagens iniciais… ◦ Casamento linguístico (Linguistic matching) ◦Algoritmos de processamento e casamento entre strings ◦Substrings, tokenização, stemização

10 Técnicas Abordagens iniciais… ◦ Casamento linguístico (Linguistic matching) ◦Algoritmos de processamento e casamento entre strings ◦Substrings, tokenização, stemização ◦ Uso de informações adicionais! ◦Dicionários, tesauros (dicionário de ideias afins)

11 Técnicas Abordagens iniciais… ◦ Casamento baseado em estrutura ◦Grupos de elementos com estrutura semelhante ◦Relacionamentos semelhantes

12 Técnicas Abordagens iniciais… ◦ Casamento baseado em estrutura ◦Grupos de elementos com estrutura semelhante ◦Relacionamentos semelhantes ◦ Casamento baseado em restrições ◦Ex.: Correspondência UF/Estado: restritos a {AC, AL, …., TO}

13 Técnicas Abordagens iniciais… ◦ Casamento baseado em instâncias

14 Técnicas Abordagens iniciais… ◦ Casamento baseado em instâncias ◦ Casamento baseado em regras ◦Lógica de primeira ordem

15 Técnicas Novos tipos de informação…

16 Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

17 Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

18 Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las. ◦ Top-k matching: “melhores matches” são apresentados ao usuário.

19 Técnicas Novos tipos de informação… ◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas. ◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las. ◦ Top-k matching: “melhores matches” são apresentados ao usuário. ◦ Matching incremental: usuário seleciona um elemento do esquema e algoritmo devolve melhor correspondência (ou melhores, como no top-k).

20 Técnicas Casamento de esquemas de grande porte?...

21 Técnicas Casamento de esquemas de grande porte… ◦ Matching em paralelo ◦ Baseado em partições ◦ Redução do espaço de busca ◦ Otimizações diversas: matrizes de similaridade, otimizações no casamento de strings

22 Técnicas Correspondências com tags… ◦ Tagging semântico ◦Correspondências são marcadas quanto ao seu sentido ◦Ex.: igualdade ◦ Tagging condicional ◦Correspondências válidas apenas quando um elemento assume certo valor ◦Ex.: “code” equivale a “ISRC” somente para “music”

23 Ferramentas atuais Comparação (2011)

24 Ferramentas atuais COMA

25 Ferramentas atuais Harmony

26 Ferramentas atuais Agreement-maker

27 Ferramentas atuais Benchmarking: XBenchMatch

28 Ferramentas atuais Benchmarking: XBenchMatch

29 Desafios Facilitar o reuso de mapeamentos Melhoria da visualização gráfica dos mapeamentos

30 Referências http://dbs.uni-leipzig.de/file/10yearBestPaper-BernsteinMadhavanRahm.pdf http://disi.unitn.it/~p2p/RelatedWork/Matching/FabienDuchateau_540.pdf http://dbs.uni-leipzig.de/file/VLDBJ-Dec2001.pdf http://research.microsoft.com/pubs/69875/tr-2001-58.pdf


Carregar ppt "Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO."

Apresentações semelhantes


Anúncios Google