A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova.

Apresentações semelhantes


Apresentação em tema: "Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova."— Transcrição da apresentação:

1 Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova

2 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

3 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

4 © Daniela F. Brauner Definição do problema Como acessar bancos de dados que adotam esquemas heterogêneos? SASA TBTB DB A DB B ? Esquema conceitual: descreve em alto nível como organizar os dados armazenados em um BD Esquema de Classificação: classifica os dados armazenados em um BD em categorias pré-definidas Ex: palavras-chave, tesauros, taxonomias. ? TATA ? SBSB

5 © Daniela F. Brauner Definição do problema Ex: IDFULL_NAME_NDDSGDMS_LATDMS_LONGLATLONG 67203Rio de JaneiroPPLA Rio de JaneiroSTM São Sebastião do Rio de JaneiroPPLA identifierdisplay-nameclassgml:ygml:x adlgaz Rio de Janeiro, Estado do - Braziladministrative areas adlgaz Rio de Janeiro, Serra do - Brazilmountains adlgaz Rio de Janeiro - Brazilpopulated places adlgaz bJaneiro, Rio de - Brazilstreams adlgaz fRio de Janeiro - Loreto, Departamento de - Perupopulated places DB A DB B

6 © Daniela F. Brauner Definição do problema Solução: Alinhamento de esquemas (schema matching): Dados dois esquemas como entrada, gerar um mapeamento entre os elementos desses esquemas que correspondem semanticamente um ao outro. SASA s b = (s a ) SBSB

7 © Daniela F. Brauner Definição do problema Aplicações: Transformação de dados Ex: data warehousing Mediação de consultas Ex: arquitetura de mediadores

8 © Daniela F. Brauner Definição do problema TATA TBTB DB A DB B Transformação de dados: __ __ __ ? Populated places PPL

9 © Daniela F. Brauner Definição do problema TATA TBTB DB A DB B __ __ __ Populated places PPL Transformação de dados:

10 © Daniela F. Brauner Definição do problema TATA TBTB DB A DB B Populated places Client Request Populated places Request PPL __ __ __ TATA PPL TBTB Mediação de consultas:

11 © Daniela F. Brauner Definição do problema TATA TBTB DB A DB B Populated places Client Request Populated places Request PPL Populated places PPL __ __ __ Mediação de consultas: TATA ?

12 © Daniela F. Brauner Definição do problema Como obter os mapeamentos? Manualmente: Nível de esforço linear com relação ao número de mapeamentos Processo tedioso e dispendioso –Consome cerca de 40% do tempo de trabalho dos departamentos de TI Abordagens a priori: Requer amadurecimento das técnicas de projeto de BDs Abordagens sintáticas: Suscetíveis a erros Abordagens semânticas: Utilizam instâncias CASANOVA, M. A.; BREITMAN, K. K.; BRAUNER, D. F.; MARINS, A. L. Database Conceptual Schema Matching. IEEE Computer Society, Computer, vol. 40, n. 10, pp , Oct., KEENE, C. Data Services for Next-Generation SOAs. SOA WebServices Journal, 4(12),

13 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

14 © Daniela F. Brauner Abordagem proposta Alinhamento de esquemas utilizando instâncias –Abordagem a priori: descoberta dos mapeamentos antes da implantação do mediador –Abordagem adaptativa: descoberta e adaptação dos mapeamentos de forma incremental, utilizando as respostas às consultas dos usuários como evidências dos mapeamentos

15 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

16 © Daniela F. Brauner DB A Alinhamento de tesauros Utilizando instâncias –Identifica instâncias equivalentes –Conta os casamentos entre termos de tesauros distintos –Define taxa de mapeamento para pares de termos IDFULL_NAME_NDDSGDMS_LATDMS_LONGLATLONG 67203Rio de JaneiroPPLA Rio de JaneiroSTM identifierdisplay-nameclassgml:ygml:x adlgaz Rio de Janeiro, Estado do - Braziladministrative areas adlgaz Rio de Janeiro, Serra do - Brazilmountains adlgaz Rio de Janeiro - Brazilpopulated places adlgaz fRio de Janeiro - Loreto, Departamento de - Perupopulated places DB B

17 © Daniela F. Brauner Alinhamento de tesauros Abordagem a priori Mapping Rate Estimator Module 1 2 CACA CBCB Thesaurus RARA RBRB Mapping Rates Matrix BRAUNER, D. F.; CASANOVA, M. A.; MILIDIU, R. L. Towards Gazetteer Integration Through an Instance-based Thesauri Mapping Approach. In: Clodoveu A. Davis Jr; Antonio M.V.M. Monteiro. (Org.). Advances in Geoinformatics. Heidelberg: Springer, 2007, v.1, p

18 © Daniela F. Brauner Alinhamento de tesauros TATA TBTB DB A DB B __ __ __ Populated places PPL Abordagem a priori: transformação de dados

19 © Daniela F. Brauner Alinhamento de tesauros Abordagem adaptativa Query Manager Module Cache Mappings Mapping Rate Estimator Module Mapping Rates Matrix Thesaurus 1 Client CACA CBCB Thesaurus Query 2 8 BRAUNER, D. F.; CASANOVA, M. A.; MILIDIU, R. L. Mediation as Recommendation: An Approach to Design Mediators for Object Catalogs. In: 5th International Conference on Ontologies, DataBases, and Applications of Semantics, 2006, Montpellier, OTM 2006 Workshops. Berlin/Heidelberg:Springer, v p

20 © Daniela F. Brauner CacheMappings Alinhamento de tesauros TATA TBTB DB A DB B Populated places Client Request Populated places using T A Request PPL using T B __ __ __ TATA PPL TBTB..in a user session.. __ __ __ Abordagem adaptativa: mediação de consultas

21 © Daniela F. Brauner Alinhamento de tesauros Geração de tesauro de referência: Abordagem a priori: –Assume-se um dos tesauros das fontes como tesauro de referência –A pertinência dos elementos é confirmada a partir dos mapeamentos realizados Abordagem adaptativa: –Assume-se um dos tesauros das fontes como referência (por exemplo, o da primeira fonte cadastrada) –A pertinência dos elementos é confirmada a medida que os mapeamentos são descobertos –Novos elementos são incluídos quando novos mapeamentos são descobertos

22 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

23 © Daniela F. Brauner Ref. Alinhamento de esquemas conceituais Utilizando instâncias –Utiliza um conjunto de instâncias de referência –Conta re-ocorrência dos valores dos atributos –Define matrizes de ocorrência IDNAMEIDTYPELATLONG 67203Rio de JaneiroPPLA AlpsMTS Mississippi RiverSTM identifierdisplay-nameclassgml:ygml:x adlgaz Rio de Janeiro, Estado do - Braziladministrative areas adlgaz Rio de Janeiro, Serra do - Brazilmountains adlgaz Rio de Janeiro - Brazilpopulated places adlgaz fRio de Janeiro - Loreto, Departamento de - Perupopulated places DB A

24 © Daniela F. Brauner Alinhamento de esquemas conceituais Abordagem a priori Query Manager Module Cache Mappings Mapping Rate Estimator Module Occurrence Matrix between S G e S A Global Instances + Global Schema SASA 12 DB A DB B SBSB SGSG RGRG Occurrence Matrix between S G e S B BRAUNER, D. F.; INTRATOR, C.; FREITAS, J. C.; CASANOVA, M. A. An Instance-based Approach for Matching Export Schemas of Geographical Database Web Services. In: IX Brazilian Symposium on GeoInformatics, 2007, Campos do Jordão. IX Brazilian Symposium on GeoInformatics (GeoInfo 2007), 2007.

25 © Daniela F. Brauner Alinhamento de esquemas conceituais Abordagem adaptativa Query Manager Module Cache Mappings Mapping Rate Estimator Module Occurrence Matrix EMI Matrix SASA 1 Client Query DB A DB B SBSB 8 BRAUNER, D. F.; GAZOLA, A.; CASANOVA, M. A.; BREITMAN, K. K. Matching Schemas of Database Web Services by Mediating User Queries. In: 10th International Conference on Enterprise Information Systems (ICEIS 2008), 12-16, June, Barcelona, Spain (Submitted).

26 © Daniela F. Brauner Alinhamento de esquemas conceituais Geração de esquema conceitual global: Abordagem a priori: –O esquema conceitual global é definido a priori –A pertinência dos elementos (atributos) é confirmada a partir dos mapeamentos realizados Abordagem adaptativa: –Assume-se um dos esquemas conceituais das fontes cadastradas como esquema global (por exemplo, o da primeira fonte cadastrada) –A pertinência dos elementos (atributos) é confirmada a medida que os mapeamentos são descobertos –Novos atributos são incluídos quando novos mapeamentos são descobertos

27 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

28 © Daniela F. Brauner Trabalhos Relacionados Rahm e Bernstein (2001) apresentam um survey incluindo diversas técnicas de alinhamento de esquemas conceituais, e propõem uma taxonomia para classificá-las. Bernstein e Melnik (2007) apresentam uma revisão dos requisitos para um Sistema de Gerenciamento de Modelos (que inclui operações para alinhamento de esquemas, diff de esquemas, transformação de dados a partir dos mapeamentos, etc.). –Apontam a necessidade de inclusão de um componente para execução dos mapeamentos em runtime. Rahm, E.; Bernstein, P. A. A Survey of Approaches to Automatic Schema Matching, The VDLB Journal, vol. 10, pp. 334– 350, Bernstein, P. A.; Melnik, S. Model management 2.0: manipulating richer mappings. In Proc. of the 2007 ACM SIGMOD International Conference on Management of Data, Beijing, China, pp

29 © Daniela F. Brauner Trabalhos Relacionados (Wang et al. 2004) Técnica de alinhamento de esquemas baseada em instâncias usando sondagem de consultas específica de domínio, aplicada a bancos de dados na Web Um banco de dados na Web é composto por: –Esquema de Interface: o que pode ser consultado –Esquema de Resultado: o que é apresentado aos usuários Assume a existência/definição prévia de: –um esquema global para bancos de dados na Web de um mesmo domínio –um conjunto de instâncias de referência Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp

30 © Daniela F. Brauner Trabalhos Relacionados Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp Esquema global + Instâncias de referência TitleAuthorPublisherISBN xxxxxxxxxxxxxxx xxxxxxxxxxx xxxxxxxxxxx xxxxxxxxxxx Instâncias de Referência Web Database (Esquema de Interface)

31 © Daniela F. Brauner Trabalhos Relacionados Wang, J., Wen, J. Lochovsky, F.H. and Ma, W. (2004). Instance-based schema matching for web databases by domain-specific query probing, In Proceedings of 30th Intl. Conference on Very Large Data Bases, pp TitleAuthorPublisherISBN xxxxxxxxxxxxxxx xxxxxxxxxxx xxxxxxxxxxx xxxxxxxxxxx Result Page (Esquema de Resultado) Esquema global + Instâncias de referência Instâncias de Referência Web Database (Esquema de Interface)

32 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

33 © Daniela F. Brauner Contribuições Técnicas baseadas em instâncias para alinhamento de: –esquemas de classificação (tesauros) –esquemas conceituais Classificação das técnicas em a priori e adaptativas Técnicas para, a partir destes alinhamentos, criação de: –esquemas de classificação (tesauros) de referência –esquemas conceituais globais

34 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

35 © Daniela F. Brauner Organização da tese 1.Introdução 2.Trabalhos relacionados 3.Alinhamento de tesauros 4.Alinhamento de esquemas 5.Conclusões

36 © Daniela F. Brauner Agenda Definição do problema Abordagem proposta –Alinhamento de tesauros –Alinhamento de esquemas conceituais Trabalhos relacionados Contribuições Organização da tese Cronograma

37 © Daniela F. Brauner Cronograma

38 Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova


Carregar ppt "Alinhamento de esquemas baseado em instâncias PROPOSTA DE DOUTORADO Daniela F. Brauner Orientador: Prof. Marco Antonio Casanova."

Apresentações semelhantes


Anúncios Google