A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Interoperabilidade e Semântica na Web Ana Maria de Carvalho Moura Instituto Militar de Engenharia - IME Rio de Janeiro - Brasil.

Apresentações semelhantes


Apresentação em tema: "Interoperabilidade e Semântica na Web Ana Maria de Carvalho Moura Instituto Militar de Engenharia - IME Rio de Janeiro - Brasil."— Transcrição da apresentação:

1

2 Interoperabilidade e Semântica na Web Ana Maria de Carvalho Moura anamoura@ime.eb.br Instituto Militar de Engenharia - IME Rio de Janeiro - Brasil

3 Ana Maria Moura - 2001 Sumário zWeb: evolução história zMecanismos de busca zSemântica na Web zMetadados zTecnologias de suporte à interoperabilidade yXML yRDF zAcesso/extração/integração de informação na Web zConclusões e tendências

4 Ana Maria Moura - 2001 A Web: como tudo começou z1990 - CERN zIdéia: tornar o conhecimento accessível a todos e de forma amigável zWWW Consortium (W3C) - 1994 - Berners-Lee yobjetivos: xdar suporte à evolução da tecnologia da informação: infraestrutura - redes, gráfico, interface xencorajar cooperação na indústria: desenvolvimento de interfaces e plataformas padrões

5 Ana Maria Moura - 2001 A Web: um pouco de história z1993 Mosaic:  50 sites z1994: primeiras máquinas de busca (webcrawler, wwww) z1996: US$ 1 bilhão compras na Internet (150 países) z1997: 1 milhão de sites z1998: 300mil provedores z2000: + de 1 bilhão de páginas Web

6 Ana Maria Moura - 2001 Gerações Web z1 a geração: ypáginas HTML criadas manualmente z2 a geração: ygeração automática de páginas HTML p/ processamento humano(leitura, browsing, formulários z3 a geração: yWeb semântica: informação processada por agentes ou robôs

7 Ana Maria Moura - 2001 Grande problema !!! zComo achar o que se deseja?

8 Ana Maria Moura - 2001 Problemas na Web uAumento exponencial do número de documentos eletrônicos publicados na Web; uProblema de “precisão”das atuais ferramentas de pesquisa de informações na Web, que retornam um número grande de documentos não relevantes; uProblemas p/ identificar, descrever e localizar de forma mais eficiente os recursos na Web; uFerramentas mais eficientes de ajuda à navegação uComo integrar recursos na Web?

9 Ana Maria Moura - 2001 Pesquisa e Recuperação na Web zPesquisa em diretório ypesquisa hierárquica, por assunto yindexação manual yex: yahoo, cade, Encyclopedia britannica,...

10 Ana Maria Moura - 2001 Pesquisa e Recuperação na Web zMáquinas de Busca ypesquisa p/ palavra chave (“ache documentos que contém a string XML “) yrobôs percorrem estrutura de hipertexto e recuperam documentos referenciados ydocumentos recuperados são analisados e indexados (lista-invertida) yuso de banco de dados p/ pesquisa y2000: + 500 milhões de páginas e + 300 máquinas de busca Exemplos: lycos, google, infoseek, altavista, excite, hotbot, TodoBr....

11 Ana Maria Moura - 2001 Pesquisa e Recuperação na Web zDiretórios com Máquinas de Busca yPesquisa por palavra chave e por assunto yao longo do percurso hierárquico, máquina de busca (pesquisa por palavra chave) ex: yahoo, magellan

12 Ana Maria Moura - 2001 Pesquisa e Recuperação na Web zMúltiplos mecanismos de busca (meta- search) ycombina e processa resultados de várias máquinas de busca ex: metacrawler: utiliza Altavista, directHit, Excite, FindWhat, Google, Lycos,.....

13 Ana Maria Moura - 2001 Principais problemas dessas ferramentas y Ferramentas de Pesquisa: y indexam páginas individuais e não recursos de informação y pouca precisão do conjunto resultado de uma pesquisa y palavras-chaves extraídas do conteúdo do documento sem informações sobre o contexto no qual estavam inseridas y inexistência de informações padronizadas descrevendo os itens do conjunto resultado de uma pesquisa y inexistência de controle quanto a qualidade dos documentos indexados y consultas pouco expressivas

14 Ana Maria Moura - 2001 Principais problemas dessas ferramentas y Ferramentas de Folheio: y falta de padronização dos esquemas de classificação empregados y só organiza recursos: não trata seus relacionamentos  a catalogação de recursos é custosa e centralizada

15 Ana Maria Moura - 2001 Linguagens Web zUsam topologia da Web em consultas p/ controlar navegação e obter melhores respostas: navegação e pesquisa yWebSQL, W3QL zConsultam conteúdo do documento a partir da estrutura e constrói novos documentos yWebLog

16 Ana Maria Moura - 2001 WebSQL zExplora estrutura e topologia do documento zsemântica clara baseada num modelo de grafo virtual zvisão relacional da Web: ydocumento(url, titulo,texto,type, lenght,modif) ex: encontre todos os documentos html sobre XML select d.url, d.titulo from Documento d such that d mentions “XML” where d.type=“text.html”

17 Ana Maria Moura - 2001 Outras linguagens zW3QL yparecida com WebSQL: foco em interoperabilidade - uso com outras ferramentas zWebLog ydocumento baseado em estrutura html ylinguagem baseada em lógica p/ consulta e reestruturação da informação EX: obtenha todos os links p/ documentos html e os títulos correspondentes ans.html[title  ’all citations’, hlink ->>L, occurs ->>T]:- dblp_pages[hlink ->>L],href(L,U), U[title ->>T].

18 Ana Maria Moura - 2001 Semântica na Web zSemântica  capacidade da informação ser processável por máquina zDescrever propriedades e relacionamentos sobre itens (metadados) na Web zMetadados, RDF, ontologias

19 Ana Maria Moura - 2001 Visão semântica da Web zDepende da capacidade de promover intercâmbio de informações ? Interoperabilidade semântica estrutural sintática

20 Ana Maria Moura - 2001 Interoperabilidade ySemântica Uma arquitetura é capaz de prover interoperabilidade semântica quando possibilita a compreensão de cada descritor do recurso (independentemente da forma com que foi descrito) e suas associações com outros; yEstrutural Uma arquitetura é capaz de prover interoperabilidade estrutural quando provê representação para modelo de dados distintos, permitindo especificar tipos e possíveis valores para cada forma de representação; ySintaxe Uma arquitetura é capaz de prover interoperabilidade de sintaxe quando provê um regras precisas para promover o transporte de informações na Web.

21 Ana Maria Moura - 2001 Metadado zMeta: ysignifica “algo que descreve...” xe.g. meta-object, meta-information, metadata, meta-modelo zMeta - Meta ysignifica “algo que descreve algo que descreve...” zMetadados ydados que descrevem o conteúdo, estrutura, representação e contexto de algum conjunto de dados

22 Ana Maria Moura - 2001 Exemplos zFichas de uma biblioteca tradicional zCatálogos de SGBDs zTags em páginas HTML, XML zDicionários de Ferramentas CASE zDescritores de Bibliotecas Digitais zDescritores de imagens, video zDescritores de documentos na web z...

23 Ana Maria Moura - 2001 Dado X Metadado dados s/ autor Termos e Condições Críticas: O Globo AB C Titanic Produtores Termos e condições dados administr

24 Ana Maria Moura - 2001 Onde está a fronteira? zContexto A:  dado: Críticas de O Globo  metadado: dados s/ autor(A), termos e condições de acesso(A) zContexto B:  dado: filme Titanic  metadado: críticas de O Globo(A), Produtores (B) e termos e condições (C) zContexto C:  dado: termos e condições  metadado:dados administrat.(C)

25 Ana Maria Moura - 2001 Uso de Metadados zGerência de Recursos de Informação Corporativos zComputer-aided design zProjeto e gerência de Data Warehouses zGerência de documentos zGerência de dados científicos e grandes bases estatísticas zGerência de recursos na Web zIntegração de BD Heterogêneos zProjeto e gerência de Workflow zIntegração de recursos na Web z...

26 Ana Maria Moura - 2001 Papel do metadado na Web y Identificar  Localizar ( informação s/ identif. recurso, assunto, descrição,... )  Descrever ( que informação será expressa? ydepende do tipo de recurso, objetivos) y Recuperar y Utilizar Recursos de Informação

27 Ana Maria Moura - 2001 Localização de recursos na Web zProcesso compreende duas fases: zLocalização: a partir de de critérios de seleção (assunto, data, autor,…) zExame: os metadados relativos aos recursos candidatos são verificados pelo usuário para seleção dos recursos desejados zMetadados são empregados para: zencontrar informações relevantes zencontrar uma informação já conhecida zencontrar novas informações zauxiliar na análise da conveniência de uso do objeto zpossibilitar consultas campo a campo

28 Ana Maria Moura - 2001 Recuperação de recursos na Web zRecuperação: acesso aos recursos de informação selecionados pelo usuário z Metadados são empregados para: z possibilitar a negociação de formato entre cliente e servidor (conversão automática de formato - ex: MIME) zpossibilitar a negociação dos custos envolvidos na transferência do objeto selecionado para o cliente: período de acesso, tempo de acesso, formato desejado, quem está solicitando acesso, etc. zpossibilitar o conhecimento prévio do conteúdo do documento  possibilitar privacidade expressando de forma mais adequada “termos e condições” para acesso e uso de um recurso, etc.

29 Ana Maria Moura - 2001 A Web hoje zMecanismo de identificação : yUniform Resource Locator (“URL”) yex: http://www.rpi.edu/decemb/contents.html yPrincipais problemas: yreferências a recursos pendentes na Web yinexistência de mecanismos de balanceamento automático de carga na rede, c/ redirecionamento automático p/ outro servidor; ylentidão na recuperação de recursos, devido a inexistência de “caches” dos recursos mais utilizados; ybaixa tolerância do sistema à falhas, devido a impossibilidade de redirecionamento p/ outros servidores.

30 Ana Maria Moura - 2001 Metadados na Web hoje zMetadados embutidos no recurso: Declaração da linguagem HTML: <META NAME=“autor” CONTENT=“Cassia Barreto” Tags embutidos no XML: Do Fortran à Internet zMetadados como anexo ao recurso: Cabeçalho do Protocolo HTTP: emitidos pelo servidor ao cliente “Expires: Mon, 13 may 1998 09:13:25 GMT” zMetadados mantidos separados do recurso: Plataforma PICS (Plataform for Internet: Content Selection) rótulos para avaliação de conteúdo

31 Ana Maria Moura - 2001 Soluções Propostas (W3C) zPadrões de metadados zXML zRDF zOntologias

32 Ana Maria Moura - 2001 Padrões de Metadados Objetivos: yConj. termos p/ descrição de uma ou mais categorias de recursos yObter resultados mais precisos no processo de busca de recursos de informação na web yestabelecimento de padrões de metadados, modelos e protocolos e sua integração a mecanismos de busca na web

33 Ana Maria Moura - 2001 Catalogação bibliográfica  MARC ( Machine Readable Catalogue) anos 60  TEI ( Text Encoding Initiative - 1994)  EAD ( Encoding Archival Description -1993) zRFC1807 (Request for Comments)

34 Ana Maria Moura - 2001 Infraestrutura global da informação  GILS ( Government Information Locator Service 1996) ybusca de informação em agências governamentais

35 Ana Maria Moura - 2001 Descoberta de Recursos na Web zmetadados utilizados no contexto de robôs(Harvest, por.ex.), dando suporte a administradores de sites; zdados indexados coletados por ferramentas automáticas não têm formato padrão: nenhuma semântica  IAFA (Internet Anonymous Ftp Archive - 1995) - grupo IETF (internet Engineering Task Force) ySOIF ( Summary Object Interchange Format -1994) yDublin Core (DC -1995)

36 Ana Maria Moura - 2001 Dublin Core z(DLOs): documentos vistos como objetos yassociado a arquiteturas de metadados zObjetivos: ydescrever as propriedades dos objetos ypermitir descritores extras específicos a um domínio ya descrição de elementos é opcional ytodos os elementos do DC podem se repetir yelementos autos explicativos zpadrão W3C

37 Ana Maria Moura - 2001 Descritores do DC (15) zSubject tópico relacionado ao objeto descrito zTitlenome do objeto zAuthorresponsáveis pelo conteúdo intelectual do objeto zPublisheragente responsável por tornar o objeto disponível zOtherAgent pessoas que contribuíram de forma significativa para o conteúdo intelectual do objeto zDatedata de publicação zObjectTypegênero do objeto zForm formato de dado do objeto zIdentifier identifica o recurso de forma única zRelationindica um tipo de relacionamento com outros objetos zSourceobjetos dos quais o objeto descrito é derivado zLanguageidioma relativo ao conteúdo intelectual do objeto zCoveragelocalização espacial e duração temporal do objeto zRightscontém ou referencia direitos de propriedade zDescriptioncontém uma descrição textual do objeto

38 Ana Maria Moura - 2001 Dados geográficos/ dados ambientais zFDGC (Federal Geographic Data Committee- 1994) zUDK (Environmental Data Catalogue - 1998)

39 Ana Maria Moura - 2001 Tecnologias de suporte à interoperabilidade zPadrão W3C: y padrões de metadados: DC y XML y arquitetura RDF

40 Ana Maria Moura - 2001 Por que XML? zPadrão w3C: ++ conteúdo !!! ySGML Standard Generalized Markup Language (Goldfarb, Mosher, Lorie -1974) SGML HTML XML-1996

41 Ana Maria Moura - 2001 HTML: sérias limitações zEm relação ao acoplamento com BDs ygeralmente soluções proprietárias ynenhum protocolo p/ publicação de dados xSQL: não adequada p/ Web ynão possui formato de intercâmbio: HTML é apenas um formato de apresentação! xmistura apresentação e conteúdo xnenhuma estrutura, semântica, restrições de integridade xperde informação sobre a estrutura (esquema) de BDs

42 Ana Maria Moura - 2001 HTML Bibliography Principles of Distributed Database Systems Ozsu, Valduriez Prentice Hall, 1999 Data on the Web Abiteboul, Buneman, Vianu Morgan Kaufmann, 1999

43 Ana Maria Moura - 2001 HTML: descreve apresentação

44 Ana Maria Moura - 2001 The Golden Rule “Content must be abstract and independent from storage and rendition”  aplicações dinâmicas (“rendition” difere conforme a mídia, consulta ou perfil do usuário)  integração de dados heterogêneos (de diferentes fontes)

45 Ana Maria Moura - 2001 XML: Extended Markup Language zObjetivos yrepresentar a semântica dos dados de forma estruturada (dados e metadados) ypadrão para representar e intercambiar dados estruturados na Internet ypermitir modelar dados heterogêneos gerados a partir de BDs ou processadores de texto, de forma que máquinas de busca possam localizá-los e processar documentos ou registros heterogêneos yconsultar conteúdo de documentos na Web zsuporta a regra dourada (“the golden rule”)

46 Ana Maria Moura - 2001 XML descreve conteúdo Principles of Distributed Database Systems Ozsu Valduriez Prentice Hall 1999 Data on the Web Abiteboul Buneman Vianu Morgan Kaufmann 1999

47 Ana Maria Moura - 2001 Em XML... zUsuários definem suas próprias marcações (tags) zUm documento XML não provê nenhum comando de exibição ystylesheets (XLS) p/ converter em HTML zEstruturas podem ser aninhadas zUm documento XML pode conter uma descrição opcional de sua gramática (DTD)

48 Ana Maria Moura - 2001 XML zSintaxe: yelementos, atributos, entidades, documentos válidos zÉ um modelo de dados semi-estruturados zDefinição de tipos de documentos ytipos de dados, esquemas DTD, namespaces zXML- Schema ymetadados com RDF

49 Ana Maria Moura - 2001 Terminologia zMarcações (tags): livro, título, autor (atributos únicos) yInício de marcação: yFim de marcação: zTodos os dados são texto: PCDATA (parsed character data) zElementos: y …, …. yelemento vazio: zUm documento XML: uma única raiz zRestrições fracas

50 Ana Maria Moura - 2001 Exemplo Alessandro Fabio Leonardo Marcador de início Marcador de fim é subelemento de que é subelemento de Não existe limite na profundidade de hierarquia é subelemento de que é subelemento de Não existe limite na profundidade de hierarquia Marcador vazio

51 Ana Maria Moura - 2001 Atributos zPropriedades das marcações ypares constituídos de: (nome, valor) Exemplo: Principles of Distributed Database Systems Ozsu Valduriez … English

52 Ana Maria Moura - 2001 Outro exemplo Atributos - [nome, valor]. Andre É possível utilizar indistintamente elementos e atributos Andre Rua Jaguare 303 Niteroi

53 Ana Maria Moura - 2001 Observações  O único tipo de dado que pode ser definido para um atributo é a seqüência de caracteres.  Os elementos podem conter sub-elementos, portanto, podem ser usados para definir objetos complexos.  Cada atributo só pode aparecer uma única vez dentro de um elemento,  Um elemento pode conter N sub-elementos.

54 Ana Maria Moura - 2001 Alternativas p/ representar dados < livro lang= “Ingles” preco= “US$ 60.00” titulo= “Principles of Distributed Database Systems” autor=“Ozsu Valduriez”> …. Principles of Distributed Database Systems ….

55 Ana Maria Moura - 2001 Entidades zUnidade do texto XML com um nome ypode ser referenciado entre múltiplos documentos yníveis de granularidade arbitrários (palavra, sentença, parágrafo, capítulo, volume, etc.) yconteúdo armazenado em arquivo, BDs,… zProvê independência de dados yelementos especificam estrutura lógica yentidades especificam estrutura física zUm doc. XML pode ser dividido em pedaços ( o parser gera uma estrutura linear)

56 Ana Maria Moura - 2001 Exemplos zAbreviação zdeclaração externa zreferência XML(&XML) representa um padrão para intercâmbio de dados na Web. No depto de Computação do &ime- def pesquisadores estão começando a…

57 Ana Maria Moura - 2001 Identificadores e referências zElementos podem ter identificadores únicos, podendo ser utilizados como referências Navathe Elmasri Fundamental of Database Systems Mc GrawHill 2000

58 Ana Maria Moura - 2001 XML : sob uma perspectiva relacional zTabela relacional: documento XML em 3 níveis - raiz, tabela, coluna zEx: Livro(titulo, editor, ano) tabela Fundamentals of Dadabase.... McGrawHill 2000........... 1 Tupla !

59 Ana Maria Moura - 2001 XML: modelo de dados semi- estruturados Livro Titulo Editor Ano McGrawHillFundamentals of... 2000 Pessoa Nome Navathe Pessoa Nome Elmasri idref Autores nenhum esquema dados não tipados grafo rotulado cada nó  tag folha =tag + texto arco rotulado = referência

60 Ana Maria Moura - 2001 Document Type Definition(DTD) zDTDs representam metadados! zdefine a estrutura lógica do documento ydefine a gramática: combinações válidas de palavras zé definida em uma linguagem a parte zconjunto de restrições muito limitado ynão permite a criação de tipos de dados ynão permite restrição de intervalos para dados zgarante documentos válidos ydocumentos bem formados em conformidade com o DTD (parser)

61 Ana Maria Moura - 2001 Um DTD define a estrutura do conteúdo 1 0.. * 1.. * Diferentes possibilidades de DTDs !!! Artigo Autor 1 Instituição Autor n Instituição... Artigo Instituição 1 Autor 1 Autor n... 12 Instituição n Autor 1 Autor p... 3 Autor Instituição Artigo 1.... Artigo x instituicao artigo autor UML

62 Ana Maria Moura - 2001 DTD bd livro1 livro2livro3 tit autorano ….. A ordem dos elementos deve ser respeitada!!!

63 Ana Maria Moura - 2001 Exemplo de um DTD <!DOCTYPE bd [ ]>

64 Ana Maria Moura - 2001 DTD p/ um esquema relacional zTab1(m,n), Tab2(p) <!DOCTYPE bd [ ]> Ordem das colunas irrelevante !

65 Ana Maria Moura - 2001 Atributos e referências em DTD <!ATTLIST livro autor IDREFS #REQUIRED idioma (#PCDATA)>#IMPLIED > Ozsu Valduriez Principles of…

66 Ana Maria Moura - 2001 Limitações do DTD zImpõe ordem (verbose) znão aceita tipagem de dados (somente PCDATA) zElementos são globais: não permite nome de livro, nome de pessoa em diferentes estruturas zuso de namespaces znenhuma restrição no tipo IDREF ynão há como expressar chaves, ou dizer que um atributo autor é um identificador de pessoa

67 Ana Maria Moura - 2001 Namespaces zDefine o vocabulário utilizado num esquema ynomes de atributos c/ prefixo xmlns seguido de um atributo yvalor do atributo é uma URL Exemplo: Fundamentals of… 10 12345456

68 Ana Maria Moura - 2001 Proposta W3c zXML Schema ysubstituir DTD ymais tipos de dados: string, integer, real, time, date… ynamespaces

69 Ana Maria Moura - 2001 XML: estilo, formatação e transformação zXML define estrutura e conteúdo de documento, não define apresentação zLinguagem de estilo: define regras para a exibição de um documento XML -XSL: extended style language) zLinguagem de transformação: define regras para a transformação de uma linguagem XML em outra linguagem XML. Ex: transformação de XML em HTML.

70 Ana Maria Moura - 2001 Estilo Browser XML XML XSL

71 Ana Maria Moura - 2001 Transformação/Formatação Processador XSL WML PDFHTML XMLXSL

72 Ana Maria Moura - 2001 Linguagens de Consulta zAs linguagens de consulta XML baseiam-se em caminhos de expressão yXpath yXlink yXpointer

73 Ana Maria Moura - 2001 Expressões de caminho (path) /elemento raiz /bdum elemento abaixo da raiz bd /livroum livro num bd bd // livro um livro em qq profundidade @priceum atributo preço bd / livro /@precoum atributo preço num bd bd / livro[@ preco] livros com um determinado preço bd / livro[@ preco =’10’] livros com preço 10 // livro /parag[2]o 2 0 parágrafo de um livro qq nível

74 Ana Maria Moura - 2001 Outras linguagens... zLorel(Abiteboul, Widom 1997) zXML- QL (At&T Labs - 1998) zXQL (Microsoft - 1998) zYatl (Cluet, Simeon - INRIA, 1999) zXSL (W3C, 1998) zXML-GL (Ceri et al. - 1999) zQuilt (Chamberlin et al - 2000) z...

75 Ana Maria Moura - 2001 XQL zMicrosoft, Texel zuso de Xpath Exemplo 1. //livro[@language=“english”]/autor A1 A2 2. bd/livro[autor/@ano>1995]

76 Ana Maria Moura - 2001 Inspirados no SQL: XML- QL zProjeto Strudel (At&T) ybaseada em expressões regulares ycláusula where (seleção) ytemplates p/ construir dados Exemplo: where Mc Graw Hill $A in “www.abc.com/bd.xml” construct $A Resposta: conjunto de autores A1 A2

77 Ana Maria Moura - 2001 XML- QL where Prentice Hall $A in “www.ime.eb.br/bd.xml” construct $A $L Resultado: A1 L1 A2 L2

78 Ana Maria Moura - 2001 Junção por valor em XML- QL zAutores que publicaram no mínimo 2 livros where $B1 in “www.ime.eb.br/bd.xml” $A in $B1 $B2 in “www.ime.eb.br/bd.xml” $A in $B2 B1!=B2 construct $A

79 Ana Maria Moura - 2001 Lorel zbaseado no OEM (Object Exchange Model) zextensão OQL p/ OEM Select xml(result:$b) from from $b in livro.autor where $b.nome= “Ozsu” and and $b.@ano >1995

80 Ana Maria Moura - 2001 Yatl zconversão de dados e integração zmodelo dados: árvores ordenadas, referências, nós Recupere títulos de livros publicados in 1995 por Prentice Hall make result[$t] match > with livro[@ano[$a], titulo[$t] editor[$e]] where $e=“Prentice-Hall” and $a=1995

81 Ana Maria Moura - 2001 Quilt zcaracterísticas de OQL,XML-QL, Lorel, XQL zlimitações: junção, expressões regulares(full), Xpath for $b in document(http:// www.ime.eb.br/bd.xml”)//livro, $a in $b/autor and $e in $e/editor where $a/nome=“Ozsu” and $e/“Prentice Hall” return $b

82 Ana Maria Moura - 2001 XSL zXSL Transformations(XSLT), recomendação W3C zregras de transformação XML XML zprograma XSLT é um documento XML! zmais usado como ling. de apresentação

83 Ana Maria Moura - 2001 Resource Description Format ( RDF) - W3C Características: zModelo de metadados simples e expressivo: ytrata dados/metadados de forma uniforme zProvê interoperabilidade na Web (XML) zMeio de integração entre diferentes padrões de metadados z Expressa vocabulários distintos com base em um modelo de dados e sintaxe comuns

84 Ana Maria Moura - 2001 RDF: visão em camadas Descrição de recursos Aplicação RDF RDF Schema RDF básico (statements) instância de (meta-metamodelo) (metamodelo) (modelo) (dados) descreve

85 Ana Maria Moura - 2001 Modelo RDF básico yDefine um formalismo para a definição de recursos  estrutura: DLG (Directed Labeled Graph)  sintaxe : utiliza a linguagem XML yComponentes básicos: y recursos: qualquer recurso que pode ser descrito segundo o modelo RDF ypropriedades(properties): representa um atributo (ou relacionamento) de um recurso ydeclarações (statements): corresponde a associação entre um recurso específico, uma propriedade qualquer e o valor dessa propriedade para esse recurso(predicado, subject, object) yliterais: conjunto de elementos que não são recursos (strings)

86 Ana Maria Moura - 2001 RDF: estrutura básica Recurso Valor propriedade http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Ana Maria Documento Valor autora Representação de um documento em RDF Statement sujeito predicado

87 Ana Maria Moura - 2001 RDF http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Ana Maria Documento Valor dc:creator Metadados <rdf: RDF xmlns:rdf= “http://www.w3c.org./1999/02/22/22-rdf-syntax-ns#” xmlns:dc = “http://purl.org/dc/elements/1.1”> Ana Maria metadados dc:subject

88 Ana Maria Moura - 2001 Entidade estruturada http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Metadados dc:subject Ana Maria anamoura@ime.eb.br mod:nome mod:e-mail <rdf: RDF xmlns:rdf= “http://www.w3c.org./1999/02/22/22-rdf-syntax-ns#” xmlns:dc = “http://purl.org/dc/elements/1.1”> xmlns:mod=“http://www.ime.eb.br/de9/sgdc_w/xyz/definition Ana Maria anamoura@ime.eb.br metadados dc:creator recurso anônimo A pessoa cujo nome é Ana Maria e e-mail ana... é criadora do recurso http//.... entitulado Metadados

89 Ana Maria Moura - 2001 Propriedade como um outro recurso http://www.ipanema.ime.eb.br/~anamoura/public/metadado.html Metadados dc:subject http://fotos/ana/ Ana Maria anamoura@ime.eb.br mod:nome mod:e-mail dc:creator

90 Ana Maria Moura - 2001 Propriedade como um outro recurso <rdf: RDF xmlns:rdf= “http://www.w3c.org./1999/02/22/22-rdf-syntax-ns#” xmlns:dc = “http://purl.org/dc/elements/1.1”> xmlns:mod=“http://www.ime.eb.br/de9/sgdc_w/xyz/definition “ http://fotos/ana” metadados Ana Maria anamoura@ime.eb.br outro recurso

91 Ana Maria Moura - 2001 Coleções em RDF http://curso/top.avanc.bd/turma rdf:bag / alunos/Veronica / alunos/Eduardo / alunos/Leticia / alunos/Eduardo rdf:type rdf:_1 rdf:_4 ….. rdf: Bag rdf: Sequence rdf: Alternative alunos

92 Ana Maria Moura - 2001 RDF/XML com um Bag <rdf: RDF xmlns:rdf= “http://www.w3c.org./1999/02/22/22-rdf-syntax-ns#” xmlns:s = “http://minhas definicoes#”> <rdf: Description about=“http://curso/top.avanc.bd/turma”

93 Ana Maria Moura - 2001 RDF Schema (RDFS) u Objetivo provê um sistema de tipos para a declaração de propriedades de recursos (título, autor, etc.), dos relacionamentos entre essas propriedades, das classes de recursos em que essas propriedades se aplicam e das combinações possíveis entre classes e propriedades. u Enfoque: y representação de objetos e classes de objetos  representação de propriedades/ relacionamentos de objetos

94 Ana Maria Moura - 2001 RDF Schema (RDFS)  Modelo de dados: y estruturado segundo o modelo de dados básico da RDF, ou seja, como recursos e propriedades yfacilita a descrição de domínios específicos ysintaxe empregada: linguagem XML  elementos do RDF Schema definidos no namespace rdfs

95 Ana Maria Moura - 2001 Elementos do RDF Schema zrdfs:Class zrdfs:Resource zrdfs:subClassOf zrdfs:subPropertyOf zrdfs:domain: propriedade de rdf:property, indica a que classe uma propriedade pertence (atributo de) zrdfs:range: propriedade de rdf:property, especifica os valores permitidos de uma determinada propriedade de uma ou mais classes.

96 Ana Maria Moura - 2001 RDFS uClasses de objetos: rdfs:Resource, rdfs:Property, rdf:Class, rdfs:ConstraintResource, rdfs:ConstraintProperty u Nomes de propriedades / relacionamentos: rdf:type, rdfs: subClassOf, rdfs:subPropertyOf, rdfs:range, rdfs:domain

97 Ana Maria Moura - 2001 Hierarquia de Classes

98 Ana Maria Moura - 2001 Exemplo de aplicação no RDF Schema rdfs:Resource rdfs:Class xyz:Automóvel s = rdfs:subClassOf t = rdf:type s t s t t s xyz: VeículoDePassageiro t s xyz:Caminhão t ` marca ` modelo d d literal r r autom marca modelo veic.pass caminhao

99 Ana Maria Moura - 2001 Camadas de modelagem t Junção das Camadas RDF Básico e Esquema RDF Camada de Instanciação dos Recursos Camada de Aplicação RDF t xyz:marca Chevrolet Corsa t xyz :marca xyz :modelo t s t t s rdfs:Class xyz:Automóvel rdfs:Resource t xyz:modelo http://www.ime.transp/Veiculos rdf:Property Descrição de Recursos Aplicação RDF Descreve Esquema RDF Descreve Objetos do domínio do usuário Modelo Metamodelo Meta-Metamodelo Descreve RDF Básico

100 Ana Maria Moura - 2001 Consultas em RDF zLinguagens de consulta p/ XML não fornecem suporte a esquemas RDF zPropostas: yRDF Query (Malhotra, 1998 - IBM) ex: Achar todos recursos de uma coleção

101 Ana Maria Moura - 2001 RDF query zConsulta ao metadado estrutural de um recurso

102 Ana Maria Moura - 2001 Linguagens com serviço de inferência ztotal suporte de descrições RDF zbase de conhecimento extraída a partir de triplas (resource, property, value) em lógica de 1 a ordem ySilRI (W3C) - Frame logic yMetalog (W3C) xregras de inferência no esquema RDF zAmbas ainda não passam de propostas

103 Ana Maria Moura - 2001 BDs Web Sistemas de BDs projetados para usuários Web casuais, que desejam consultar informações integradas da Web. Serviços relevantes: zfacilidade de acesso à informação na Web zconsultas complexas em um grande número de sites Web

104 Ana Maria Moura - 2001 Desafios de um projeto de BDs Web zSob ponto de vista do usuário: yindependência lógica: usuários ocasionais devem ser capazes de formular consultas ad-hoc ynão cabe a usuários localizar/relacionar sites e resolver diferenças de apresentação de cada site yindependência de navegação: cada site com suas características específicas de consulta e recuperação zSob ponto de vista do projetista ysites são autônomos

105 Ana Maria Moura - 2001 BDWeb X BDs Esquema Conceitual/Externo Esquema Lógico Esquema Físico BD SQL/QBE Esquema Conceitual/Externo Esquema Lógico Esquema Virtual Físico interface ad-hoc Web independência lógica independência de site fonte: Florescu, Freire -tutorial SBBD 2000

106 Ana Maria Moura - 2001 Construindo um BD Web zLocalizar informação zExtrair fontes de informação (Wrappers) yextrair esquemas (RDF, por exemplo) ymodelos Web zIntegrar fontes yesquema + integração semântica (uso de ontologias) zProcessar de consultas

107 Ana Maria Moura - 2001 Extraindo informação Mediador wrapper..... Site Web acesso à informação WebVCR (Freire et al wwww99) Mapping by example ( Davalcu et al Sigmod99) extração da informação NoDose (Adelberg, Sigmod98) Ariadne (Knoblock et al AAAI97) W4F (Sahuguet et al. -VLDB99) XML/RDF : simplifica extração descrição da informação protocolo http 80% dados escondidos (formulários...)

108 Ana Maria Moura - 2001 Integrando fontes zSimilar aos mediadores zComo integrar: ymaterializar X dado virtual yvisão local X visão global yrelacional X XML ylinguagens de integração (XML, Datalog,....) zIntegração semântica

109 Ana Maria Moura - 2001 Integração semântica zProblema: garantir mesmo conceito a partir de representações diferentes Esquema Conceitual Esquema Lógico1 Esquema Lógico2 Esquema Lógico n..... Site Web

110 Ana Maria Moura - 2001 Como integrar diferentes representações de um mesmo conceito? Temperaturas cid ano valor RJ 1998 30 SP 1998 25 SP 1999 34 Temperaturas cid 1998 1999 RJ 30 30 SP 25 34 Temp_1998 cid valor RJ 30 SP 25 Temp_1999 cid valor RJ 30 SP 34 Ano: valorAno: atributo Ano: tabela

111 Ana Maria Moura - 2001 Integração semântica zEx. de sistemas integradores: yTSIMMIS e Information Manifold yAraneus e Web Integrator yYat (baseado em XML) zRDF + ontologias é um caminho

112 Ana Maria Moura - 2001 Processamento de consultas zOtimização complexa ynenhuma informação sobre cardinalidade, distribuição, índices ypadrão de acesso limitado zInformação redundante nas fontes zDisponibilidade dos dados é imprevisível zTaxa de carga dos dados muito variável

113 Ana Maria Moura - 2001 Sumário e conclusões zVisão dos conceitos importantes para permitir interoperabilidade na Web zMáquinas de busca são serviços importantes, mas ainda muito limitadas: necessidade de mecanismos de consultas ad-hoc zTecnologia XML ymuitos desafios p/ a comunidade de BDs ymuitas linguagens de consulta yiniciativas importantes da W3C: xRDF é um caminho para integração: provê interoperabilidade sintática, estrutural mas ainda requer algo mais (ontologias) para interop. semântica)

114 Ana Maria Moura - 2001 Tendências zGerenciamento de dados XML (atualização, indexação, armazenamento em SGBDs RO e BDs nativos) zVisões XML de SGBDsRO zMecanismos de busca que combinem pesquisa estruturada com pesquisa full-text zBenchmarks XML zRDF + ontologias + XML zLinguagens de consulta RDF z.....

115 Ana Maria Moura - 2001 Bibliografia zT. Berners-Lee, J. Hendler, O. Lassila. The Semantic Web, http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html, 2001 zBergamaschi S., Castano S., Vincini M.Semantic Integration of Semistructured and Structured Data Sources. SIGMOD Record, março 1999. zA. Bonifati, S. Ceri. Comparative Analysis of Five XML Query Languages, Dipartimento di Elettronica e Informazione, Politecnico di Milano, http://citeseer.nj.nec.com/325897-html, accessed in 2001. zDavid P. Habib and Robert L. Balliot. How to Search the World Wide Web: A Tutorial for Beginners and Non-Experts. http://204.17.98.73/midlib/tutor.htm#GSE, 2000. zKansas City Publication Library. Introduction to Search Engines. http://www.kcpl.lib.mo.us/search/srchengines.htm, 2001. zG. Karvounarakis. RDF Query Languages: A state-of-the-art, http://www.ics.forth.gr/proj/isst/RDF/RQL/rdfql.html, 2000. zA. Malhotra, N. Sundaresan. RDF Query Specification, http://www.w3.org/TandS/QL/QL98/pp/rdfquery.html#jCentral, 1998. zA.M. C. Moura, M.L. M. Campos and C.M.Barreto. A Survey on Metadata for Describing and Retrieving Internet Resources. World Wide Web Journal, Vol 1, Baltzer Science Publishers BV, 221-240, Jan. 1999.

116 Ana Maria Moura - 2001 Bibliografia zS. Rayavarapu. W3C Query Languages, http://www.coe.neu.edu/~srayavar/W3CQL/ql.htm, 2001Resource Description Framework (RDF) Model and Sintax Specification 1.0 - W3C Recommendation 22 February 1999, http://www.w3.org/TR/1999/REC-rdf-syntaxe-19990222, 1999. zResource Description Framework (RDF) Model and Syntax Specification – W3C Recommendation 27 March 2000, http://www.w3.org/TR/2000/CR-rdf-schema-20000327, 2000. zFreire J., Florescu D. Querying the Web, tutorial realizado no Simpósio Brasileiro de Banco de Dados, J. Pessoa PB, Brazil, 2000. zBergamaschi S., Castano S., Vincini M.Semantic Integration of Semistructured and Structured Data Sources. SIGMOD Record, março 1999. zFernandez M., Simeon J., Wadler O.XML Query Languages: Experiences and Exemplars, http://www-db.research.bell-Labs.com/simeon/xquery.html zMolina G. H., Papakonstantinou Y., Quass D.The TSIMMIS Approach to Mediation: Data Model and Languages. Journal of Intelligent Information Systems [online], 1997. Available at: http://www.db.stanford.edu/tsimmis/publication.html.


Carregar ppt "Interoperabilidade e Semântica na Web Ana Maria de Carvalho Moura Instituto Militar de Engenharia - IME Rio de Janeiro - Brasil."

Apresentações semelhantes


Anúncios Google