Gestão e Recuperação de Informação Informação Estruturada José Borbinha – DEI/IST.

Slides:



Advertisements
Apresentações semelhantes
Faculdades Integradas Santa Cruz
Advertisements

Proposta de uma Biblioteca Digital para Trabalhos Monográficos do Departamento de Computação da Universidade Federal de Ouro Preto Gustavo Henrique Braz.
Open Archives Initiative Algumas definições ( Trata-se de uma iniciativa para desenvolver e promover padrões de interoperabilidade.
Conhecimento e Inovação com as TIC Salas TIC Agenda Solução Técnica School Server 2004 Construção da estação de trabalho Actualizações de antivírus.
Novas Tecnologias ao Serviço da PORBASE Jornadas Porbase 11 de Dezembro de 2003.
Elementos Acadêmicos e Profissionais em Ciência e Tecnologia
Propriedades de Documentos
Documentos Digitais Aula 6.
HTML – Hyper Text Markup Language
Sistemas Distribuídos Web Services
Aplicação de XML Web Semântica Tópicos Avançados em Bancos de Dados II
Vânia Maria Ponte Vidal
ESTADO DO PARANÁ NÚCLEO REGIONAL DE EDUCAÇÃO DE GUARAPUAVA.
Guião de pesquisa 3.º ano E.B Zambujeira.
DigiTool – Visão Geral 1º Encontro de Usuários ALEPH 30 Nov. e 1º Dez. de 2006 Caio Pellegatti.
Formação PowerPoint 2010 Aline Loyanne Ana Vital Filipa Cordeiro
A grande rede mundial de computadores
HTML O que é? HiperText Markup Language
Sistemas Distribuídos
Vortex 2005.
Metadados.
HTML Básico João Araujo.
Treinamento do Microsoft® Access® 2010
Web Services Uninorte Semana de Tecnologia da Informação
Tutorial de Wordpress. Sobre o Wordpress  O Wordpress é um gerenciador de conteúdo na web (em especial, blogs). A grande diferença com relação a seus.
Smartphones for Seniors Apresentação das aplicações WIT Software.
Projecto APEL Digital Com o apoio de:Parceiro:. Projecto APEL Digital •Este projecto visa a substituição de processos manuais no tratamento e disponibilização.
Recuperação de Informação
Profª Angela Tissi Tracierra. Tags... As tags... fazem a formatação de fonte no texto que envolvem no documento HTML. Juntamente a essas tags utilizam-se.
TIC 8º ANO (2013/2014) Analise e pesquisa de informação.
Nelson Vieira Nº 12 Manutenção Industrial. Servidor: Em informática, um servidor é um sistema de computação centralizada que fornece serviços a uma.
Inteligência Artificial Web Semântica
1 Efficient Phrase Querying with an Auxiliary Index (SIGIR) 2002 Trabalho realizado por: Trabalho realizado por: João Casteleiro Alves João Casteleiro.
DCMI Dublin Core Metadata Initiative por Pablo Lopes Alenquer curso Tópicos Especiais em BD2 data Março de 2000 Mestrado IM / NCE.
Professor Esp. Diego André Sant’Ana Disciplina: Sistemas Operacionais II Sistemas de Arquivos- Tipo de arquivos – Cap
Tutorial Portal / Hotel de Hilbert Coordenadores de Iniciação Científica.
Passo a passo – Instrutor PeerMark – Avaliação por Pares.
HTML HyperText Markup Language. 2 Origem O HTML foi criado, juntamente com o HTTP nos laboratórios do CERN, na europa para permitir a consulta de documentos.
ATSI 2007 Sobre Alinhamento os exemplos que seguem são tirados ”tal qual” dos resumos da aula teórica entregues pelos alunos...
Banco de Dados e Internet
Web Services Marden Menezes Sharp Shooters.NET User’s Group Recife-PE11/11/2002.
Gestão e Recuperação de Informação Recuperação de Informação na Web José Borbinha – DEI/IST.
Utilização de Ontologias para Integração de Heterogeneidade Semântica
Alunos: Diogo do Nascimento Leandro Luiz Mendes
Aplicativos Web – Web Design
Backlog Lílian.
Engenhos de Busca Renato Marcelino de Oliveira. World Wide Web Existem centenas de milhões de paginas na web tratando de variados assuntos.
PROFA. REANE FRANCO GOULART Letramento Digital - Publicação Video 1.
Redefinição do Modelo Conceitual do Repositório. Modelo Conceitual Anterior Novo Modelo Conceitual (Adotar) A maior mudança no Novo Modelo Conceitual.
Ferramentas para Sistema Web Sistemas de Informação Aula 9 – 08/05/2013.
Como usar HTML em seus anúncios no MercadoLivre
REDES DE COMPUTADORES II
Felipe Nunes Flores – Programa de Educação Tutorial.
Sistemas de Arquivos. Alocação em memória – Problemas Quantidade Limitada de Informações Perda de informações quando o processo é terminado Vários processos.
Projeto Supervisionado no Desenvolvimento de Aplicações Profissionais na Web Webservices.
A EXPERIÊNCIA DO ARCA REPOSITÓRIO INSTITUCIONAL NO PROCESSO DE INTEROPERABILIDADE COM SISTEMAS DE GESTÃO DAS BIBLIOTECAS DA FIOCRUZ Por : Ana Maria Neves.
BASES DE DADOS Acesso e Uso.
INTRODUÇÃO ÀS TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO Rúben Nóbrega | 2012.
Aula: Arquiteturas de redes: modelo de referência OSI 04/12/2010.
Texto e Linguagens Multimédia e Propriedades Bibliotecas Digitais Engenharia Biomédica Universidade do Minho Instructor: Joaquim Macedo Baseada em apresentações.
FORMAÇÃO DE TUTORES : GESTÃO DO CDI E DA PLATAFORMA-ELEARNING
12/08/20151 Assessoria da Qualidade Data1 Nome da área / Unidade Nome do Autor 1; Nome do Autor 2. TÍTULO.
Prof. João Ricardo Andrêo Programação p/ INTERNET - HTML 31/5/ :32 1 LISTAS Listas de Definição Estas listas são chamadas também “Listas de Glossário”,
Questionário (Básico) Autor: Skyup Informática. Atividade - Questionário O módulo permite criar uma série de questões, que deverão ser respondida pelos.
GUIA PARA CONSULTA NO REPOSITÓRIO DA UTFPR2013 INTRODUÇÃO PARTE I - CONSULTA AOS TCCS/TCCES PARTE II - CONSULTA ÀS DISSERTAÇÕES/ TESES/PRODUÇÃO DE SERVIDORES.
Qualquer site é criado com a intenção de que os utilizadores anónimos nele naveguem. Para este tipo de utilizador não é necessário registo, mas para.
Rhizome. Roteiro Definição Metas Características Arquitetura Tecnologias envolvidas Referências.
O USO DE PADRÕES DE INTERCÂMBIO E DE ARQUIVOS ABERTOS PARA A DISPONIBILIDADE DE RECURSOS MUSICAIS BALLESTÉ, Adriana Olinto Laboratório Nacional de Computação.
Tutorial Webnode Criando site 1. Registrando Acesse o endereço: e preencha os dados solicitados e clique em Registre-se e crie.
Eva Méndez Rodriguez Metadados e recuperação da informação: padrões, problemas e aplicabilidade em bibliotecas digitais.
Transcrição da apresentação:

Gestão e Recuperação de Informação Informação Estruturada José Borbinha – DEI/IST

2 Informação => Recursos

3 Informação? Como informação iremos considerar daqui em diante “objectos” ou, em termos mais gerais, “recursos (de informação)”. Nesta perspectiva o nosso problema da “Gestão e Recuperação de Informação” será agora um problema de “gestão e recuperação de recursos”...

4 Como se define um recurso? Definição simples: Um recurso de informação poderá ser tudo aquilo a que se pode atribuir um identificador!!! Exemplos de identificadores: –URL –URI –ISBN –Número de Contribuinte –“Pathname” num sistema de ficheiros –Número de telefone –Endereço de –Número de aluno do IST –Matrícula de um automóvel –.. A assumpção geral é a de que se é possível atribuir um identificador a algo, então essa coisa terá “identidade”...

5 Identificadores e géneros de recursos: Exemplos de identificadores: –URL –URI –ISBN –Número de Contribuinte –“Pathname” num sistema de ficheiros –Número de telefone –Endereço de –Número de aluno do IST –Matrícula de um automóvel –.. Mais exemplos...???... Géneros de recursos: –Uma página web! –...qualquer coisa... –Um livro! –Uma pessoa ou organização! –Um ficheiro num computador! –Uma pessoa ou organização! –Uma pessoa! –Um automóvel! –.. ???...

6 Voltando ao problema genérico da Gestão e Recuperação de Informação O nosso problema pode-se definir agora como sendo o de garantir que, para todos os recursos relevantes para um dado negócio, seja possível criar e gerir: –Espaços de identificadores, para todos os recursos –Atributos que possam ser processados sobre os recursos (eventualmente, os identificadores de um recurso podem ser atributos seus) –Sistemas que recuperam identificadores de recursos como resposta a interrogações aos atributos dos mesmos –Sistemas que façam a gestão do acesso aos recursos em troca dos seus identificadores

7 Atributos => Metadados

8 Sobre os Atributos –Podemos fazer uma analogia dizendo que no problema “clássico” de RI os atributos correspondem à informação que se extrai do recurso, ou seu representativo, para indexar (lista de palavras, vector,...). No entanto essa informação não é geralmente estruturada (são dados...) –Numa perspectiva mais geral de GRI, os atributos correspondem a informação estruturada, a que se dá o nome de metadados do recurso! –(definição simples) Metadados é assim a designação genérica para qualquer tipo de informação estruturada sobre um recurso.

9 Exemplos de atributos/metadados Título = A Morgadinha dos Canaviais Jaime Silva id := 123-xpto-h3d4 Género: Dissertação Type = JPEG2000 Data de Edição - 29 de Fevereiro de ## $aPT 700 #1 $aHalpern$bManuel Júdice$f1932-

10 Metadados podem ser criados –Manualmente: o preenchimento de uma ficha por uma pessoa... => Um catalogador numa biblioteca! –Automaticamente: a criação automática de uma estrutura de dados através de um programa de computador implementando algoritmos específicos... => Parsers, heurísticas, inferências,...

11 “Information IQ” (imagem de ) Objectos de informação estruturados podem facilitar a extracção de metadados!!!

12 Que tipos de metadados podemos ter? –Descritivos título, nome do autor, assunto, data de criação,... –Técnicos formato(s) do(s) ficheiro(s), tamanho (quantidade de bytes),... –Administrativos Password de acesso, responsável pela compra ou licenciamento,... –...aqueles que o negócio precisar...

13 Voltando à criação de Metadados Alguns dispositivos ou sistemas podem produzir automaticamente metadados na altura da criação do recurso => máquinas fotográficas, editores de texto, etc...

14 Metadados num documento PDF (de

15 Metadados manuais e automáticos (de

16 Mais metadados Instituto Superior Técnico _uacct = "UA "; urchinTracker();...

17 Mais sobre extracção de metadados

18 Mais sobre extracção de metadados

19 Há mesmo um negócio na extracção de metadados...

20 A propósito, uma patente em... (

21 Ponto de ordem: Metadados são estruturas de informação sobre recursos que podem servir de suporte à gestão, pesquisa e acesso a esses recursos Metadados podem existir independentes dos recursos ou existir integrados nos mesmos Metadados podem ser criados: –Manualmente –Automaticamente: Durante os processos de criação dos recursos Posteriormente à criação dos recursos, extraídos dos mesmos

22 Metadados e Esquemas Se os metadados são estruturas de informação, então devem existir já esquemas definidos para essas estruturas, certo? Certo! Exemplos: –XMP - Extensible Metadata Platform –MARC Standards –UNIMARC –Dublin Core Metadata Initiative –MPEG-7 / MPEG-21 DIDL –etc...

23

24

25

26

27

28 Dos Metadados aos Serviços...

29 O que se pode fazer então com os metadados? Em cenários bem definidos, podem ser simplesmente “despejados” para uma base de dados, criando serviços de Precision=Recall=1

30 A propósito, um registo UNIMARC (codificado em MarcXchange)

31 O que se pode fazer então com os metadados? Em cenários menos bem definidos (mais “Information Retrieval”), podem-se usar os registos de metadados como fontes para serviços na mesma:

32 Partilha de Metadados Os primeiros “indexadores” da Web(Yahoo, Sapo, etc.) eram na realidade serviços baseados em metadados criados manualmente, em que pessoas indexavam cada site manualmente, isto é, atribuíam a cada “site” um conjunto de termos relacionados com o conteúdo do mesmo (Cultura – Cinema, Cultura – Pintura, Desporto – Futebol, Desporto – Atletismo, Culinária,...). A partir de certa altura tornou-se complexo demais (senão mesmo impossível) continuar com esses processos, o que abriu as portas a novas alternativas automáticas, como o Altavista e o... Google!!! No entanto o Google indexa apenas a “web superficial”, continuando a não aceder à “web profunda” (o cenário mostrado no slide anterior, do Scholar Google, é já um passo para resolver esse problema...) Para dar mais visibilidade aos seus recursos, os criadores dos mesmos podem criar metadados descritivos e partilhá-los com quem estiver interessado em os recolher e agregá-los com outros para disponibilizar assim serviços de Recuperação de Informação... Os “standards” neste momento mais utilizados para este fim são o Dublin Core (como elementos de metadados) e o OAI-PMH (como protocolo para partilha desses metadados)

33 OAI - Open Archives Initiative

34 OAI-PMH Protocol for Metadata Harvesting ( ) Web-Services segundo o modelo REST...

35 No entanto também é possível conceber serviços baseados em arquitecturas distribuídas, em que se pode pesquisar em tempo real em servidores remotos, usando por exemplo o protocolo Z

36

37 Servidores Z39.50 em bibliotecas Portuguesas:

38 O Z39.50 é um protocolo bastante complexo... SRU é uma solução equivalente mais simples (modelo REST ou WS com WSDL...)

39 TEL – The European Library - Exemplo de um serviço usando OAI-PMH, SRU e Z39.50

40 Próximas aulas... RSS MPEG... METS SMIL DocBook ATOM Dublin Core... UNIMARC MARC21ONIX XML RDF Document Schemas Metadata Registries... GML

41 Perguntas?