Gestão e Tratamento de Informação Helena Galhardas DEI IST.

Slides:



Advertisements
Apresentações semelhantes
Integração de informação proveniente da Web
Advertisements

Laboratório de Informática Apresentação da Disciplina
Aula nº20 02/11/2006 Trabalhos de grupo a realizar no 1º período.
Computação Móvel (LEEC, MEEC, LEIC, MEIC)
Redes Móveis e Sem FiosComputação Móvel
Tópicos Avançados em Banco de Dados
Laboratório de Informática Introdução à Linguagem CSS 1º Semestre 2010 > PUCPR > BSI Bruno C. de Paula.
BD em.NET: Passo a passo conexão com SQL Server 1º Semestre 2010 > PUCPR > BSI Bruno C. de Paula.
Laboratório de Informática Imagens 1º Semestre 2010 > PUCPR > BSI Bruno C. de Paula.
Fundamento de Electrónica
Fundamento de Electrónica Docente: Paulo Lopes.
Helena Galhardas DEI IST
Sistemas de Apoio à Decisão (SAD) Helena Galhardas
Gestão de Redes e Sistemas Distribuídos Teresa Maria Vazão Julho 2005 Apresentação da disciplina IST/INESC-ID Contactos: IST/Tagus-Park
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
Investigação Operacional 2009/2010 José Fernando Oliveira Manuel Pina Marques Maria Antónia Carravilla.
Métodos de Decisão 2008/2009 José Fernando Oliveira Maria Antónia Carravilla Mestrado Integrado em Engenharia.
XSLT e recursividade estrutural
Sistemas Operativos Paulo Marques Departamento de Eng. Informática Universidade de Coimbra 2006/2007 Apresentação.
Bases de Dados 2 José Júlio Alferes Departamento de Informática
Controlo e Aprendizagem (Ciências do Desporto e E.Especial e Reabilitação) Aula teórica 1/1 Aprendizagem e Performance Corpo Docente Mário Godinho ( Turmas.
Tecnologias de Informação --- Apresentação. Âmbito da disciplina objectivos da disciplina Organização e desenvolvimento Conteúdos programáticos Horário.
1 Teoria da Computação 2007 / 2008 © DEI / IST 2007/2008.
April 05 Prof. Ismael H. F. Santos - 1 Módulo II Introdução a XML DTD Prof. Ismael H F Santos.
April 05 Prof. Ismael H. F. Santos - 1 Módulo II XML Processing: XSLT, SAX e DOM Prof. Ismael H F Santos.
Avaliação de Ferramentas Estatisticas
Aula 1A
RSMA – 2º. Sem./09 Prof. Roberto Saito.
FLUP - Elena Zagar Galvão Faculdade de Letras da Universidade do Porto INFORMÁTICA DE TRADUÇÃO FALL SEMESTER 2008 Lesson 7 Teacher: Elena Zagar Galvão.
Fundamento de Electrónica Docente: Paulo Lopes. 2 Contacto Gabinete D637 Cacifo309.
Paulo J Azevedo Departamento de Informática
Interoperabilidade semântica no domínio de Engenharia de Software
Gestão e Tratamento de Informação Helena Galhardas DEI IST.
Monitoria GDI Aula Prática
Técnicas de Instrumentação
Principais Tecnologias – NF-e
NUCLEAR ENERGY Sumário da 1ª aula Apresentação Programa Bibliografia
Arquitetura de Computadores 2011/2012 LEIC, LERC, LEE IST – Taguspark José Delgado, DEI (LEIC) Rui Neves, DEEC (LERC+LEE) José Delgado © 2012.
Métodos de Decisão 2010/2011 Maria Antónia Carravilla José Fernando Oliveira Marta Soares Rocha.
© Introdução à programação Ano lectivo 2006/2007.
Recapitular XML... Gestão e Tratamento de Informação DEI IST.
Linguagens de interrogação de dados XML XPath
Análise e Síntese de Algoritmos
PROE 2º Semestre 11/12 OBJECTIVO GERAL
Gestão e Tratamento de Informação 1º Semestre 2009/2010 DEI IST.
A S TECNOLOGIAS FAZEM A DIFERENÇA ? As Tecnologias e a Aprendizagem 1.
Apresentação da plataforma / LMS Moodle Vitor M. N
Encontro de Coordenadores de BE EB 2,3 e ES - Concelho de Sintra
IF696 - Integração de Dados e DW
Sistemas de Gerenciamento de Educação a Distância Prof. Silvia Helena Cardoso Prof. Renato M. E. Sabbatini.
Apresentação da Disciplina Inteligência Artificial/Computacional
Sistemas de Gerenciamento de Educação a Distância Prof. Silvia Helena Cardoso Prof. Renato M. E. Sabbatini.
Projeto Final CCO013 UNIFEI IMC.
Campus de Caraguatatuba Aula 1: Orientações Gerais
Dados abertos interligados
TagusPark (Carla Ferreira - TagusPark (Carla Ferreira - Apresentação Análise e Concepção de.
M e 5633-M1 Análise e Propostas (Fénix) Concepção Centrada no Utilizador 30 de Outubro de 2003 Alexandre Carvalho, 5501-M
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Tópicos em Bancos de Dados: Gerência de Dados da Web Plano de Aulas 2o. Semestre de 2004.
Sistemas de Apoio à Decisão (SAD) Decision Support Systems
Apresentação de Bases de Dados Programa Bibliografia Planeamento teóricas e práticas Avaliação Corpo docente.
H. GalhardasBD 2004/05 Apresentação de Bases de Dados Programa Bibliografia Planeamento teóricas e práticas Avaliação Corpo docente.
XSLT e recursividade estrutural Helena Galhardas DEI IST.
BD05/06 Apresentação de Bases de Dados  Enquadramento  Programa  Bibliografia  Planeamento teóricas e práticas  Avaliação  Corpo docente.
Departamento de Engenharia Informática 8/28/2003José Alves Marques Sistemas Distribuídos
DEEC / IST Isabel Lourtie Sistemas e Sinais SISTEMAS E SINAIS Docentes:  Isabel Lourtie 2º semestre 2014/2015.
DEEC / IST Isabel Lourtie Fundamentos de Controlo Apresentação FUNDAMENTOS DE CONTROLO Docente:  Isabel Lourtie 1º semestre 2015/2016.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
TÓPICOS ESPECIAIS: Seminários e Projetos de Pesquisa ARTIGO CIENTÍFICO
QUALIDADE DE DADOS EM SISTEMAS DE INTEGRAÇÃO DE DADOS VÍTOR ARRAIS DE SÁ SEMINÁRIO IDW– Cin/UFPE
Transcrição da apresentação:

Gestão e Tratamento de Informação Helena Galhardas DEI IST

Programa Gestão de dados XML DTD XSLT XQuery Extracção de Informação Dados da Web Extracção de conhecimento Integração de dados e esquema Global-as-view vs local-as-view Mediadores e wrappers Transformação e limpeza de dados Discrepâncias de esquemas e dados Detecção e eliminação de duplicados Fusão de informação

Motivação – Extracção de dados da Web Número grande de fontes de dados Alguns desafios: Páginas Web devem ser transformadas em dados estruturados Falta de controlo sobre os dados Fontes têm restrições de entrada e saída Natureza distribuída da Web pode tornar a integração de dados mto lenta

Motivação – Gestão de dados XML XML é vastamente utilizada como linguagem de troca de dados na Internet DTD, XMLSchema, XPath, XSLT são provavelmente assuntos já conhecidos A linguagem XQuery é a linguagem de interrogação de dados XML que vamos estudar aqui...

Motivação – Extracção de Informação Como descobrir estrutura em dados não estruturados Exemplo ( Elegant redhead Nicole Kidman, known as one of Hollywood's top Australian imports, was actually born in Honolulu, Hawaii, to Anthony (a biochemist and clinical psychologist) and Janelle (a nursing instructor) Kidman.... Algumas técnicas de IA (p. Ex. Linguagem Natural) podem ser usadas

Motivação – Integração de dados e esquema Integrar dados oriundos de fontes de dados heterógeneas Desafios: Acesso aos dados Resolver as diferenças existentes ao nível de esquema e dados Executar a integração de forma eficiente

Motivação – Transformação e limpeza de dados Durante e após a integração, alguns problemas com os dados precisam de ser resolvidos Exemplo: Filmes (id, título, realizador, ano, ano_ult_remake) (1|Casablanca|Weir|1942|1940) (2|Dead Poets Society|Curtiz|1989|-) (3|Rman Holiday|Wylder|1953|-) Detecção e eliminação de duplicados é um dos aspectos que vamos estudar

Avaliação Exame (52%) 3/1/2008 (17H) 17/1/2008 (17H) 4 MiniProjectos (48%), cada um 12% Enunciado é distribuído na aula teórica Alunos têm cerca de 2/3 semanas para resolver Entrega dos alunos feita na aula teórica Solução e correcções mostradas na aula teórica Conteúdo: uma parte teórica/prática e outra de SW

Calendário Mini-Projectos MP1 Entrega enunciado: 21/9 Entrega alunos: 12/10 MP2 Entrega enunciado: 12/10 Entrega alunos: 2/11 MP3 Entrega enunciado: 2/11 Entrega alunos: 23/11 MP4 Entrega enunciado: 23/11 Entrega alunos: 7/12

Organização das aulas Aulas teóricas Aulas de laboratório Grupos de três elementos – inscrições na página da cadeira no Fénix Apoio no software a ser utilizado Apoio na resolução dos mini-projectos

Corpo docente Helena Galhardas (responsável) Bruno Martins Pável Calado

Bibliografia Não há um livro único Algumas partes da matéria cobertas por artigos Alguma bibliografia: S. Abiteboul, P. Buneman, D. Suciu, Data on the Web: From Relations to Semistructured Data and XML, Morgan Kaufmann, 2000 C. Batini, M.Scannapieco, Data Quality: Concepts, Methodologies and Techniques, Springer, 2006

Assuntos pendentes Aulas de laboratório Mais um turno tem que ser aberto O turno de 5ªf, 11H tem que ser trocado Aulas de dúvidas

Referências C. Batini, M.Scannapieco, Data Quality: Concepts, Methodologies and Techniques, Springer, 2006 Craig Knockblock, Course: Information Integration on the Web, 2006, _2006/