A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Banco de Dados e Internet

Apresentações semelhantes


Apresentação em tema: "Banco de Dados e Internet"— Transcrição da apresentação:

1 Banco de Dados e Internet
Prof. Dr. Cláudio Baptista

2 Plano de curso 1. Introdução à integração de BD com Web
2. Modelagem de dados semi-estruturados - XML 3. Consulta a dados semi-estruturados -XML 4. A Web Semântica 5. Estudos de Caso

3 Introdução Revisando SGBD Qual o propósito de um SGBD?
Independência de dados-programa Persistência de dados Concorrência Recuperação de falhas Processamento de consultas Controle de integridade Controle de Segurança Distribuição dos dados

4 Introdução Revisando SGBD Características: Esquema pré-definido
Esquema pouco muda uma vez definido Estrutura rígida Níveis de abstração: Externo, Conceitual, Lógico e Físico Linguagem de alto nível declarativa para definição e manipulação dos dados (DDL e DML)  diz O QUE ao invés de COMO!

5 Introdução Dados Estruturados Semi-estruturados Não-estruturados

6 Introdução Dados Estruturados
São os dados armazenados no SGBD’s com esquema rígido. Ex.: Create table Empregado (matricula int, nome varchar(30), salario float); A estrutura é conhecida a priori, então os comandos de inserção, seleção, atualização e remoção usam esta estrutura para manipular os dados Neste caso a integração com a Web se dá através do uso de um protocolo de conectividade, por exemplo JDBC.

7 Introdução Dados Não-Estruturados
São dados que não possuem nenhuma estrutura, tais como um texto, uma imagem, um video. Portanto, do ponto de vista do SGBD estes dados são considerados como uma caixa preta, que precisa ser lida como um stream (fluxo de bytes).

8 Introdução Dados Semi-Estruturados
São conhecidos pela ausência de esquema e por serem auto-descritivos. Apresentam uma representação estrutural heterogênea

9 Introdução Dados Semi-Estruturados
Possuem as seguintes características: Definição à posteriori Estrutura irregular (ex. curriculum vitae) Estrutura implícita Estrutura parcial Estrutura extensa Estrutura evolucionária Distinção entre estrutura e dados não é clara

10 Introdução XML BD x Recuperação da Informação
Duas culturas distintas no passado que precisam ser integradas no presente! Gestão de documentos SGML HTML Documentação hipertexto Gestão de dados Bases de dados estruturados (relacionais e objeto) semi-estruturadas XML

11 Sistema de Recuperação de Informação

12 Introdução BD x Recuperação da Informação
Parâmetros de qualidade da recuperação: Recall (Retorno) R: total de itens significantes recuperados. R = (número de itens relevantes recuperados) / (número de itens relevantes no sistema) Precisão (Cobertura) P: total de itens significantes entre os recuperados. P = (número de itens relevantes recuperados) / (número de itens recuperados)

13 Introdução BD x Recuperação da Informação Itens Recuperados
b a itens não itens relevantes relevantes c d Itens Recuperados R = a / (a+d) P = a/(a+b)

14 Introdução BD x Recuperação da Informação

15 Introdução Visão da Web hoje: Documentos HTML
Voltados para consumo humano Muitos são gerados automaticamente por aplicações Necessidade de um novo paradigma na Web

16 Introdução Visão da Web hoje:
Existem várias aplicações consumindo documentos HTML, usando uma tecnologia fraca O novo padrão XML na Web torna a troca de dados entre aplicações mais simples XML gerado por aplicações XML consumido por aplicações Troca de dados: Entre plataformas Entre empresas

17 Introdução A comunidade de BD pode ajudar nos seguintes pontos:
otimização e processamento de consultas visões data warehouses, sistema de integração de dados Mediadores, reescrita de consultas Armazenamento secundário, indexação

18 Busca na Web Problema: Como melhorar os resultados das nossas buscas na Web? Tecnicamente: Como maximizar Recall e Precision?

19 Busca na Web Desafios: Escala Diversidade Mudança constante


Carregar ppt "Banco de Dados e Internet"

Apresentações semelhantes


Anúncios Google