XML na Demografia Histórica: Anotação de Registos Paroquiais

Slides:



Advertisements
Apresentações semelhantes
Base de Dados para a Gestão de Informação de Natureza Pedagógica
Advertisements

DESENHO de BASE de DADOS RELACIONAL
Ferramentas CASE (Computer-Aided Software Engineering)
MOODLE PARA TODOS Projeto EAD-CPD MOODLE UFBA Centro de Processamento de Dados - UFBA.
Ambiente Virtual de Aprendizagem. O AVA é um "espaço fecundo de significação onde seres humanos e objetos técnicos interagem, potencializando assim a.
1 FEUPXML Anotação de Documentos Elementos, Atributos, Entidades, Comentários, Declarações e Instruções de Processamento.
Processamento de Texto
IMax Felisberto Horta Amadú Bah Patrícia Veiga Programa para gestão de dados multimédia (existentes em múltiplos formatos, suportes e dispositivos ) pertencendo.
Apresentação da Monografia
Exemplos de Exercícios
April 05 Prof. Ismael H. F. Santos - 1 Módulo II XML Processing: XSLT, SAX e DOM Prof. Ismael H F Santos.
Pedro Rangel Henriques
Pedro Rangel Henriques Departamento de Informática
Análise Espacial Antes e Depois da Fusão
Site de uma disciplina: um espaço de aprendizagem
Um editor de XML para a Web
University of Minho, Portugal
Engenharia de Software
Web: criação de páginas
XML DTDs e Schemas Sharp Shooters.NET Universidade Federal de Pernambuco Centro de Informática Recife, 21/10/2002 Autor: Marden Menezes Costa.
7 - Criação de Páginas Web DREAMWEAVER Pt.2
Microsoft Access Carlos Sebastião.
ETELVINA U M G ERADOR D E P ERSONAGENS P ARA I NSTANT M ESSAGING Eduardo Jorge Costa Ribeiro Universidade do Minho Departamento de Informática.
HTML Básico João Araujo.
Laboratórios de Informática IV Ferramentas CASE
XML Extended Markup Language
1 Estado actual de progresso do projecto PT-Comunicações PT-Comunicações / Porto 27 de Julho de Estágio escolar no âmbito do ICR Estagiários :
Dep. Informática Sistemas de Informação Módulo de Processamento de Documentos Lic. Administração Pública 1º ano 2001/02 A. J. Proença.
TIC 10º ano Construir Bases de Dados
Bases de Dados da exploração à construção Sessão de trabalho no Agrupamento de Ribamar 28 Junho 2006.
Apresentação. Notas & Novidades Este quadro tem a finalidade de oferecer Informações, Notas e Novidades na área de Normalização Técnica Na barra de ferramentas,
Gestão de Redes e Sistemas Distribuídos Teresa Maria Vazão Fevereiro 2003 IST/INESC Contactos:IST/Tagus-Park Tel:
Gestão de Redes e Sistemas Distribuídos Teresa Maria Vazão Julho 2005 Ferramentas de Gestão Plataformas de Gestão IST/INESC-ID Contactos: IST/Tagus-Park.
Tecnologia em Gestão do Conhecimento
Nova solução CRM da Riosoft
INTRODUÇÃO ÁS BASES DE DADOS
Tarefa 02 Visual Studio 2005 Visual C# Programa Hello World.
ACCESS 2007 EDIMILSON JÚNIOR.
1 1.
Tutorial de pesquisa.
Arquitetura de Desenvolvimento Web MVC vs. Three Tiers
A abordagem de banco de dados para gerenciamento de dados
Escola Básica e Secundária Vieira de Araújo
Repositório de Tabelas Corporativas do Ministério da Saúde
Este Curso é Financiado pelo Programa Operacional Potencial Humano designado por POPH, onde a Entidade Formadora e Promotora é a Mega expansão.
Tradutor Oracle SQL Server Núcleo comum Lookup Middleware consultas esquema de mediação Base de dados das fontes locais Ambiente de geração das consultas.
Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística XML: Extensible Markup Language EquipeEquipe: Adriana Cristina de Oliveira.
GBDDoc - Gestão de uma Base de Dados Documental Grupo formado por : - Pedro Borges Nº Ricardo Oliveira Nº Serafim Gomes Nº
Escola Básica e Secundária Vieira de Araújo
Requisitos de Software
Autoria WEB Prof. Thiago Nogueira Tolentino Barbosa
Instituto Politécnico de Beja Escola Superior de Tecnologia e Gestão Apresentação de Projecto Sistema de Construção Visual de Interfaces “Qooxdoo GUI Builder”
Universidade Federal de Santa Catarina Centro de Ciências da Educação - CED Departamento de Ciência da Informação - CIN Disciplina: 5205 – Recuperação.
 Como os alunos vinham a trabalhar com os robôs da Lego Mindstorms, resolvemos premiá-los pela motivação e empenho que mostraram nas diversas tarefas.
Produção de Sites Unidade 9 – XML Prof.: Henrique Santos.
Engenharia de Requisitos
Ferramentas CASE Aula 22.
Professor: Pedro Lopes
LexML 2.0: Tratamento do Texto Integral
1 Linguagens de Programação Pedro Lopes 2010/2011.
Sistemas de Gestão de Bases de Dados Educação e Formação de Adultos (EFA) Operador de Informática Arcozelo 2009/2010 Curso Co-Financiado por:
NOVAS CERTIDÕES DE REGISTRO CIVIL
INFORMÁTICA PARA CONCURSOS
Modelagem de dados XML Yago Zacarias Gomes Coutinho Ribeiro
JavaScript Introdução ao JavaScript 1. Objetivos Introdução Sintaxe Básica Arquivo (script) externo Script no HEAD da página Script no BODY da página.
 O Modelo E-R (Entidade-Relação)
Questionário (Básico) Autor: Skyup Informática. Atividade - Questionário O módulo permite criar uma série de questões, que deverão ser respondida pelos.
Design para Web 3 XHTML.
Rhizome. Roteiro Definição Metas Características Arquitetura Tecnologias envolvidas Referências.
GRLibrelotto & JCRamalho & PRHenriques, XATA’06, Fevereiro Topic Maps aplicados ao Sistema de Informação do Museu da Emigração Giovani R. Librelotto.
Transcrição da apresentação:

XML na Demografia Histórica: Anotação de Registos Paroquiais Rafael Félix, Fernanda Faria, Maribel Santos, Pedro Henriques Universidade do Minho Guimarães/Braga - Portugal 20 -22, Nov. 2002 III Conf. da APSI

Objectivo da Comunicação Propor a anotação em XML dos registos paroquiais (RPs) – baptizado, casamento e óbito – de modo a construir uma base documental que suporte o estudo da evolução demográfica segundo o MRP (Método de Reconstituição de Paróquias) 20 -22, Nov. 2002 III Conf. da APSI

Objectivo da Comunicação Constitui-se assim uma base mais rica que as tradicionais bases de dados paroquiais no sentido em que se abrem novas possibilidades de exploração da informação 20 -22, Nov. 2002 III Conf. da APSI

Plano da Comunicação Caracterização do contexto de trabalho SEED XML Os RPs e a Aquisição de dados Os RPs em XML Anotação Edição e Validação Processamento Potencialidades da Anotação 20 -22, Nov. 2002 III Conf. da APSI

Caracterização do contexto de trabalho Estudo da Evolução Demográfica com base no levantamento dos registos paroquiais seguindo o MRP; o SEED Processamento de documentos estruturados com base na sua anotação em XML 20 -22, Nov. 2002 III Conf. da APSI

SEED (estudo evolução demográfica) Sistema informático para Auxiliar os Demógrafos na realização das análises dos dados (indivíduos+famílias) que lhes permitem compreender a evolução do comportamento das populações (rurais e urbanas) ao longo dos séculos e em zonas distintas 20 -22, Nov. 2002 III Conf. da APSI

SEED: Objectivo do Estudo Permite o estudo da Fecundidade Nupcialidade Mortalidade ..... sendo suportado pelo MRP que se baseia no cruzamento de registos de Baptizado Casamento Óbito 20 -22, Nov. 2002 III Conf. da APSI

SEED: Arquitectura para Análise de Dados e Extracção de Conhecimento 20 -22, Nov. 2002 III Conf. da APSI

Anotação de documentos em XML XML: meta-linguagem para anotação de documentos organizados em tipos Com XML podem definir-se sistemas de anotação (linguagens específicas) para: cartas, memorandos, relatórios, manuais, poemas, certidões, declarações, petições, exames, pautas, horários, etc ... 20 -22, Nov. 2002 III Conf. da APSI

Anotação de documentos em XML DTD ou XML-Schema: para cada tipo, define as marcas possíveis, seus atributos e a maneira como se agrupam <!ELEMENT carta (remete, destino, data, assunto, abertura, corpo, fecho)> < xs:element name = “carta”> <xs:complexType> <xs:sequence> <xs:element name = “remete”> ... <xs: element name = “fecho”> </xs:sequence> </xs:complexType> </ xs:element > 20 -22, Nov. 2002 III Conf. da APSI

Anotação de documentos em XML Um documento anotado: evidencia a sua estrutura geral e a interpretação de elementos nele contidos, sem informação quanto à formatação ou transformação <livro> <abertura>Este livro hade servir ...</abertura> <registo> Aos <data valor=“18000102” deQue=“Bapt”>dois dias do mes de Janeiro do anno de mil e oitocentos</data>, n’esta <local>Igreja Paroquial da Villa das Lages do Pico</local> ... </registo> </livro> 20 -22, Nov. 2002 III Conf. da APSI

Anotação de documentos em XML Um documento anotado: pode ser validado e posteriormente processado Validar = verificar a estrutura face ao DTD/Schema (Parsing) Processar = formatar | transformar | pesquisar | extrair 20 -22, Nov. 2002 III Conf. da APSI

Anotação de documentos em XML XSL: linguagem para processamento de documentos anotados XSLT – linguagem de transformação Xpath – linguagem de selecção XSL Formating Objects – linguagem para especificação de formatações 20 -22, Nov. 2002 III Conf. da APSI

Plano da Comunicação Os RPs e a Aquisição de dados Caracterização do contexto de trabalho SEED XML Os RPs e a Aquisição de dados Os RPs em XML Anotação Edição e Validação Processamento Potencialidades da Anotação 20 -22, Nov. 2002 III Conf. da APSI

Os RPs e a Aquisição de dados Como era Leitura local e exaustiva dos RPs  extracção manual dos dados necessários para reconstituição de famílias  bases de dados paroquiais 20 -22, Nov. 2002 III Conf. da APSI

Os RPs e a Aquisição de dados Como poderia ser Digitalização integral do documento  anotação  processamento automático  bases de dados, etc. ... 20 -22, Nov. 2002 III Conf. da APSI

Os RPs e a Aquisição de dados Devido às limitações actuais do SW para OCR, Como tem de ser Edição/Anotação manual auxiliada do documento integral  processamento automático  bases de dados, etc. ... 20 -22, Nov. 2002 III Conf. da APSI

Plano da Comunicação Os RPs em XML Caracterização do contexto de trabalho SEED XML Os RPs e a Aquisição de dados Os RPs em XML Anotação Edição e Validação Processamento Potencialidades da Anotação 20 -22, Nov. 2002 III Conf. da APSI

Anotação de RPs em XML A Anotação dos Registos Paroquiais requer a criação de um novo dialecto de XML específico para essa família de documentos: Schema-RP 20 -22, Nov. 2002 III Conf. da APSI

Anotação de RPs em XML As grandes decisões: DTD versus XML-Schema 3 Sistemas de Anotação versus 1 único Escolha dos Elementos apropriados e seus Atributos 20 -22, Nov. 2002 III Conf. da APSI

Anotação de RPs em XML 1ªfase: Elementos para identificar os dados explícitos no texto: nome, morada, idade, profissão, ... Elementos para identificar a “personagem” a quem os dados se referem: noivo, noiva, falecido, pai, mãe, ....... O mesmo Elemento é aberto várias vezes com conteúdos diversos 20 -22, Nov. 2002 III Conf. da APSI

Anotação de RPs em XML 2ªfase: Elementos que identificam em simultâneo os dados explícitos no texto e a “personagem” a quem se referem: noivo.nome, noivo.morada, noiva.idade, noiva.profissão, ... O número de Elementos distintos aumenta consideravelmente; e a sua ortografia é pesada 20 -22, Nov. 2002 III Conf. da APSI

Anotação de RPs em XML 3ªfase: Elementos genéricos que identificam os dados explícitos no texto: nome, morada, idade, profissão, ... combinados com Atributos cujos valores (“noivo”, “noiva”, “pai”, “mãe”) especificam a “personagem” a quem se referem: nome - deQuem, local - deQue, Idade - deQuem, data - deQue, ... O número de Elementos e Atributos é reduzido; o sistema de anotação fica bem legível 20 -22, Nov. 2002 III Conf. da APSI

Anotação em Schema-RP: Exemplo de 1 Registo de casamento <notaMargem> <numero>6</numero> <nome deQuem="individuo">Francisca Maria</nome> </notaMargem> <texto>Aos <data deQue="obito" deQuem="individuo" norm="1876-01-28">vinte e oito dias do mez de janeiro do anno de mil oitocentos setenta e seis</data>, ás <hora deQue="obito" deQuem="individuo" norm="02:00">duas horas da noite</hora>, <local deQue="obito" deQuem="individuo" tipo="lugar">em huma caza da Canada do Ajudante, ...... E para constar lavrei em duplicado este assento, que assigno. ???????.__ </texto> <assinatura>O'Vigario Antonio Homem da Costa</assinatura> </registo> 20 -22, Nov. 2002 III Conf. da APSI

Edição/Validação de RPs em XML Características desejáveis para um Editor: Associação fácil do DTD/XML-Schema ao novo documento Escrita ágil do novo texto base, ou fácil abertura dum existente Indicação dos Elementos/Atributos que se podem escolher em cada momento Indicação dos Valores possíveis para cada Atributo Integração dum Parser 20 -22, Nov. 2002 III Conf. da APSI

Edição/Validação de RPs em XML Alternativas: XML-Spy (Altova) X-Metal (SoftQuad) Document Editor (Altova) Por satisfazer bem todos os requisitos a escolha recaiu sobre o XML-Spy 20 -22, Nov. 2002 III Conf. da APSI

Edição/Validação: Exemplo de uma sessão 20 -22, Nov. 2002 III Conf. da APSI

Edição/Validação de RPs em XML Fases da Edição: Anotação com os Elementos (inserção das “marcas” abertura/fecho) Anotação com os Atributos (adição dos atributos a cada elemento e indicação do seu valor em função do contexto) 20 -22, Nov. 2002 III Conf. da APSI

Processamento de RPs em XML Caso 1: Visualização em HTML Foi criada uma style-sheet XSL para gerar páginas HTML a partir de um livro de registos anotado em Schema-RP Assim, através de browser W W W é possível ver os registos num formato análogo ao original 20 -22, Nov. 2002 III Conf. da APSI

Visualização em HTML: Exemplo 20 -22, Nov. 2002 III Conf. da APSI

Processamento de RPs em XML Caso 2: Geração de SQL para alimenção da BDP Foi criada uma style-sheet XSL para gerar SQL com vista a inserir nas tabelas de Indivíduos e Famílias (da BDP) os dados relevantes que se podem extrair de cada registo anotado em Schema-RP As complexas relações familiares e a dificuldade na identificação de Indivíduos não permitiu a alimentação automática (em 1 só passo) da BDP 20 -22, Nov. 2002 III Conf. da APSI

Processamento de RPs em XML Caso 2: Geração de SQL para alimenção da BDP Solução: sistema semi-automático, em 2 passos: 1ºpasso: via uma interface (interactiva) em VB todos os Indivíduos são identificados e certos campos codificados; daqui resulta um novo doc. XML sem ambiguidades e com “chaves” 2ºpasso: é gerado código SQL para inserção dos registos na BDP a partir desse novo documento XML 20 -22, Nov. 2002 III Conf. da APSI

Plano da Comunicação Potencialidades da Anotação Caracterização do contexto de trabalho SEED XML Os RPs e a Aquisição de dados Os RPs em XML Anotação Edição e Validação Processamento Potencialidades da Anotação 20 -22, Nov. 2002 III Conf. da APSI

Potencialidades da Anotação Para além da BD Paroquial que suporte as análises fica-se com uma base documental com os documentos originais disponíveis para formatação (visualização/impressão) pesquisa e criação de índices análises linguísticas diversas (ortografia, estilos, análises de assinaturas, etc.) ... 20 -22, Nov. 2002 III Conf. da APSI

Conclusão No contexto da Exploração de Registos Paroquiais com vista à construção dum Repositório de Conhecimento Demográfico, Propôs-se o uso de uma linguagem específica XML para armazenamento integral dos documentos anotados, Com vista a aumentar a automatização da aquisição e as potencialidades de exploração 20 -22, Nov. 2002 III Conf. da APSI

Conclusão O XML-Schema para a linguagem Schema-RP foi criado A edição está (semi-)resolvida Foram desenvolvidas duas transformações (visualização HTML e geração de SQL) O sistema está aberto a novas aplicações ... e a novas interfaces: multi-modais, para PDAs 20 -22, Nov. 2002 III Conf. da APSI

Equipe Os Autores Consultores Estagiários Grupos de Projecto (Opção 3) Orlando Belo Paulo Novais Estagiários Grupos de Projecto (Opção 3) 20 -22, Nov. 2002 III Conf. da APSI

Colaboradores Anália Lourenço Sérgio Passos Américo, Jorge, Sandra Lopes Cristina, Sandra António, Celeste, Paula Alexandre, António, Manuel Candida, M.Manuel, Nádea Pedro, Solange Rafael Félix Patrícia Leite Fernanda Faria 20 -22, Nov. 2002 III Conf. da APSI