A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1III Conf. da APSI 20 -22, Nov. 2002 XML na Demografia Histórica: Anotação de Registos Paroquiais Rafael Félix, Fernanda Faria, Maribel Santos, Pedro Henriques.

Apresentações semelhantes


Apresentação em tema: "1III Conf. da APSI 20 -22, Nov. 2002 XML na Demografia Histórica: Anotação de Registos Paroquiais Rafael Félix, Fernanda Faria, Maribel Santos, Pedro Henriques."— Transcrição da apresentação:

1 1III Conf. da APSI , Nov XML na Demografia Histórica: Anotação de Registos Paroquiais Rafael Félix, Fernanda Faria, Maribel Santos, Pedro Henriques Universidade do Minho Guimarães/Braga - Portugal

2 20 -22, Nov III Conf. da APSI2 Objectivo da Comunicação Propor a anotação em XML dos registos paroquiais (RPs) – baptizado, casamento e óbito – de modo a construir uma base documental que suporte o estudo da evolução demográfica segundo o MRP ( Método de Reconstituição de Paróquias)

3 20 -22, Nov III Conf. da APSI3 Objectivo da Comunicação Constitui-se assim uma base mais rica que as tradicionais bases de dados paroquiais no sentido em que se abrem novas possibilidades de exploração da informação

4 20 -22, Nov III Conf. da APSI4 Plano da Comunicação n Caracterização do contexto de trabalho u SEED u XML n Os RPs e a Aquisição de dados n Os RPs em XML u Anotação u Edição e Validação u Processamento n Potencialidades da Anotação

5 20 -22, Nov III Conf. da APSI5 Caracterização do contexto de trabalho Estudo da Evolução Demográfica com base no levantamento dos registos paroquiais seguindo o MRP; o SEED Processamento de documentos estruturados com base na sua anotação em XML

6 20 -22, Nov III Conf. da APSI6 SEED (estudo evolução demográfica) Sistema informático para Auxiliar os Demógrafos na realização das análises dos dados (indivíduos+famílias) que lhes permitem compreender a evolução do comportamento das populações (rurais e urbanas) ao longo dos séculos e em zonas distintas

7 20 -22, Nov III Conf. da APSI7 SEED: Objectivo do Estudo Permite o estudo da u Fecundidade u Nupcialidade u Mortalidade u..... sendo suportado pelo MRP que se baseia no cruzamento de registos de u Baptizado u Casamento u Óbito

8 20 -22, Nov III Conf. da APSI8 SEED: Arquitectura para Análise de Dados e Extracção de Conhecimento

9 20 -22, Nov III Conf. da APSI9 Anotação de documentos em XML XML: meta-linguagem para anotação de documentos organizados em tipos Com XML podem definir-se sistemas de anotação (linguagens específicas) para: cartas, memorandos, relatórios, manuais, poemas, certidões, declarações, petições, exames, pautas, horários, etc...

10 20 -22, Nov III Conf. da APSI10 Anotação de documentos em XML DTD ou XML-Schema: para cada tipo, define as marcas possíveis, seus atributos e a maneira como se agrupam...

11 20 -22, Nov III Conf. da APSI11 Anotação de documentos em XML Um documento anotado: evidencia a sua estrutura geral e a interpretação de elementos nele contidos, sem informação quanto à formatação ou transformação Este livro hade servir... Aos dois dias do mes de Janeiro do anno de mil e oitocentos, nesta Igreja Paroquial da Villa das Lages do Pico...

12 20 -22, Nov III Conf. da APSI12 Anotação de documentos em XML Um documento anotado: pode ser validado e posteriormente processado Validar = verificar a estrutura face ao DTD/Schema (Parsing) Processar = formatar | transformar | pesquisar | extrair

13 20 -22, Nov III Conf. da APSI13 Anotação de documentos em XML XSL: linguagem para processamento de documentos anotados XSLT – linguagem de transformação Xpath – linguagem de selecção XSL Formating Objects – linguagem para especificação de formatações

14 20 -22, Nov III Conf. da APSI14 Plano da Comunicação n Caracterização do contexto de trabalho u SEED u XML n Os RPs e a Aquisição de dados n Os RPs em XML u Anotação u Edição e Validação u Processamento n Potencialidades da Anotação

15 20 -22, Nov III Conf. da APSI15 Os RPs e a Aquisição de dados Como era Leitura local e exaustiva dos RPs extracção manual dos dados necessários para reconstituição de famílias bases de dados paroquiais

16 20 -22, Nov III Conf. da APSI16 Os RPs e a Aquisição de dados Como poderia ser Digitalização integral do documento anotação processamento automático bases de dados, etc....

17 20 -22, Nov III Conf. da APSI17 Os RPs e a Aquisição de dados Devido às limitações actuais do SW para OCR, Como tem de ser Edição/Anotação manual auxiliada do documento integral processamento automático bases de dados, etc....

18 20 -22, Nov III Conf. da APSI18 Plano da Comunicação n Caracterização do contexto de trabalho u SEED u XML n Os RPs e a Aquisição de dados n Os RPs em XML u Anotação u Edição e Validação u Processamento n Potencialidades da Anotação

19 20 -22, Nov III Conf. da APSI19 Anotação de RPs em XML A Anotação dos Registos Paroquiais requer a criação de um novo dialecto de XML específico para essa família de documentos: Schema-RP

20 20 -22, Nov III Conf. da APSI20 Anotação de RPs em XML As grandes decisões: n DTD versus XML-Schema n 3 Sistemas de Anotação versus 1 único n Escolha dos Elementos apropriados e seus Atributos

21 20 -22, Nov III Conf. da APSI21 Anotação de RPs em XML 1ªfase: Elementos para identificar os dados explícitos no texto: nome, morada, idade, profissão,... Elementos para identificar a personagem a quem os dados se referem: noivo, noiva, falecido, pai, mãe, O mesmo Elemento é aberto várias vezes com conteúdos diversos

22 20 -22, Nov III Conf. da APSI22 Anotação de RPs em XML 2ªfase: Elementos que identificam em simultâneo os dados explícitos no texto e a personagem a quem se referem: noivo.nome, noivo.morada, noiva.idade, noiva.profissão,... O número de Elementos distintos aumenta consideravelmente; e a sua ortografia é pesada

23 20 -22, Nov III Conf. da APSI23 Anotação de RPs em XML 3ªfase: Elementos genéricos que identificam os dados explícitos no texto: nome, morada, idade, profissão,... combinados com Atributos cujos valores (noivo, noiva, pai, mãe) especificam a personagem a quem se referem: nome - deQuem, local - deQue, Idade - deQuem, data - deQue,... O número de Elementos e Atributos é reduzido; o sistema de anotação fica bem legível

24 20 -22, Nov III Conf. da APSI24 Anotação em Schema-RP: Exemplo de 1 Registo de casamento 6 Francisca Maria Aos vinte e oito dias do mez de janeiro do anno de mil oitocentos setenta e seis, ás duas horas da noite, em huma caza da Canada do Ajudante, E para constar lavrei em duplicado este assento, que assigno. ???????.__ O'Vigario Antonio Homem da Costa

25 20 -22, Nov III Conf. da APSI25 Edição/Validação de RPs em XML Características desejáveis para um Editor: u Associação fácil do DTD/XML-Schema ao novo documento u Escrita ágil do novo texto base, ou fácil abertura dum existente u Indicação dos Elementos/Atributos que se podem escolher em cada momento u Indicação dos Valores possíveis para cada Atributo u Integração dum Parser

26 20 -22, Nov III Conf. da APSI26 Edição/Validação de RPs em XML Alternativas: u XML-Spy (Altova) u X-Metal (SoftQuad) u Document Editor (Altova) Por satisfazer bem todos os requisitos a escolha recaiu sobre o XML-Spy

27 20 -22, Nov III Conf. da APSI27 Edição/Validação: Exemplo de uma sessão

28 20 -22, Nov III Conf. da APSI28 Edição/Validação de RPs em XML Fases da Edição: u Anotação com os Elementos (inserção das marcas abertura/fecho) u Anotação com os Atributos (adição dos atributos a cada elemento e indicação do seu valor em função do contexto)

29 20 -22, Nov III Conf. da APSI29 Processamento de RPs em XML Caso 1: Visualização em HTML Foi criada uma style-sheet XSL para gerar páginas HTML a partir de um livro de registos anotado em Schema-RP Assim, através de browser W W W é possível ver os registos num formato análogo ao original

30 20 -22, Nov III Conf. da APSI30 Visualização em HTML: Exemplo

31 20 -22, Nov III Conf. da APSI31 Processamento de RPs em XML Caso 2: Geração de SQL para alimenção da BDP Foi criada uma style-sheet XSL para gerar SQL com vista a inserir nas tabelas de Indivíduos e Famílias (da BDP) os dados relevantes que se podem extrair de cada registo anotado em Schema-RP As complexas relações familiares e a dificuldade na identificação de Indivíduos não permitiu a alimentação automática (em 1 só passo) da BDP

32 20 -22, Nov III Conf. da APSI32 Processamento de RPs em XML Caso 2: Geração de SQL para alimenção da BDP Solução: sistema semi-automático, em 2 passos: 1ºpasso: via uma interface (interactiva) em VB todos os Indivíduos são identificados e certos campos codificados; daqui resulta um novo doc. XML sem ambiguidades e com chaves 2ºpasso: é gerado código SQL para inserção dos registos na BDP a partir desse novo documento XML

33 20 -22, Nov III Conf. da APSI33 Plano da Comunicação n Caracterização do contexto de trabalho u SEED u XML n Os RPs e a Aquisição de dados n Os RPs em XML u Anotação u Edição e Validação u Processamento n Potencialidades da Anotação

34 20 -22, Nov III Conf. da APSI34 Potencialidades da Anotação Para além da BD Paroquial que suporte as análises fica-se com uma base documental com os documentos originais disponíveis para formatação (visualização/impressão) pesquisa e criação de índices análises linguísticas diversas (ortografia, estilos, análises de assinaturas, etc.)...

35 20 -22, Nov III Conf. da APSI35 Conclusão No contexto da Exploração de Registos Paroquiais com vista à construção dum Repositório de Conhecimento Demográfico, Propôs-se o uso de uma linguagem específica XML para armazenamento integral dos documentos anotados, Com vista a aumentar a automatização da aquisição e as potencialidades de exploração

36 20 -22, Nov III Conf. da APSI36 Conclusão O XML-Schema para a linguagem Schema-RP foi criado A edição está (semi-)resolvida Foram desenvolvidas duas transformações (visualização HTML e geração de SQL) O sistema está aberto a novas aplicações... e a novas interfaces: multi-modais, para PDAs

37 20 -22, Nov III Conf. da APSI37 Equipe n Os Autores n Consultores u Orlando Belo u Paulo Novais n Estagiários n Grupos de Projecto (Opção 3)

38 20 -22, Nov III Conf. da APSI38 Colaboradores n Anália Lourenço n Sérgio Passos n Américo, Jorge, Sandra Lopes n Cristina, Sandra n António, Celeste, Paula n Alexandre, António, Manuel n Candida, M.Manuel, Nádea n Pedro, Solange n Rafael Félix n Patrícia Leite n Fernanda Faria


Carregar ppt "1III Conf. da APSI 20 -22, Nov. 2002 XML na Demografia Histórica: Anotação de Registos Paroquiais Rafael Félix, Fernanda Faria, Maribel Santos, Pedro Henriques."

Apresentações semelhantes


Anúncios Google