Parser de Normas do LexML João Lima. Novidades da atual versão Formatos de Entrada TXT e RTF Alteração de Norma Conversão para XHTML Formato intermediário.

Slides:



Advertisements
Apresentações semelhantes
A TARGET.IT surgiu da iniciativa de profissionais da área com a finalidade de prover soluções e softwares para WEB e integrações entre sistemas. Atuando.
Advertisements

II – Análise léxica DEI lex: linguagem de especificação para analisadores léxicos Implementação de simuladores de autómatos finitos Bibliografia aconselhada:
Especificação de Software
YACC.
O Portal do Estudante de Computação
XML DTDs e Schemas Sharp Shooters.NET Universidade Federal de Pernambuco Centro de Informática Recife, 21/10/2002 Autor: Marden Menezes Costa.
Análise léxica e sintática
Tópicos de Sistemas de Informação A
1 Validador dos Arquivos de Dados Quantitativos Questionário sobre Cartões de Pagamento Convênio BC, SDE e SEAE 19/9/2006 Departamento de Operações Bancárias.
A informática e a reforma do ordenamento jurídico
Ambientes de Desenvolvimento XML-XHTML Paulo Sousa ISEP/IPP Portugal.
Compiladores Prof. Claudio Benossi.
Análise léxica e sintática
Análise Léxica Primeira fase de um compilador
LexML, o Processo Legislativo e o Ordenamento Jurídico Brasília, 26 de Novembro de 2010 Iniciativa Implementação João Lima
Professor: Márcio Amador
Análise Léxica.
Lógica Estruturada Aplicada
Fluxos de produção de periódicos Francine Curivil SciELO Brasil
Análise Léxica Prof. Alexandre Monteiro
Citação Citação Literal: passagem do texto de outro autor é copiada literalmente. Citação precedida pela indicação: autor (ano da publicação, pagina).
Validando Documentos XML Vânia Maria Ponte Vidal
Arquitetura do LexML Resolver Adaptado por João Lima.
LexML 2.0: Tratamento do Texto Integral
17 O Serviço de utilizado em empresas normalmente é o Microsoft Exchange. Já para os s pessoais o serviço é o POP3, IMAP ou HTTP. Esses são.
Sistemas Operacionais IV – Gerenciamento de E/S
Compilador Software que traduz o texto (linguagem fonte) que representa um programa para código máquina(linguagem alvo) capaz de ser executado pelo.
Consulta Pública LexML Revisão dos Documentos. Consulta Pública Site  Período  18 de agosto - 17 de setembro Evento da.
My drivers Podemos definir um driver como uma ponte de comunicação entre determinado dispositivo e a central de processamento de um computador. Na prática,
Relatórios Personalizados (Merge) Maurício Ouriques ABYZ Informática Ltda.
INTELIGÊNCIA EMPRESARIAL Aula 10 - Processo Datawarehousing.
Apresentação do LexML João Lima
Uso da URN para referenciar publicações oficiais (versão digital e em papel) João Lima Prodasen.
1 Applied Stats ™ Versão 4.4 Software para Controle Estatístico de Processos (CEP) em Tempo Real.
Redação de Texto Científico Acadêmico
Componentes de um Sistema Hidráulico Parte II
ESTRUTURA DO TRABALHO CIENTÍFICO
Parser LexML João Lima. Tópicos Parser  Aplicações  Tipos Ferramentas ANTLR Implementação Próximos passos.
Unimed Belém TISS Unimed Belém – 7 Novembro 2007.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS.
Escreva aqui o título e o subtítulo do seu TCC Universidade Federal do Recôncavo da Bahia, Insira a data.
IFRN Técnico em Informática para Internet Desenvolvimento de Algoritmos Prof. Gilbert Azevedo.
TÍTULO DO PROJETO Área(s) / Setor(es) Autor José; Autor Maria; Autor João; Autor Jorge; Autor Pedro; Autor Andréia PDCA1234.
Metodologia Científica Resumo de Escrito Adolflayter Machado Amanda Rodrigues Rosilene da Silva.
Provedor de Dados Instalação e Configuração João Lima.
João Lima Senado Federal / Prodasen CONIP Judiciário de junho
3. SELEÇÃO DE PRESTADOR DE SERVIÇOS LOGÍSTICOS 3
Visão Cognitiva e Informação Peter Ingwersen. Visão cognitiva da informação A visão cognitiva apresenta as seguintes características: 1. Trata computadores.
Prof. Gustavo Fernandes de Lima Simbologia e Diagramas de Circuitos Eletrônicos.
SISTEMAS OPERACIONAIS MEMÓRIA VIRTUAL. INTRODUÇÃO Memória Virtual é um técnica sofisticada e poderosa de gerenciamento de memória, onde a MP e a MS são.
Sistema Estadual de Meio Ambiente SISEMA. Venícios Gustavo Santos Diretoria de Tecnologia da Informação Data: 19/02/2009 O BDA e os módulos FEAM SISEMA.
Jean Carlo Mendes
Programação p/ INTERNET - HTML Prof. João Ricardo Andrêo 2/6/ :46 1 TABELAS A TAG é utilizada para apresentação de dados no formato de tabelas (apresentação.
Normalização (4FN) Na literatura aparecem outras formas normais, como a forma normal de Boyce/Codd, a 4FN e a 5FN. Destas a única que tem importância na.
PROPRIEDADE INDUSTRIAL Dá-se este nome aos produtos de pensamento e engenho humano, que abrange as invenções, os modelos de utilidade, os desenhos industriais,
INFORMÁTICA APLICADA À LOGÍSTICA Professora Claudete Vedana.
Método para seu projeto Profa. Dra. Marina Moreira.
Artigo Científico Francielly Gonçalves dos Santos Francielly Gonçalves dos Santos Nayara Kirie Mendes Alves Nayara Kirie Mendes Alves Neirivaldo Quintão.
Prof.Ms.Carlos Henrique J.Costa Probabilidade e Estatística Gráficos Gráficos Tabelas Tabelas Conteúdo.
Informes. Data Provider Vocabulários Selo LexML Data Provider - Tabelas Qual SGBDR? Oracle (STF, STM, TST, TCU, SF e CD) MySQL (Interlegis/SAPL) PostGreSQL.
Metodologia Da Pesquisa Científica Analise Estrutural de Dissertação Restauração e Interpolação de Imagens do Satélite Landsat por meio de técnicas de.
EDITOR DE PLANILHAS MICROSOFT EXCEL 2010
Ferramentas Computacionais de Auxílio ao Teste de CIs: Fundamentos Marcelo Lubaszewski Universidade Federal do Rio Grande do Sul Departamento de Engenharia.
Título do trabalho Arial Negrito corpo 72pt podendo ser reduzido para até corpo 60, caso a quantidade de texto ultrapasse o espaço delimitado Nomes dos.
Universidade Federal do Rio Grande do Sul Biblioteca Central CAPACITAÇÃO NO USO DO SABi PARA BIBLIOTECÁRIOS DO SBUFRGS.
Conhecendo o Ambiente de Programação Java Prof. Gustavo Wagner (modificações) Slides originais: Prof. Tiago Massoni Java Básico  Centro de Informática,
Sensores e transdutores Adolfo Fernandes Herbster Universidade Paulista.
Leitura documentária Profa. Giovana Deliberali Maimone.
Acadêmicas: Tamyres D.C.A. de Lima; Thaliane A. de Freitas; Vanessa Brunnquell.
Cursos para Microsoft Office
Transcrição da apresentação:

Parser de Normas do LexML João Lima

Novidades da atual versão Formatos de Entrada TXT e RTF Alteração de Norma Conversão para XHTML Formato intermediário Parâmetros (opcional) Metadados Identificação Contexto (URN) Tabelas simples

Parser - Aplicações Filtros Traduz uma entrada em uma saída sem considerar uma gramática Validadores Verifica se uma entrada obedece a uma gramática Processadores Valida e Processa (sem re-escrita) Ações: cálculos, atualizar banco de dados, etc. Tradutores Valida e Traduz a entrada em outro formato Parse tree

Etapas (ANTLR) Lexer Parser caracteres tokens Tabela de Símbolos P(Tree) AST Saída (XML)

Normaliza.gLexer Parser GeraXML.gLingüístico.g LexML.g Arq.txt Arq_ Normal.txt Arq_ LexML.xml Arq_ LexML Lang.xml NormalizaAlt.g Arq_ NormalAlt.txt Lexer Parser GeraXHTML.g RTF.g Arq.rtf Arq_ rtf.xml. html XHTML2TXT.g Arq.rtf.txt

Arq.rtf.log.txt (Normal)

Arquivo de Entrada (RTF)

Arquivo XHTML (reduzido)

Arquivo TXT (b, i, u, sub, super)

Arquivo Normal

Arquivo NormalAlt

Arquivo LexML

Arq.rtf.log.txt (com erro)

Linha 8:5 - erro

Limitações (atuais) Tabelas Colspan / Rowspan Tabelas dentro de tabela

A ser implementado Esquema Flexível Anexos Retificação Passo de validação com o XML Schema Filtro para conversão de HTML/XHTML para o formato “XHTML reduzido” do LexML RTF, TXT, HTML e XHTML Comparação entre arquivos LexML de diferentes fontes Qualidade da informação Parser de Remissões Internas Externas Parser de Eventos Alteração Consolidador de Alteraçõer

Como Instalar / Executar Descompactar arquivo LexMLParser.zip Baixar antlrWorks Alterar nos arquivos exp.bat e expe.bat as variáveis CP e JAVA_HOME exp.bat arq.xxx Compila e Executa expe.bat arq.xxx Executa

Exp.bat SET JAVA_HOME=C:\Arquiv~1\Java\jdk1.5.0_05 SET CP=antlrworks jar;. %JAVA_HOME%/bin/java -ms64m -mx1G -cp %CP% org.antlr.Tool RTF.g GeraXHTML.g XHTML2TXT.g Normaliza.g NormalizaAlt.g LexML.g GeraXML.g Linguistico.g pause %JAVA_HOME%/bin/javac -classpath %CP% RTFParser.java RTFLexer.java GeraXHTML.java XHTML2TXTLexer.java NormalizaLexer.java NormalizaAltLexer.java LexMLParser.java LexMLLexer.java GeraXML.java LinguisticoLexer.java PipeLexML.java UtilLexML.java Pause SET ARQ=%1 SHIFT %JAVA_HOME%/bin/java -ms64m -mx1G -Dfile.encoding=ISO cp %CP% PipeLexML %ARQ% %1 %2 %3 %4 %5 %6 %7 %8 %9

Linha de Comando Parâmetros PipeLexML Arq.EXT [ jurisdicao autoridade tipo numero dataRepresentativa DataVigencia DataPublicacao FormaConteudo Lingua ] EXT = “RTF” ou “TXT” leis\2000\lei09953.rtf br federal lei dataVig texto pt-BR

Estatísticas > 80% de conversão Leis Erros ~ 15% Problemas de codificação  Falta de aspas ou espaço em branco  Uso de caracteres errados para delimitar dispositivos ~ 5% Problemas de técnica legislativa > flexível Tabela ou texto no corpo da norma Alteração de anexo no corpo da norma Artigos com “Pena –” ou “Pena:”, às vezes com título do artigo.