A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Arquitetura do LexML Resolver Adaptado por João Lima.

Apresentações semelhantes


Apresentação em tema: "Arquitetura do LexML Resolver Adaptado por João Lima."— Transcrição da apresentação:

1 Arquitetura do LexML Resolver Adaptado por João Lima

2 Definições “Resolvedor” é um agente que, dado um identificador LexML Brasil (URN), retorna metadados das normas correspondentes. Os metadados contém, além da descrição básica da “obra”, referências (URLs) para o texto completo da norma. URL – Universal Resource Locator (HTTP) URN – Universal Resource Name

3 Proposta de Implementação Modelo Distribuído Cliente OAI-PMH Resolvedor “br;sp” Coletor de Metadados “br;sp” Resolvedor “br;sp;sao.paulo” Coletor de Metadados “br;sp;sao.paulo” Resolvedor “br:pb” Coletor de Metadados “br;pb” Resolvedor “br” Coletor de Metadados “br” OAI-PMH Legislação Federal Legislação EstadualLegislação MunicipalLegislação Estadual Neste cenário o cliente faz a pergunta a qualquer nó, que redireciona a requisição se necessário. Cada nó do sistema distribuído é semelhante a um sistema centralizado completo, só que neste caso o nó agrega metadados de apenas uma jurisdição. Descoberta do nó responsável por determinada jurisdição pode ser feita usando tabelas de lookup ou até mesmo DNS Lookup

4 Modelo Distribuído: Replicação Cliente Resolvedor “br;sp” Coletor de Metadados “br;sp” OAI-PMH Cada “resolvedor” pode ter uma ou mais réplicas do banco de metadados para permitir tolerância a falhas e balanceamento de carga Réplica A “br;sp” Réplica A Metadados “br;sp”

5 Modelo Distribuído: Precauções Manter registro de “resolvedores” atualizada Evitar laços infinitos Gerenciar mudanças nas unidades administrativas

6 Protocolo de Resolução É necessário desenvolver um protocolo de resolução de LexML URNs e software que implemente tal protocolo Web Browsers e bibliotecas HTTP nunca vão dar suporte a esquemas baseados em URNs  Facção diz que URN vai contra a “arquitetura web”  Antiga disputa entre HTTP URL vs. URN Ainda assim há vantagens claras em usar URNs:  Distinção entre URN e HTTP URLs  Geração automática a partir de metadados  Persistência  Compatibilidade com a “arquitetura web” através de proxies

7 Implementação do Protocolo Outros identificadores têm bibliotecas que implementam o protocolo de resolução  Suporte a várias linguagens e plataformas  Bibliotecas para Clientes e Servidores Mas identificadores LexML Brasil requerem dados para operar  Melhor implementar Web Services REST (HTTP GET)

8 A Armadilha dos Protocolos Personalizados Web Browsers permitem a implementação de protocolos personalizados Um exemplo é o protocolo lsidres:  Usado pelos plugins LSID p/ Firefox e Internet Explorer  lsidres:urn:lsid:herbimi.info:specimens:100069 lsidres:urn:lsid:herbimi.info:specimens:100069 É uma armadilha para o sistema  Links só funcionam se o usuário instalar o plugin  Caso contrário, os links parecerão quebrados. O browser apenas emite uma mensagem de erro inútil, que não leva o usuário a instalar o plugin.  O mesmo acontece com bibliotecas http, só que não há plugins É preferível usar um proxy HTTP:  http://lsid.tdwg.org/urn:lsid:herbimi.info:specimens:100069 http://lsid.tdwg.org/urn:lsid:herbimi.info:specimens:100069  http://www.lexml.gov.br/n2l?urn:lex:br:federal:lei:lei.geral.telecomunicacoes

9 O Que Retornar ao Cliente? Uma página web (XHTML)? Conteúdo XML? XML + XSLT? Negociação de Conteúdo  Cabeçalho HTTP “Accept:”

10 Arquitetura: Centralizada ou Distribuída Decisão baseada nos parâmetros:  Estimativa do tamanho do banco  Considerações políticas: Quem detém o controle sobre o sistema?  Complexidade (custo) de Implementação

11 Estimativa do Tamanho do Banco de Dados Fonte: Quantidade de Normas Editadas no Brasil: Período 05/10/1988 a 05/10/2004. IBPT - Instituto Brasileiro de Planejamento Tributário. Extraído de apresentação de João Lima - PRODASEN Núm. de Registros: ~ 3.3 milhões (desde outubro/1988) Tamanho do Registro: ~ 2-4 KB (apenas metadados) Tamanho do Banco de Dados:  ~ 13 GB (apenas dados)  ~ 40 GB (incluindo “padding” – 3x) Estimativa de acréscimo anual:  ~ 800 MB/ano (apenas dados)  ~ 2,5 GB/ano (incluindo “padding”)

12 Arquitetura: Centralizada ou Distribuída Banco não é tão grande (40GB + 2,5GB/ano):  Sistema poderia ser centralizado Entretanto, sistema distribuído é mais apropriado:  Controle compartilhado pelos vários parceiros  Tolerância a falhas – sistema continua funcionando se um componente falha  Escalabilidade – desempenho é mantido com adição de dados e componentes ao longo do tempo Benefícios justificam complexidade (custo) adicional do sistema distribuído

13 Conclusões Possível implementar “resolvedores” LexML Brasil  Piloto com bases de dados representativas em 3 a 6 meses  Demais nós podem ser adicionados em etapas Sistema distribuído é mais apropriado  Benefícios justificam complexidade (custo) adicional  Possibilidade de utilização de DNS na resolução

14 Interface do usuário Interface de gerência

15 Referência  direta  via sistemas dos portais governamentais Portal  urn  palavras Plugins

16 Referência Direta Após incluir o http proxy (http://www.lexml.gov.br/n2l?urn), codifica-se a URN desejadahttp://www.lexml.gov.br/n2l Pode ser codificada em qualquer fonte  ex: parecer legislativo referenciando normas, proposições e acórdãos trabalho acadêmico com referências monografia no formato PDF com links externos acórdão referenciando outros acórdão, súmulas

17 Referência via sistemas dos portais governamentais Uso de ícone para identificar o serviço Resultado poderá vir com a programação visual da origem do link Lexml URN Resolver

18 Pesquisa por Link (SF)

19 Pesquisa por Link (STF)

20

21

22 Portal LexML Aceita  URNs  Palavras significativas Retorna  se resultado = 1 ocorrência a página diretamente  se resultado > 1 ocorrência as opções para o usuário escolher  se resultado = 0 ocorrências informa que ainda não está disponível e/ou solicita ao usuário que reveja os argumento de pesquisa

23

24

25

26

27 Obra Complexa (FRBR) Obra Indiv. (FRBR) Manifestação e Item (FRBR) Itens (FRBR)

28 Plugins Exemplos do projeto italiano Norme In Rete  Parser no texto em tela gerando de forma automática as URNs plugin frame

29 clique em “analisar” NiR toolbar

30 resultado do parser

31 Parsing a partir de resultado de busca no Portal NiR 1. copia 2. cola 3. analisa Quadro do Parser

32 Parsing a partir de resultado de busca no Portal NiR 4. Hipertexto com links URN 5. clique em um link Resultado do parser

33 Coleta de Metadados OAI PMH  Data Providers (órgãos)  Service Providers (serviço lexml) Data Providers, opções  Integração do protocolo OAI-PMH aos sistemas existentes  Inclusão (e atualização) de dados em uma tabela no cliente padrão que será distribuído

34 Gerência da Coleta de Metadados Estado das coletas de metadados  por data provider  Estatísticas Exemplo do IBICT  Biblioteca Digital de Teses e Dissertações

35

36

37


Carregar ppt "Arquitetura do LexML Resolver Adaptado por João Lima."

Apresentações semelhantes


Anúncios Google