Tratamento da indexação de documentos no LexML: como compatibilizar os múltiplos vocabulários? João Lima Senado Federal / Prodasen

Slides:



Advertisements
Apresentações semelhantes
M.R.U..
Advertisements

Amintas engenharia.
Sistema de dois componentes - condensado
Exemplo de Plano de Ação
SQL-3. Novo contexto e necessidade de : Manipular imagens Outros tipos de dados além de texto e números Recuperação de dados mais complexos Níveis distintos.
Críticas sobre Extreme Programming Francisco Hillesheim.
O USO DE ATIVIDADES PRODUTIVAS COMO AVALIAÇÃO E INTERVENÇÃO EM TERAPIA OCUPACIONAL Bolsista: Ana Paula Scheffer Voluntária Orientador: Prof. Dr. Milton.
Treinamento GP3 USP – GEFIM Abril de 2004 Alcides Pietro, PMP.
Bom (boa) dia tarde noite !!.
INICIAL.
Algoritmos com laços (ou seja, com conjuntos de instruções que devem ser executados repetidas vezes)
Gerência de Dados em Grades Motivação: – 1a geração de suporte a dados em Grades: ferramentas para transferência e catalogação de réplicas: Globus: GridFTP,
Slide 1 Rede Nacional de Ensino e Pesquisa Serviços do Middleware Treinamento em GRADEp – junho de 2005 GT GRADEp Middleware GRADEp Serviços.
MINISTÉRIO DO PLANEJAMENTO Secretaria de Logística e Tecnologia da Informação – SLTI Uso do Portal de Compras Governamentais pelos Municípios Alexandre.
Curso: Turma Recursal - Módulo de Atualização
Seminário sobre Execução Fiscal
Geração de Código Otimizações independentes de máquina.
Geração de Código Cap. 8. Introdução Fase final para um compilador Entrada é uma representação intermediária do código fonte e a saída é um programa para.
Problema do percurso mínimo
O Fluxo de Testes © Alexandre Vasconcelos
Serviços Integrados na Arquitetura da Internet Apresentação: Fernando Nadal.
Aplicação de Técnica Fuzzy em SIG como alternativa para o Zoneamento Ecológico Econômico (ZEE) Maria Isabel Sobral Escada.
Planejando seu site Objetivos Abordagem Sílvia Dota.
Metodologias de Construção de Sites
UNIVERSIDADE DE PASSO FUNDO
Curso de Engenharia Industrial Madeireira – UFPR Prof. Umberto Klock
A EDUCAÇÃO FISCAL COMO EXERCÍCIO DE CIDADANIA
TRIBUNAL SUPERIOR DO TRABALHO DIRETORIA-GERAL DE COORDENAÇÃO ADMINISTRATIVA SECRETARIA DE CONTROLE INTERNO O CONTROLE INTERNO NA AVALIAÇÃO DE RESULTADOS.
1 CONHECENDO O TRIBUNAL DE CONTAS DA UNIÃO. 2 TCU Executivo Controle Interno Judiciário Controle Interno Legislativo Controle Interno O Modelo de Controle.
LIDERANÇA COMO INVESTIMENTO PROPULSOR DE MOTIVAÇÃO NAS ORGANIZAÇÕES
Secretaria de Comunicação
CSC E-CNS CE-235 Sistemas Embarcados de Tempo Real 2° Semestre de 2006 Componente de Software de Computador de Comunicação, Navegação, Vigilância CSC E-CNS.
Segurança de Dados no MAER.
1 2º Semestre de 2006 CSC V-CTR USC CTR - Glêvson USC POT - Caio USC COMB - Débora Prof. Cunha Prof. Vieira Dias Prof. Márcio Programa de Pós-Graduação.
REALINHAMENTO ESTRATÉGICO E RECOMENDAÇÕES AO ATUAL MODELO DE GESTÃO Conclusão do Projeto Companhia de Desenvolvimento dos Vales do São Francisco e do Parnaíba.
Intervalos de confiança Sejam X 1, X 2, …, X n i.i.d. com distribuição F. Um intervalo de confiança de nível 1– para é um par de estatísticas [T 1 (X),
Empreendedorismo DRUCKER ROBBINS
SECRETARIA DE BIODIVERSIDADE E FLORESTAS DIRETORIA DO PROGRAMA NACIONAL DE ÁREAS PROTEGIDAS.
Disciplina: CIÊNCIAS DO AMBIENTE
Seminário FIESP 30 de janeiro de 2007 Ambiente Regulatório e Inserção do Gás Natural na Matriz Energética Brasileira Jerson Kelman Diretor-Geral da ANEEL.
SECRETARIA DO MEIO AMBIENTE Secretaria de Estado do Meio Ambiente Coordenadoria de Planejamento Ambiental Brasília, 07 de abril de 2009 Zoneamento Ecológico.
Roberto Alves Monteiro
Destinação Adequada de Pneus Inservíveis
Programa de Saúde Mental Comunitária Secretaria Municipal da Saúde
Ministério do Meio Ambiente 28, 29 e 30 de novembro Brasilia Fortalecendo o Sistema Nacional do Meio Ambiente Ministério da Educação.
Direito Desportivo Novos rumos legais PARCERIAS NO FUTEBOL Ivandro Sanchez.
José Eduardo Bevilacqua Divisão de Qualidade das Águas
Gestão estratégica de custos: utilização do método de custeio UEP – Unidade de Esforço de Produção como ferramenta estratégica para redução do custo unitário.
Proposta de critérios e procedimentos para a concessão da GDAR Matuzalém Batista Pereira Elisa Vieira Leonel Fábio Santos Lobão Ricardo de Holanda Melo.
Superintendência de Serviços Públicos Roberto Pinto Martins Salvador, 19 de agosto de
TE 043 CIRCUITOS DE RÁDIO-FREQÜÊNCIA
Região Sul Coordenador: José Cezar Pereira - EPAGRI.
Desempenho A rápida taxa de melhoria na tecnologia de computadores veio em decorrência de dois fatores: avanços na tecnologia utilizada na construção.
Capítulo 1 Introdução 1.1 O que é um sistema operacional
Centralização Alfandegária
VENDAS NO CONTEXTO DE MARKETING
Recursividade Estrutura de Dados.
METODOLOGIA DE PESQUISA EM EDUCAÇÃO INTRODUÇÃO A PESQUISA ACADÊMICA Roberval Francisco de Lima SÃO ROQUE 2006.
Autenticação em ASP.NET
Introdução à Probabilidade
The Data Warehouse Toolkit
WOntoVLab: Uma Arquitetura para Laboratórios Virtuais Baseada em Workflows e Ontologias Aluno: Daniel Cintra Cugler Orientadora: Profª. Dra. Marilde T.
Tamanho da amostra em pesquisa primária
LINGUAGENS DE PROGRAMAÇÃO
Computação Gráfica Geometria de Transformações
SECRECRETARIA DE ESTADO DE PLANEJAMENTO E CORRDENAÇÃO GERAL CAPACITAÇÃO PARA ELABORAÇÃO PTA/LOA Cuiabá, 21 de junho de 2004.
PPA Qual a periodicidade? Quais os momentos do CICLO do PPA?
Introdução Ciência da Computação estudo de algoritmos –ÊNFASE ao estudo de DADOS armazenamento manipulação refinamento (a partir de dados cru) estrutura.
Professor: Hyggo Almeida
Amostragem de uma sinusóide de 25 Hz com uma frequência de amostragem de 20 Hz.
Transcrição da apresentação:

Tratamento da indexação de documentos no LexML: como compatibilizar os múltiplos vocabulários? João Lima Senado Federal / Prodasen

Problema –Interoperabilidade entre tesauros / vocabulários controlados indexação de assunto Proposta de solução –Curto prazo –Médio prazo –Longo prazo

Tesauros Controle de vocabulário especializdo –Indexação –Recuperação da Informação Para assegurar a recuperação de um número desejável de documentos relevantes (revocação) e garantir uma seleção mais precisa (precisão) Substituição da query do usuário –não-descritor > descritor Expansão da query do usuário –descritor + não descritor (UPs) –descritor + descritor (TEs) –descritor + descritor (TRs) Pré-coordenação / Pós-coordenação Público-Alvo ~ Escopo

Escopo dos Tesauros

Escopo Comum Usuário: Cidadão Informação Legislativa e Jurídica

Problema T1 T2 T3 US casamento UP matrimonio UP nupcias US matrimonio UP casamento US casamento civil

T1 T2 T3 matrimonio 30 docs casamento 50 docs casamento civil 20 docs US casamento UP matrimonio UP nupcias US matrimonio UP casamento US casamento civil Problema

T1 T2 T3 matrimonio 30 docs casamento 50 docs casamento civil 20 docs US casamento UP matrimonio UP nupcias US matrimonio UP casamento US casamento civil Problema Pesquisa em uma base unificada matrimonio :: 30 docs casamento :: 70 docs casamento civil :: 20 docs

Graus de Equivalência Equivalência Exata –Significado / escopo Equivalência Inexata –+ou - Equivalência Parcial –TG ou TE Equivalência Simples-Múltiplo Não Equivalência ISO

Curto Prazo Objetivo –com pouco esforço, implementar a recuperação por assunto no LexML Exportar não descritores (Local) –matrimonio {casamento, núpcias} –casamento {matrimonio} –casamento civil Mapeamento entre tesauros pilotos (Local) –inclusão de não descritores –Ex: matrimonio {casamento, nupcias} casamento {matrimonio, nupcias}

Expansão de Query x Multiplicidade de Alvo T1 or T2 or T3 or T4 or T5 - Consome mais recursos na consulta - É necessário um tesauro para realizar a expansão - Mais chances de obter lixo T

T1 T2 T3 matrimonio {c, n} 30 docs casamento {m, n} 50 docs casamento civil 20 docs US casamento UP matrimonio UP nupcias US matrimonio UP casamento UP nupcias US casamento civil Curto Prazo Pesquisa em uma base unificada matrimonio :: 30 docs :: 80 docs casamento :: 70 docs :: 100 docs casamento civil :: 20 docs :: 20 docs

Médio Prazo Objetivo –Criação de um tesauro unificado (Global) Exportar Tesauros (ex.: W3C SKOS) Geração semi-automática, revisão por um GT Mapeamento do tesauro individual (Local) –para o tesauro unificado –criação de TGs / TEs US casamento civil TG casamento Exportação da cadeia hierárquica (Local) –(isA – gênero/espécie) –Não exportar o rel. partitivo (TGP/TEP) casamento civil [casamento]

T1 T2 T3 matrimonio {c, n} 30 docs casamento {m, n} 50 docs casamento civil [ casamento ] 20 docs US casamento UP matrimonio UP nupcias US matrimonio UP casamento UP nupcias US casamento civil TG casamento Médio Prazo Pesquisa em uma base unificada matrimonio :: 30 docs :: 80 docs :: 100 docs casamento :: 70 docs :: 100 docs :: 100 docs casamento civil :: 20 docs :: 20 docs :: 20 docs

Longo Prazo Objetivo –Criação de uma ontologia (Global) a partir do tesauro unificado Mapeamento do tesauro individual –para a ontologia (Local) Criação de um Glossário (Global) –para o cidadão

Conclusão Abordagem incremental –Resultados rápidos –Próxima passo construído a partir dos passos anteriores Preserva a independência de cada órgãos na definição dos descritores Melhora da Recuperação da Informação