A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Extração de Informação Scylla Costa. Motivação Extração de Informação já existente na internet. –Processos Jurídicos. –Publicações de Professores.

Apresentações semelhantes


Apresentação em tema: "Extração de Informação Scylla Costa. Motivação Extração de Informação já existente na internet. –Processos Jurídicos. –Publicações de Professores."— Transcrição da apresentação:

1 Extração de Informação Scylla Costa

2 Motivação Extração de Informação já existente na internet. –Processos Jurídicos. –Publicações de Professores.

3 Problema Um advogado precisa ir fisicamente até um tribunal para saber se determinado processo sofreu algum andamento. Você precisa fazer uma apresentação para Geber e não sabe onde encontrar um catálogo de publicações relativas ao seu problema. Existe alguma semelhança entre a extração de informações sobre o andamento de processos em um determinado tribunal e as publicações científicas de um professor ?

4 Estado da arte A maioria das soluções convecionais para Extração de Informação(EI) utiliza gramáticas. Um Learnable Wrapper é a melhor solução para EI quando se utliza a Web.

5 Abordagem adotada Os dois problemas poderiam ser solucionados com a utilização de um Wrapper. O desenvolvimento do programa seria igual até um certo ponto. O software seria desenvolvido em Java e Delphi.

6 Abordagem em detalhes Um agente busca(IR) o texto desejado. Identificação das tuplas de informação no texto pesquisado. –Exemplos Inclusão das informações em um BD.

7 Dificuldades –Atributos perdidos. –Atributos com múltiplos valores. –Permutação na oredm dos atributos. –Exceções e typos.

8 Resultados obtidos No protótipo em Delphi, conseguimos extrair corretamente informações de um Tribunal. Este protótipo está apto a receber novas regras para diferentes tribunais.

9 Conclusões Enorme potencialidade de novas aplicações para EI na Web. Ramo ainda pouco explorado. Difícil de fazer uma solução geral.

10 Bibliografia utilizada C. N. Hsu and M. T. Dung, Generating Finite-State Transducers For Semi- Structured Data Extraction From The Web. In Information Systems, Vol 23, No 8, pp 521-538, Great Britain (1998). J. Cowie and W. Lehnert, Information Extraction. In Communications of the ACM, Vol 39, No 1, pp 80-91, January, Tucson, Arizona (1996). N. Kushmerick. Wrapper Induction for Information Extraction. Phd Thesis, Departmente of Computer Science and Engineering, University of Washingtong, Seattle, WA (1997).


Carregar ppt "Extração de Informação Scylla Costa. Motivação Extração de Informação já existente na internet. –Processos Jurídicos. –Publicações de Professores."

Apresentações semelhantes


Anúncios Google