Adaptação do sistema de REM da Priberam ao HAREM Carlos Amaral, Helena Figueira, Afonso Mendes, Pedro Mendes, Cláudia Pinto, Tiago Veiga {cma, hgf, amm,

Slides:



Advertisements
Apresentações semelhantes
Concepção da linguagem, ou seja, porque e como ela é como é?
Advertisements

Roteiro da Apresentação Conhecimento Operacional Procedimentos x Práticas Possíveis Técnicas de Representação Grafos de Contexto Conclusões.
HAREM 2.0 Proposta Luís Sarmento e Cristina Mota
III – Análise sintáctica
I - Noções dum compilador
Controlo e Aprendizagem (Ciências do Desporto e E.Especial e Reabilitação) Aula teórica 1/1 Aprendizagem e Performance Corpo Docente Mário Godinho ( Turmas.
Software Básico Silvio Fernandes
Formação de Sequências, Contingências, Regras e Resolução de Problemas
Interfaces Conversacionais
Programação Lógica: PROLOG
Construção de Compiladores
Prof. Msc. Raul Paradeda Aula 3 Fundamentos
PARQUE SERRALVES PROJECTO SIG O projecto Parque de Serralves - Projecto SIG é um sistema de apoio à gestão das actividades de manutenção da flora do Parque.
Cifra de Vigenère Técnicas de Data Mining para cripto-análise
University of Minho, Portugal
© 2005, it - instituto de telecomunicações. Todos os direitos reservados. Sara Candeias Fernando Perdigão Carla Alexandra Lopes Arlindo Oliveira da Veiga.
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
19 de Outubro de 2007 Das 10 às 13 horas Convidados: Dr.ª Maria do Rosário Farmhouse Antropóloga; Directora do JRS- Portugal – Serviço Jesuíta aos Refugiados.
Análise Semântica e Representação Intermédia
Prolog Programação Lógica Ícaro A. Souza.
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
© 2011 Campus da FEUP Rua Dr. Roberto Frias, Porto Portugal T F
Compiladores, Aula Nº 11 João M. P. Cardoso
Balanço final e perspectivas de futuro Diana Santos, Hugo Oliveira, Cláudia Freitas, Cristina Mota e Paula Carvalho Encontro do Segundo HAREM Universidade.
Cícero Nogueira dos Santos Ruy Luiz Milidiú
Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008.
CRC e 10 de Novembro de 1998 Um Agente de Filtragem de Correio Electrónico Indesejado José CamposEdmundo Monteiro Dep. de InformáticaDep. de Eng.
Encontro do Segundo HAREM
INQUER Interacção Pessoa-Máquina em Linguagem Natural
Análise e compreensão da experiência valorativa
Uma participação minimalista no Segundo HAREM
Actividades realizadas
Análise Léxica Primeira fase de um compilador
79ª Feira do Livro Lisboa MÓDULO 3 BANCAS MÓDULO SEM BANCAS MÓDULO UMA BANCA S1S1S3S3S2S2 APRRESENTAÇÃO DE TRÊS SOLUÇÕES.
Emanuel Pires Nº4 Cef oi. A Comissão Nacional de Protecção de Dados (CNPD) é uma entidade administrativa independente com poderes de autoridade, que funciona.
Recursos da Linguateca Diana Santos Porto, 4 de Outubro de 2005.
Plano B • O Reino de Portugal
Fase de Concepção (Início, Planejamento)
Recuperação de Informação
MECATRÓNICA AUTOMATISMO Trabalho realizado por : Carlos Santos Marco Tavares 10 C.
Vocabulários Controlados
Técnicas de Representação de Conhecimento Diversas.
Orientação a Objetos Parte I
Análise Léxica.
Introdução à programaçao em PERL Levi Lúcio, Vasco Amaral, Programação em PERL, FCA-Editora de Informática.
Analise sintática aula-07-analise-sintática.pdf.
Título do trabalho Arial Negrito corpo 72pt podendo ser reduzido para até corpo 60, caso a quantidade de texto ultrapasse o espaço delimitado Introdução.
Algoritmos e Estrutura de Dados I Jean Carlo Mendes
Analise Semântica aula-10-analise-semântica.pdf.
Analisador Léxico Prof. Alexandre Monteiro
Usando Perl para a extracção automática de informação a partir de corpus bruto / cru Tema 4A Pablo Gamallo Otero
Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco.
Interpretação Vs Tradução Confusão entre Tradução e Interpretação 1.Tradutor – Constante verificação, recurso a dicionários e glossários, corpora, base.
Operações de referência Semântica e Pragmática da Língua Portuguesa Professora Sabine Mendes 1/2013.
COMPILADORES 04 Prof. Marcos.
27 de Junho de Floresta sintá(c)tica: um recurso para avaliação Diana Santos Susana Afonso
Information and Communication Technologies 1 Visão do futuro do HAREM Diana Santos Linguateca Encontro HAREM, 15 de Julho de 2006.
1. Aspectos tradicionais da Morfologia 1.1. A palavra ou vocábulo formal.
1. Aspectos tradicionais da Morfologia
Professor: Pedro Lopes Gestão de Base de dados Ano Lectivo 2010/2011.
Sintaxe de uma Linguagem
COMPUTAÇÃO MÓVEL Prof.: Jean Carlo Mendes
Compilador Software que traduz o texto (linguagem fonte) que representa um programa para código máquina(linguagem alvo) capaz de ser executado pelo.
Faculdade Pernambuca - FAPE Compiladores Abril/2007 Compiladores Abril/2007.
MATA56 Tipos, Verificação de Tipos Agenda Objetivo desta aula: Introduzir os principais aspectos semânticos de variáveis Palavras-chave – nomes.
COMPILADORES 03 Prof. Marcos.
Corpus lingüísticos: proceso de elaboración e extracción automática de información María Paula Santalla del Río Pablo Gamallo Otero Elaboración do material.
Transcrição da apresentação:

Adaptação do sistema de REM da Priberam ao HAREM Carlos Amaral, Helena Figueira, Afonso Mendes, Pedro Mendes, Cláudia Pinto, Tiago Veiga {cma, hgf, amm, prm, cp, Priberam Alameda D. Afonso Henriques, º Esq Lisboa, Portugal Tel.: / Fax:

Encontro do Segundo HAREM: Aveiro, SUMÁRIO 1.Importância do REM 2.Descrição do sistema –Adaptação do sistema para o HAREM 3.Análise dos resultados da participação no segundo HAREM –Resultados no HAREM Clássico –Resultados na pista TEMPO 4.Conclusões e trabalho futuro

Encontro do Segundo HAREM: Aveiro, IMPORTÂNCIA DO REM Importância do REM para a Priberam: –Correcção sintáctica (FLiP) Detecção de sequências de palavras como unidades morfossintácticas –Sistemas automáticos de resposta a perguntas Indexação de textos Categorização da pergunta Extracção das respostas –IncogniX (ferramenta para substituição de entidades nos acórdãos do STJ) –Motores de pesquisa (ex.: JN, TSF)

Encontro do Segundo HAREM: Aveiro, EXEMPLO DE USO DO SISTEMA EM MOTORES DE PESQUISA

Encontro do Segundo HAREM: Aveiro, DESCRIÇÃO DO SISTEMA Léxico com classificação morfossintáctica e semântica ex.: árvore s1 [planta lenhosa] N (SING|, FEM|, CART|, DATAN|, VEGETAL|) s2 [estrutura de representação] N(SING|, FEM|, CART|, DATAN|, ABSTR|CONCR) s3 [eixo, veio] N(SING|, FEM|, CART|, DATAN|, CONCR|, Pde|) Regras contextuais, que permitem: –Atribuição de valores morfológicos e semânticos a sequências de tokens ex.: Pal(secretaria) Pal(de) Pal(estado) = N Pal(às) Pal(primeiras) Pal(horas) Pal(de) Cat(N(DIASEMANA)) = ADV Cat(Vg)? Cat(ADV) Cat(Vg)? Cat(CARD) = CARD –Classificação contextual de EM, que ultrapassa a simples herança dos valores dos nomes próprios classificados no léxico

Encontro do Segundo HAREM: Aveiro, DESCRIÇÃO DO SISTEMA Primeira fase de classificação: herança dos valores atribuídos ao léxico Segunda fase de classificação: análise contextual Constantes: usadas na identificação e classificação de EM ex.: Constante Extensaodeagua = Pals(mar, oceano, rio, lago) Extensaodeagua Pal(de) Cat(Nprop) = EM Constante Listadeorganizacoes = Pals(instituto, instituição, organização, associação) Cat(NPROP(PESSOA)) PreposicaoDe Cat(NPROP) = ENT(ORGANIZACAO) If before $$ Is Listadeorganizacoes

Encontro do Segundo HAREM: Aveiro, ADAPTAÇÃO DO SISTEMA AO HAREM Categorias já reconhecidas pelo sistema antes da participação no segundo HAREM: PESSOA, LOCAL, ORGANIZACAO, VALOR, TEMPO Categorias criadas para o HAREM (para EM que já eram identificadas mas não classificadas): ABSTRACCAO, ACONTECIMENTO, COISA, OBRA Tipos criados para o HAREM: LOCAL(AGUACURSO, AGUAMASSA, RELEVO, ILHA), PESSOA(GRUPOMEMBRO)

Encontro do Segundo HAREM: Aveiro, ADAPTAÇÃO DO SISTEMA AO HAREM Filtro em XML para conversão das categorias: <TRACO NOME="TipoEM" ANTROP_IND {1}

Encontro do Segundo HAREM: Aveiro, ANÁLISE DOS RESULTADOS: HAREM CLÁSSICO Resultados absolutos no cenário TOTAL: 72,29% de EM correctamente identificadas 51,45% de EM correctamente classificadas Avaliação entre todos os participantes: 1.ª posição na Medida-F, em classificação e em identificação, no cenário TOTAL 1.ª posição na Medida-F, em classificação e identificação, nos cenários selectivos 3 e 4 1.º posição em 13 dos 28 cenários de avaliação Avaliação por categoria: 1.ª posição nas categorias ABSTRACCAO e COISA 1.º posição, em classificação e abrangência, na categoria PESSOA Resultados mais baixos nas categorias LOCAL, TEMPO e VALOR

Encontro do Segundo HAREM: Aveiro, ANÁLISE DOS RESULTADOS: PISTA TEMPO Avaliação na miniCD: 2.ª posição na classificação de EM 1.ª posição na identificação de EM Avaliação na pista TEMPO : 1.ª posição, em identificação, no cenário TOTAL e nos cenários selectivos 4 e 6 Melhores resultados, tal como no HAREM Clássico, na identificação de EM do que na sua classificação

Encontro do Segundo HAREM: Aveiro, ANÁLISE DOS RESULTADOS: PISTA TEMPO Principais razões para os resultados na pista TEMPO: –Critérios anteriormente estabelecidos para o sistema divergentes em relação aos do HAREM –Exclusão de iniciadores de expressões temporais como as preposições e contracções: Ex.: em 1996 (CD do HAREM) 1996 (Priberam) do século 21 (CD do HAREM) século 21 (Priberam)

Encontro do Segundo HAREM: Aveiro, CONCLUSÕES E TRABALHO FUTURO Melhoramento da classificação de EM (diferenças entre os valores da identificação e da classificação no HAREM) Classificação de EM ainda não reconhecidas pelo sistema ( ABSTRACCAO|IDEIA, ACONTECIMENTO|EVENTO, COISA|CLASSE, COISA|MEMBROCLASSE, COISA|OBJECTO, COISA|SUBSTANCIA, PESSOA|GRUPOCARGO, PESSOA|GRUPOIND, PESSOA|MEMBRO, PESSOA|POVO ) Reconhecimento de nomes próprios ambíguos com nomes comuns em início de frase ou após travessão Ex.: STN – Sistema de Transmissão do Nordeste Tratamento da metonímia: –Restrições de selecção dos verbos –Marcação de regências nominais Ex.: O Palácio de Belém pronunciou-se [sujeito humano/grupo humano] Palácio de Belém satisfeito [qualificador de nome humano] pronunciou- se Uso da ontologia na classificação contextual das EM

Priberam Alameda D. Afonso Henriques, º Esq Lisboa, Portugal Tel.: / Fax: