Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu Guylerme Velasco, Roberta Claudino, Thiago Ribeiro.

Slides:



Advertisements
Apresentações semelhantes
Análise e Projeto de Sistemas I
Advertisements

Introdução à Programação: uma Abordagem Funcional PD I – Engenharia Elétrica Prof.ª Claudia Boeres 2008/2.
Agenda Introdução Justificativa Objetivo Detecção de Spam
QUANTIFYING QUALITATIVE ANALYSES OF VERBAL DATA: A PRACTICAL GUIDE
INTELIGÊNGIA COMPUTACIONAL
Introdução à Programação uma Abordagem Funcional Programação I Prof.ª Claudia Boeres CT VII - Sala 32 Departamento de Informática Centro.
Object and Subject Pronouns
Aprendizado de Máquina
Alexandre Paiva Guylerme Velasco
Extração de Informação Scylla Costa. Motivação Extração de Informação já existente na internet. –Processos Jurídicos. –Publicações de Professores.
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
TIPOS DE TESTES APLICÁVEIS E NÃO APLICÁVEIS AO PROJETO
Apresentação para disciplina Programação Funcional Avançada
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Research of Dynamic SOA Collaboration Architecture
Tao Qin, Tie-Yan Liu, Jun Xu, Hang Li
PGEE Sistemas Lineares
Objetivo / Material e Métodos Texto texto texto Objetivo / Material e Métodos Texto texto texto Título do Trabalho Título do Trabalho Título do Trabalho.
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Reconhecimento de Expressões Faciais em Imagens
Sistema Recomendador para Comércio Eletrônico
Cícero Nogueira dos Santos Ruy Luiz Milidiú
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA.
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
Tópicos de Sistemas de Informação A
Uso de Sistemas Imunológicos Artificiais para Detecção de Falhas em Plantas da Indústria de Petróleo. Aluno: Alexandre Willig Quintino dos Santos Orientador:
Fase de Elaboração: Fluxo de Análise Análise de Sistemas de Software Prof. Rodrigo Ribeiro.
MapReduce Conceitos e Aplicações
INF 1771 – Inteligência Artificial
Qualidade do Produto de Software
APLICANDO O PROCESSO DIRIGIDO POR RESPONSABILIDADES PARA A CRIAÇÃO DE UM SUBFRAMEWORK PARA VALIDAÇÃO SINTÁTICA DE FÓRMULAS Autores: Rafael Hornung Simone.
Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos pela presença de edifícios Natália Cosse Batista Grupo 8.
Como escrever um artigo
Seleção de Atributos Ricardo Prudêncio.
Tópicos Avançados em Inteligência Artificial
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Analise Semântica aula-10-analise-semântica.pdf.
Porque um novo ambiente?. Interação inter-grupos  A maioria das ferramentas existentes provê interação dentro do grupo. Na concepção adotada nessa proposta.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
A Lexicon-Enhanced Method for Sentiment Classification: An Experiment on Online Product Reviews Bruno Andrade.
Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu.
Aluna: Monica Beltrami Orientador: Arinei Carlos Lindbeck da Silva
Uma Introdução a SVM Support Vector Machines
Sumarização Ontologias Paulo Orlando V. Q. Sousa.
Uma Ferramenta para Configuração Colaborativa de Produtos em LPS Carlos Roberto Marques Junior
CMP167 – Programação com Objetos Distribuídos Aluno: Carlos Oberdan Rolim A Comparative Study between Computer Programming Languages for Developing Distributed.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Computabilidade e Linguagens Formais
E-Commerce, Systems Performance Evaluation, and Experimental Development Laboratory A Model Checking Methodology for E-commerce Systems Adriano Machado.
Classificação Probabilística com TBL Cícero Nogueira dos Santos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática.
Reconhecimento Facial usando SVM
Resolução de Anáforas Pronominais Apresentação da Proposta de Projeto Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática INF.
Classificação de Textos
ASSOCIAÇÕES ENTRE SONS E IMAGENS REALIZADAS PELO CÉREBRO E O EFEITO BUBA-KIKI Braga, C. F. R.; Cândido, E. G.; Ganso, G. P. S.; Julião, A. E. S. S.; Lago,
Nº Aluno: Nome: António Paulo Santos Sessão Controlo Tese 2º Semestre 2007/2008.
Professora Michelle Luz
Computação Evolutiva Nome dado ao estudo de algoritmos cuja inspiração é o processo de evolução natural das espécies. Origem: trabalho de um pesquisador.
Felipe Nunes Flores – Programa de Educação Tutorial.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Aula Pratica Aprendizagem WEKA Prof. Ivan Gesteira Costa Filho Centro de Informática Universidade Federal de Pernambuco.
Elisa Menendez - Yenier Torres - Extração de Relacionamentos em Textos de Linguagem Natural Anteprojeto.
Tarefa 2 Grupo XO+ Disciplina MO825B: Tópicos em Interfaces de Usuário – 2007/02 Professora: Dra. Maria Cecília C. Baranauskas Alunos: Frederico Fortuna,
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.
Testes de Unidade. 2 Pauta Testes de Unidade; Testes de Unidade; Desenvolvimento orientado a testes; Desenvolvimento orientado a testes; Testes unitários.
ATRIBUIÇÃO AUTOMÁTICA DE AUTORIA EM ARTIGOS
Transcrição da apresentação:

Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu Guylerme Velasco, Roberta Claudino, Thiago Ribeiro

Objetivo Conseguir bons resultados para o problema de resolução de anáforas na 3ª pessoa do singular.

Descrição do Problema Resolução de co-referência é o processo de determinar expressões no texto que se referem à mesma entidade no mundo real. O processo de encontrar o antecessor apropriado a cada expressão no texto é chamado de resolução de anáfora. Tal resolução é muito importante porque sem a mesma o texto não estaria completamente e corretamente compreendido. Enquanto os seres humanos conseguem solucionar este problema de forma fácil e rápida, esta é uma tarefa difícil computacionalmente.

Definição do Problema Anáfora pronominal: é aquela em que a relação anafórica é tecida através do uso de pronomes (ele, ela, eles, elas). A função pronominal, nesses casos, é apenas estabelecer a ancoragem com um termo antecedente, como mostramos a seguir no exemplo: Lula é o atual presidente do Brasil. Ele já foi reeleito. (Ele se refere a Lula)

Método Proposto SVM - Support Vector Machine

Definição de SVM Aprendizado supervisionado Utilizado em problemas de classificação e regressão

Corpus s/9/9b/Wsj15-16_coref.zip Mr._NNP_O_B-NP_O Stone_NNP_PER_I-NP_A+ told_VBD_O_B-VP_O his_PRP$_O_B-NP_O story_NN_O_I-NP_O._._O_O_O EOS_EOS_EOS_EOS_O He_PRP_O_B-NP_C1- talked_VBD_O_B-VP_O about_IN_O_B-NP_O 20_CD_O_I-NP_O minutes_NNS_O_I-NP_O._._O_O_O EOS_EOS_EOS_EOS_O When_WRB_O_B-ADVP_O he_PRP_O_B-NP_C1- was_VBD_O_B-VP_O through_IN_O_B-ADJP_O

Estratégia adotada Gerar features a partir do corpus Escolher boas features Gerar arquivo de entrada do SVM Fazer validação cruzada Evitar o overtrainning Evitar criação excessiva de Support Vector Minimizar o erro de classificação

Features utilizadas Se pronome é He ou She Quantidade de sentenças entre o pronome e o nome referenciado Quantidade de nomes entre o pronome e o nome referenciado Se o nome é masculino ou feminino

Implementação do software Lê o corpus etiquetado Separa a parte que será usada para treino e para teste Para cada texto do grupo de treino e teste Para cada pronome encontrado Verifica se é He ou She Contabiliza a quantidade de sentenças entre o pronome e sua referência Contabiliza a quantidade de nomes entre o pronome e sua referência Verifica se o nome ao qual faz referência é masculino ou feminino Gera regras certas associando o pronome à sua referência correta Gera regras erradas associando o pronome aos demais nomes no texto Fim-Para

Arquivo de entrada para o SVM.=. :... : #.=. +1 | -1 | 0 |.=. | "qid".=..=. 1 1:9 3:1 4:0 5:0 6:0 8:1 1 2:10 3:2 4:0 5:0 6:0 8:1 1 1:11 3:0 4:0 5:0 6:0 9:1 -1 1:23 3:2 4:0 5:0 6:0 11:1 -1 1:23 3:10 4:2 5:0 6:0 11:1 -1 1:23 3:12 4:3 5:0 6:0 11:1

Verificação dos Resultados Textos para treino = 120 (5 grupos de 24) Textos para teste = 63 Cross Validation Ingênuo Busca pelo nome anterior mais próximo

Resultados obtidos

Conclusões Corpus bastante homogêneo Maior parte dos nomes e pronomes masculinos Pequena quantidade de nomes entre o pronome e sua referência

Referências Marin Dimitrov A Light-weight Approach to Coreference Resolution for Named Entities in Text University of Sofia "St. Kliment Ohridski" Judita Preiss Choosing a Parser for Anaphora Resolution Computer Laboratory Shalom Lappin and Michael McCord ANAPHORA RESOLUTION IN SLOT GRAMMAR IBM T. J. Watson Research Center Shalom Lappin An Algorithm for Pronominal Anaphora Resolution SOAS, University of London Natalia N. Modjeska, Katja Markert, Malvina Nissim Using the Web in Machine Learning for Other-Anaphora Resolution Proceedings of the 2003 Conference on Emprical Methods in Natural Language Processing Niyu Ge, John Hale and Eugene Charniak A Statistical Approach to Anaphora Resolution Dept. of Computer Science, Brown University