Uma participação minimalista no Segundo HAREM

Slides:



Advertisements
Apresentações semelhantes
© 2005, it - instituto de telecomunicações. Todos os direitos reservados. Sara Candeias Fernando Perdigão CONVERSOR DE GRAFEMAS PARA FONES BASEADO EM REGRAS.
Advertisements

A história de uma língua
Universidade Federal do Rio de Janeiro Laboratório de Pesquisa em Tecnologias da Informação e da Comunicação PORTAIS DE INFORMAÇÃO E COMUNIDADES VIRTUAIS.
HAREM 2.0 Proposta Luís Sarmento e Cristina Mota
A Linguateca, e em especial a Floresta, o PAPEL e o HAREM
Apresenta: Projecto Ideia. Projecto: Ideia – Inclusão Digital com Ensino Interactivo Acessível. Conteúdos do 1º Ciclo para crianças com deficiência neuromotora.
Técnicas de pesquisa no Google
.. UNIVERSIDADE ESTADUAL DE CIÊNCIAS DA SAÚDE DE ALAGOAS – UNCISAL PRÓ-REITORIA DE EXTENSÃO PROJETO: Compilação de Termos Técnicos Gregos e Latinos de.
1 Faculdade de Tecnologia de São Caetano do Sul Prof. Msc Adilson Ferreira da Silva Ferramentas de Engenharia de Software.
Investigação Operacional 2009/2010 José Fernando Oliveira Manuel Pina Marques Maria Antónia Carravilla.
1 Controlo e Aprendizagem Aula Teórico-Prática nº 9 CIÊNCIAS DO DESPORTO E EDUCAÇÃO ESPECIAL E REABILITAÇÃO Aula Teórico-Prática nº 9 CIÊNCIAS DO DESPORTO.
Sistema para Leitura de Sensores Passivos aplicados à Biotelemetria
Aprendizado de Máquina
Produzido pela equipe do CAEF. Porto Alegre, 2001.
MAC 499 Trabalho de Formatura Supervisionado
ALUNA: Cristina Prange Teixeira
Desenvolvimento de PROJETOS.
Programação e Sistemas da Informação
Formação Inicial de Formadores
Criando corpora pessoais Corpógrafo – presente e futuro
Cifra de Vigenère Técnicas de Data Mining para cripto-análise
- PROGRAMA DE PORTUGUÊS -
Recuperação de Informação Distribuída por Fontes Autónomas com Sobreposição Joaquim Macedo Departamento de Informática Escola de Engenharia.
Introdução a Arquitetura Orientada a serviços
Método de Coleta de Dados
PORTUGAL Seleção Portuguesa de Futebol Atuou em 5 copas do mundo
A informática ao serviço da Pré-história: um novo olhar
Apresentação do Sistema
Tópicos em Gestão de Serviços – Regressão Linear
Terceiro Seminário REDEPRO Evoluindo no modelo Fábrica de Software Dezembro 2005.
Compiladores, Aula Nº 5 João M. P. Cardoso
Balanço final e perspectivas de futuro Diana Santos, Hugo Oliveira, Cláudia Freitas, Cristina Mota e Paula Carvalho Encontro do Segundo HAREM Universidade.
Cícero Nogueira dos Santos Ruy Luiz Milidiú
Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008.
Professora: Ana Isabel Mota
As seis etapas de um projecto de pesquisa
TESTA OS TEUS CONHECIMENTOS SOBRE AS ALTERAÇÕES ORTOGRÁFICAS DECORRENTES DO NOVO ACORDO ORTOGRÁFICO Professora: Ana Isabel Mota.
2012 / Julho – Raul Costa Alves
Trabalho de Database Marketing 1 Investigação programada no NEC em P rojectos e Estudos Projecto 2 Morfodinâmica de praias Hidrodinâmica e dinâmica.
Professora: Ana Isabel Mota
Sistema ECTS - European Credit Transfer System Universidade do Minho, 2003.
Projecto financiado com o apoio da Comissão Europeia no âmbito do programa “Lifelong Learning Programme – Comenius ( )” Ler, uma procura activa.
PRODUÇÃO TEXTUAL PREPARAÇÃO PARA O ENEM.
BEM VINDO À BIBLIOTECA PROCURA INFORMAÇÕES SOBRE UM TEMA OU UM AUTOR? PRETENDE CIRCUNSCREVER-SE AO OBJECTO DA INVESTIGAÇÃO, APRECIANDO A SUA AMPLITUDE,
AULA DE ESTATÍSTICA PROFESSOR RODRIGÃO.
_____________________________________
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
Programa Comenius Bilateral
Recursos da Linguateca Diana Santos Porto, 4 de Outubro de 2005.
Conceitos de Gestão da Informação
O Futuro da Europa Elisa Guimarães Ferreira e o Alargamento Escola Filipa Vilhena – Porto, 21 de Março de 2003 QUAL A POSIÇÃO PORTUGUESA.
Biblioteca do Conhecimento Online – b-on SCBIILA, São Paulo Setembro de 2007 Maria Teresa Costa.
Aula de 10 de Janeiro de 2013 Escola Secundária da Boa Nova 2013
Afonso E. V. Lopes; Mauricio Bologna; Márcia Ernesto Conclusões, Considerações Finais & Resumo Abril de 2011.
O Artigo Científico Cultura, Língua e Comunicação
Modelação Procedimental Interactiva Luís Lopes Projecto de Mestrado Engenharia Informática e Computadores Orientador: Joaquim Jorge Co-Orientador: Bruno.
Como se faz uma pesquisa? Como se trabalha em grupo
Adaptação do sistema de REM da Priberam ao HAREM Carlos Amaral, Helena Figueira, Afonso Mendes, Pedro Mendes, Cláudia Pinto, Tiago Veiga {cma, hgf, amm,
- 1 - Jogos de Empresas I - Prof. Luís Carlos Padrão O processo de recrutamento e seleção Os critérios de recrutamento e seleção Exemplo de descrição e.
Elementos pré-textuais, textuais e pós-textuais
Instituto de Ciências Sociais, Universidade de Lisboa Maria Manuel Vieira A ESCOLARIZAÇÃO.
Information and Communication Technologies 1 Visão do futuro do HAREM Diana Santos Linguateca Encontro HAREM, 15 de Julho de 2006.
Morfoolimpíadas Uma proposta concreta Paulo Alexandre Rocha & Diana Santos (Faro, 27 de Junho de 2002) Evolução.
João Falcão e Cunha, Miguel B. Gonçalves © 2003 Testes de Usabilidade1 “Não é o que considera sobre o seu sítio que conta, mas sim o que os utilizadores.
Classificação Probabilística com TBL Cícero Nogueira dos Santos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática.
Este Espaço na Web é um portal da Fundação Calouste Gulbenkian, que pretende ser um espaço de referência para os professores de ciência, onde estes, de.
Agrupamento de Escolas de Águeda Biblioteca Escolar
A apresentação desenrola-se automaticamente, mas se desejar “apressar” algum diapositivo basta “clicar” com o rato numa qualquer área da apresentação.
Information and Communication Technologies 1 Medindo a Linguateca Luís Fernando Costa e Luís Miguel Cabral.
COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA MOURA 1 ;
Transcrição da apresentação:

Uma participação minimalista no Segundo HAREM R3M Uma participação minimalista no Segundo HAREM Cristina Mota Linguateca Encontro do Segundo HAREM Aveiro, 7 de Setembro de 2008

Porquê minimalista? 1 Objectivo inicial Classificação de PESSOA, ORGANIZACAO e LOCAL Resultado final Identificação de tudo excepto TEMPO e VALOR Melhorar um sistema de REM baseado em aprendizagem semi-supervisionada 2 Dados etiquetados mínimos Treinar com poucos dados 3 Melhor é melhor que mais Porquê minimalista?

Sistema de Base Collins & Singer (1999) Ideia inicial a melhorar baseada em Mota & Grishman (2008)

Sistema R3M NooJ (Silberztein, 2004) → JET (Grishman,1999-2006) Classificar P O L→ Classificar P O L e outro  → Módulo de selecção Collins & Singer (1999) Sementes EM → Sementes EM + contexto Collins & Singer (1999) Sistema R3M O que precisava de ser melhorado ou adaptado?

Sistema R3M Atomizador Segmentador de frases Consultador de dicionário Etiquetador morfo-sintáctico (HMM) Etiquetador de EM Analisador de grupos nominais Analisador sintáctico Analisador sintáctico estatístico Reconhecedor de padrões Resolvedor de referências Sistema R3M Ferramentas do JET – Java Extraction Toolkit

Sistema R3M Dicionários: Cargos (106) e formas de tratamento (59) disponibilizados pela organização do HAREM Palavras de ligação extraídas de um fragmento do CETEMPúblico (8112) dicionário de português integrado no NooJ (Barreiro, 2007) Palavras em maiúsculas da Colecção do Segundo HAREM (10050) Sistema R3M Recursos portugueses

Padrões: Conjunto de padrões para delimitação de candidatos a EM Conjunto de padrões para identificação do contexto envolvente da EM Material de treino: Floresta sintáctica (Afonso et al., 2001), para treino de analisador morfo- sintáctico Colecções dourada e HAREM do Primeiro HAREM, para treino do classificador de EM Colecção dourada do Mini-HAREM, para teste do classificador de EM Sistema R3M Recursos portugueses

Resultados

Resultados

Resultados

Contrariamente à nossa posição no Primeiro HAREM, optámos por seguir as regras do jogo Tirámos partido de ferramentas “genéricas” testadas em inglês , criando ou usando recursos portugueses Usámos recursos mínimos Obtivémos uma pontuação competitiva sem classificação Anotação da CD do Primeiro HAREM não era 100% compatível com o Segundo HAREM Teste e validação com programas de avaliação do Primeiro HAREM poderia ser enganador O que teria acontecido se o classificador e o Murphy não se tivessem encontrado? Comentários finais

A Linguateca e o HAREM são financiados através do contrato nº 339/1 A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN. Agradecimentos