ReGras Lexical Database Ronaldo Martins. Outline Motivation Warning The Past The Present The Future The Golden List A Checker Dictionary Commitments Final.

Slides:



Advertisements
Apresentações semelhantes
Presenter’s Notes Some Background on the Barber Paradox
Advertisements

Direct Object Pronouns The direct object is a noun, nominal group, or a pronoun that answers the question….Who / Whom or What. The direct object directly.
São Paulo - November 7, 2013 Measuring the Cost of Formalization in Brazil © 2003 The Ronald Coase Institute Adopting RCI methodology to measure start.
Chapter Six Pipelining
Por Dave Batty 3/2012 T Disciplinando alunos no programa Desafio Jovem Teen Challenge Staff Training Course T iTeenChallenge.org.
Copyright no direito americano: o caso Leslie Kelly v. Arriba Soft Corp. 1.
1 O direito americano A análise das excepções concentra-se no fair use: o direito americano permite a um utilizador exigir o acesso à obra e a sua reprodução.
Going to.
Reported Speech or Indirect Speech
Towards a Requirement Analysis Approach for Dependable Law-Governed Systems Maíra Gatti, Gustavo Carvalho May 2nd 2006.
Conversation lesson Unit 14 – Poetry/ Song Teacher: Anderson.
Indirect Speech By Laecio Miranda.
SIMPLE PRESENT TENSE.
DIRETORIA ACADÊMICA NÚCLEO DE CIÊNCIAS HUMANAS E ENGENHARIAS DISCIPLINA: INGLÊS FUNDAMENTAL - NOITE PROFESSOR: JOSÉ GERMANO DOS SANTOS PERÍODO LETIVO
DIRETORIA ACADÊMICA NÚCLEO DE CIÊNCIAS HUMANAS E ENGENHARIAS DISCIPLINA: INGLÊS FUNDAMENTAL - NOITE PROFESSOR: JOSÉ GERMANO DOS SANTOS PERÍODO LETIVO
Um pouco mais sobre modelos de objetos. Ray Path Categorization Ray Path Categorization. Nehab, D.; Gattass, M. Proceedings of SIBGRAPI 2000, Brazil,
Uniform Resource Identifier (URI). Uniform Resource Identifiers Uniform Resource Identifiers (URI) ou Identificador de Recursos Uniforme provê um meio.
FLUP - Elena Zagar Galvão Faculdade de Letras da Universidade do Porto Mestrado em Tradução e Serviços Linguísticos COMUNICAÇÃO ESPECIALIZADA INTRODUÇÃO.
Juliane Roitmam Renata Roberto
SECEX SECRETARIA DE COMÉRCIO EXTERIOR MINISTÉRIO DO DESENVOLVIMENTO, INDUSTRIA E COMÉRCIO EXTERIOR BRAZILIAN EXPORTS STATISTICAL DEPURATION SYSTEM Presentation.
ECONOMIA DE EMPRESAS II Semestre 2011 AULA 5. ARCHITECTURE- GOVERNANCE- GROWTH MODEL.
Participant observation in hostess bars gaining access to a difficult terrain hugo dias antónio rodrigues university of coimbra.
Genética Molecular em Análises Clinicas
Em Torno da Felicidad e Amongst Happiness Em de felicidade convém não esquecer que nos transformamos sempre naquilo que amamos. Em matéria de felicidade.
Acção de Formação A Biblioteca Escolar: Leitura e Literacia no 2º e 3º ciclos do Ensino Básico e Secundário Centro de Formação Júlio Brandão
IEEE PES General Meeting, Tampa FL June 24-28, 2007 Conferência Brasileira de Qualidade de Energia Santos, São Paulo, Agosto 5-8, Chapter 3 Harmonic.
Indirect Object Pronouns - Pronomes Pessoais Complemento Indirecto
NO I CAN'T FORGET THIS EVENING Não, não posso esquecer essa noite OR YOUR FACE AS YOU WERE LEAVING Ou seu rosto enquanto você partia BUT I GUESS THAT'S.
Imagine there's no heaven Imagine não existir paraíso It's easy if you try É fácil se você tentar No hell below us Nenhum inferno abaixo de nós Above.
OER LIFE CYCLE Andrew Moore and Tessa Welch.
Compiled Corpus transcribed spoken text scientific and academic text literary text Não foram fornecidas informações sobre o balanço destes confrontos Selva.
Tópicos Especiais em Aprendizagem Reinaldo Bianchi Centro Universitário da FEI 2012.
Números de 0 a 1,000,000,000 É uma dúvida de muitos estudantes do nível básico como dizer os números em inglês. Segue abaixo a lista de 0 a 1,000,000,000.
Fazendo e Brincando: Confecção de Materiais para as Aulas de Inglês
DISCURSO DIRETO E INDIRETO
Curso Gestão Estratégica de Dívida Pública para os Estados Workshop on Debt Management Strategies for Brazilian Subnationals Jorge Luís Tonetto CONFAZ/GEFIN.
When I find myself in times of trouble Quando me encontro em tempos de dificuldades Mother Mary comes to me Virgem Maria chega até mim Speaking words.
Thresholding, Otsu Trabalho 2 - CG.
Definição do MoC Subjacente a Aplicação Prof. Dr. César Augusto Missio Marcon Parcialmente extraído de trabalhos de Axel Jantch, Edward Lee e Alberto Sangiovanni-Vincentelli.
The Present Perfect Tense
Knowledge Extraction from the Web (ISEWO)
Lecture 4 Pressure distribution in fluids. Pressure and pressure gradient. Hydrostatic pressure 1.
Quality Management (J07) Overview BR
Análise Sintática – Parte 1
Introdução à Criptografia Moderna – 2ª Lista de Exercícios
1 Semântica de Ações Ações Básicas, Ações Funcionais e Notação de Dados.
Metodologia de Desenvolvimento de Software Hermano Moura Alexandre Vasconcelos, André Santos, Augusto Sampaio, Hermano Moura, Paulo.
Mensagem da Criança Message of the Child Dizes que sou o futuro. You say I am the future Não me desampares no presente. Do not abandon me in the present.
Brenda Lee I’m sorry.
Boy Meets Girl Waiting for a star to fall I hear your name whispered on the Wind Eu ouço o seu nome sussurrado no vento It’s a sound that makes me.
Aceitacao Acceptance. Aceita a vida que Deus te deu. Accept the life God gave you.
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa Ontology Building Process: The Wine Domain João Graça, Márcio.
Hoje é domingo, 14 de setembro de 2014 Agora mesmo são 22:54 h. Relaxe por uns momentos e aprecie … Com som Today is Monday, 1 st December Relax.
Ciências Cognitivas e Tecnologia Educacional Scaffolding of Self-Regulated Learning in Social Networks Scaffolding do Aprendizado Auto-Regulado em Redes.
Soluções usando Microsoft conteúdo Management Server 2002 Connector for SharePoint Technologies - MVP Exchange Server
Socio-technical approaches for Safety STAMP/STPA
Using innovation models to grow the GLP business Kip Garland innovationSEED October 9 th, 2009.
Equação da Continuidade e Equação de Navier-Stokes
RELATÓRIO CEMEC 06 COMPARAÇÕES INTERNACIONAIS Novembro 2013.
Microprocessadores 8051 – Aula 3 Interrupção
© 2012 Autodesk Autodesk Revit para projetos executivos de arquitetura Módulo 2: Otimizando a modelagem para documentação Tiago Marçal Ricotta Gerente.
Unit l Verb to be.
VOCÊ JÁ FALA INGLÊS FLUENTEMENTE?
Motivação A difícil tarefa de encontrar o conteúdo certo que preciso para as diferentes situações de trabalho…
© 2007 IBM Corporation Academic Initiative 07/05/07 Aula 2 – Parte 1: Java Basics Autores: Argemiro José de Juliano Marcos
Na linha Tradução Rolagem automática On the Line Michael Jackson.
Teste e Qualidade de Software
TQS - Teste e Qualidade de Software (Software Testing and Quality) Geração Automática de Casos de Teste com a Ferramenta.
Introduction to density estimation Modelação EcoLÓGICA
Student #1: Go to the board and write a word.
Transcrição da apresentação:

ReGras Lexical Database Ronaldo Martins

Outline Motivation Warning The Past The Present The Future The Golden List A Checker Dictionary Commitments Final remarks

Motivation ReGra: a proofing tool for BP RLP (Itautec-Philco) Microsoft Office 2000, XP,.Net Three fases : Local rules : Parsing : Modularization Goal to emulate the behavior of a human reviser (i.e., to diagnose illegal words and constructions, to identify the source of problems, to propose acceptable alternatives and to convince the user)

Warning ReGra does not really carry out any morphological analysis but rather processes word retrieval strategies along with tokenization routines.

The Past Goal: spell, grammar and style checking Choices full words vs. analyzed forms single words vs. complex words categorization part-of-speech morphological information frequence order assignment automatic generation human checking

The Present A= Capitania= da= Bahia= com= 50= léguas= de= comprimento=,=

The Future

PALAVRA CLASSIFICAÇÃO tem GRUPO_-N+VGRUPO_-N-V FORMAÇÃO MORFOLÓGICA ESTRUTURA MORFOLÓGICA REGÊNCIA ESTRUTURA ARGUMENTAL é regida por tem argumentos é formada por apresenta Item lexical CONJUNÇÃO VERBO PRONOME SUB/ADJ Codigo Canonica Grupo Codigo RegenciaLista_Prep Prioridade Codigo CompSpec Prioridade Pessoa Caso Estrutura Componentes Atributos Produtividade Posição Número Gênero Classe Tipo GRUPO_+N Grau Prioridade Tonicidade T_Ref T_Ev Pessoa Modo Tipo Prioridade Papel Classe Tipo Colocação Complemento S/P S/T (1..N) (1..1) (0..N) (1..1) (0..N) (1..1) D/P

The Golden List Relative lack of convergence on the theoretical background

The Golden List What should stand for a lemma? dimunitives (caminha) -> positives (cama)? augmentatives (abelhão) -> positives (abelha)? superlative (chiquérrimo) -> positive (chique)? derived (mecanicidade) -> original (mecânico)? ordinal (nono) -> cardinal (nove)? abbreviations (níver) -> original (aniversário)? etc. synchronic vs. diachronic criteria morphological vs. semantic criteria ReGra: synchronic + morphological (to deliver alternatives)

The Golden List What should stand for an entry? apesar de vs. apesar and de clitics (referiam-se, reunir-se-iam) não-violento vs. não- and violento melhores vs. melhor and -es desumanamente vs. desumano and - mente ReGra: string of ANSI characters isolated by blank spaces

The Golden List What should stand for dictionary features? Phonetics Morphology Syntax Semantics Pragmatics ReGra: problem-based category assignment

A checker dictionary commitments Phonetics atone vs. tonic (for hyphenization checking) Ele feriu se (instead of Ele feriu-se) phonetic changes (for alternatives) >> spelling errors phonetic transcription: caza (casa), mininu (menino) phoneme addition: avoar (voar), adevogado (advogado), favore (favor) phoneme subtraction: tá (está), pra (para), cantá (cantar) phoneme reordering: tauba (tábua), estrupo (estupro) phoneme exchange: tó/ch/ico (tó/ks/ico), ine/ks/orável (ine/z/orável), ab/r/upto (ab/x/upto) accent changes: rubrica (rubrica), cateter (cateter)

A checker dictionary commitments Morphology Part-of-speech *Ela chegou rápida *Há muita pouca gente Structure *Interviu *Adequa *Pãozinhos Number *as felicidades *a cócora

A checker dictionary commitments Morphology Gender *Cerveja é boa Person *Se você não se cuidar, a AIDS vai te pegar. Tense *Eu queria que ela saísse. Mood *Ele espera que eu saio mais cedo. Aspect *Ele estava querendo sair.

A checker dictionary commitments Syntax Transitivy *Ele custou a sair. Positioning *Farei-o amanhã. Agreement *Nem um nem outro irão à festa. Government *Ele pagou o médico.

A checker dictionary commitments Semantics Lexical choice *A mala está leviana. *O médico infligiu a lei. *O sangue fruía na calçada. Semantic anomaly *Quadrados triangulares Contradiction *Minhas idéias vão de encontro às suas: não há motivo para brigas.

A checker dictionary commitments Pragmatics Taboo words Foreign words Archaisms and neologisms Colóquios flácidos para acalentar bovinos. otimizar, maximizar, inicializar Clichés correr atrás do prejuízo a nível de

Final remarks As far as word formation licensing is rather historical and social, it is not possible to devise general procedures for morphological analysis capable of generating only authorized words. casamento, but *casação transação, but *transamento Is it possible (and worthwhile) to contrast error-driven lexical databases with general-purpose ones? If so, how to compare two differently-oriented lexical databases in a productive way?