Introdução a técnicas computacionais para PLN

Slides:



Advertisements
Apresentações semelhantes
NILC - Brasil Avaliação de Corretores Gramaticais Quanto aos Critérios Gerais de Avaliação: (1) Adequação (adequacy evaluation): considera-se o contexto.
Advertisements

Normalização
LOT-SIZE PROBLEM   PROBLEMA DE DIMENSIONAMENTO DE LOTES COM VÁRIOS CENTROS DE PRODUÇÃO. Sheila Souza Lino.
Avaliação de Resultados das Políticas de Saúde e Educação: Estado e Municípios de Mato Grosso.
Deyvisson, Rafael M.P., Renato, Robson C.F., Rodolfo
Daisy Pail. Analisar as árvores do bosque na versão extented Individualizar os nodos função:forma Propor nodos que proporcionem maior uniformidade de.
Carlos Augusto Prolo, Dr. (U. of Pennsylvania) ...
Estatística Descritiva Aula 01
Aquisição da Propriedade pela Acessão
Teoria da Computação BCC 244
Gramáticas de Cláusulas Definidas
Projetos de Programação em Lógica
Gramáticas Estocásticas Livre de Contexto Anderson Faustino da Silva.
De volta à sintaxe de Matias Aires
Educação, Comunicação e Internet
A partir deste trabalho, pudemos adquirir conhecimento no que diz respeito a este tema. Pudemos, também, perceber que: O número e da duração das aulas.
E.B 1 de Fornos de Algodres
Estratégias de leitura da língua espanhola
Técnicas de Instrumentação
Trabalho de Educação Física
PROTOCOLOS ARP E RARP Gabriela Pissurno
Nome: Bettina Antolini
Aprendizado de Máquina Aula 8
EHD907 Técnicas de Tomada de Decisão Apresentação da Disciplina Prof. Benedito C. Silva.
TRADUÇÃO mercado de trabalho
Extração da Informação
Extração da Informação
Aula prática - análise contextual
Medida, Probabilidades, etc VIII -1; Completação de espaços de medida.
FEE - Centro de Informações Estatísticas Porto Alegre, 07 de Outubro de 2010 Destaques do Idese 2007
Estatísticas do TIL 2008 Vila Velha/ES, 27 e 28 de Outubro Ariadne M. B. R. Carvalho Maria das Graças V. Nunes Thiago A. S. Pardo.
Professor: Juliano Lucas Gonçalves
Regras de Derivação: Produto e quociente
Gramáticas Livres de Contexto
Curso de Estatística Aplicada
A Pesquisa Bibliográfica na pesquisa Científica.
A crase é o fenômeno. O sinal chama-se acento grave.
SableCC José Francisco Pereira Equipe de Monitores
Análise léxica e sintática
Clipagem Junho. NOME DO VEÍCULO: Jornal do Comércio EDITORIA: Contabilidade DATA: 01/06/2011 ABRANGÊNCIA/TIRAGEM: Regional.
Clipagem Julho / Agosto. NOME DO VEÍCULO: Revista Acontece EDITORIA: Notícias Data: Jul Ago 2011 ABRANGÊNCIA: Regional - Canoas.
JOÃO CHAPOUTO 11º12 Nº8 Arquitetura de Informação Agrupamento de Escolas João de Deus Curso Profissional de Multimédia.
INTRODUÇÃO.
PERIGO: DOENÇAS TRANSMITIDAS PELA SALIVA
Brincadeiras de ontem e hoje
Analisador Léxico Prof. Alexandre Monteiro
Centro Educacional Pioneiro
Universidade Federal do Tocantins Alunos: Izabella Braga, Sara Abreu, Lara Milhomem Disciplina: Informática Básica Assunto: Programação Professor: Paulo.
Proposta para Implementação do Núcleo de Atendimento às Pessoas com Necessidades Especiais NAPNE Campus Rio Grande Prof. Osvaldo C. Pinto Direção Geral.
Processamento de Linguagem Natural
Compiladores.
Equipe: Osias Carneiro, Anderson Soares, André Araújo
DESAFIO Distinguir os sintagmas preposicionados (PP= Prepositional Phrases) que são complementos de verbos dos que são adjuntos. Ele trabalha em publicidade.
Prof. Carlos Alberto Kamienski – Avaliação de Desempenho de Redes e Sistemas (INF-103) Santo André, Fevereiro de 2012 Projeto da Disciplina.
SBBD 2006 Extração de dados e metadados em textos semi-estruturados usando HMMs Universidade Federal do Amazonas Departamento de Ciência da Computação.
Avaliação de Impactos Ambientais
Professor: André Moraes NOME: Felipe Pereira Curso: Analise e desenvolvimento de sistemas Disciplina: Sistemas de Informação Faculdade de Tecnologia do.
ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO Departamento de Engenharia de Computação e Sistemas Digitais Implementação de buscas utilizando Linguagem.
Correferências Pronominais na 3ª Pessoa do Singular INF2915 Prof.: Ruy Milidiu.
Oficina de Física Um convite para reflexão.... Meus erros preferidos Gabriel Perissé As crianças erram. Porque são humanas. Mais humanas do que nós, adultos.
Clipagem Janeiro e Fevereiro. NOME DO VEÍCULO: Jornal VS EDITORIA: Negócios DATA: 24/02/2011 TIRAGEM: exemplares (dados de dez/2010)
Geração automática de tesaurus e recuperação de informação Pablo Gamallo GLINt (Gupo de Lingua Natural) FCT, UNL.
Avaliações Conjuntas : Visão Geral Alexsandro Santos Soares Projecto Processamento Computacional do Português SINTEF Telecom and Informatics.
Milhafre: relações. H:prep (de)‏ H:n (geleiras) MV:v-fin (indicará) >N:art (O) PN:art: (as)‏ H:prep (de)‏
Sumário 1 SQL Embutida 2 Processamento de Consultas
Classificação Probabilística com TBL Cícero Nogueira dos Santos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática.
Resolução de Anáforas Pronominais Apresentação da Proposta de Projeto Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática INF.
A palavra crase é de origem grega. Significa “mistura”, “fusão”
Extração da Informação Cirdes Borges, Flávio Dantas, Rafael Barbosa, Samuel Arcoverde, Tiago Rocha Modificado por Flávia Barros.
O = SN + SV + SP + SP Geração de frases.
Transcrição da apresentação:

Introdução a técnicas computacionais para PLN Ênfase em processamento baseado em corpus

Técnicas de PLN “Handcrafted”, baseada em regras manuais Exemplo: Algoritmo de Hobbs para resolução de pronomes Estatística, corpus-based Exemplo: PCFG: Probabilistic Context-Free grammar

Corpus anotado Ivo viu a uva (S (NP (PN Ivo) ) (VP (V viu) (NP (DET a) (NN uva) ) ) ) Comi uma maçã de manhã (S (NP –vazio-) (VP (VP (V comi) (NP (DET uma) (NN maça) ) ) (PP (PREP de) (NN manhã) ) ) )

Extração de regras da gramática #### REGRAS ###### LÉXICO #### (S (NP (PN Ivo) ) S  NP VP PN  Ivo (VP (V viu) NP  PN V  viu (NP (DET a) VP  V NP DET  a (NN uva) ) ) ) NP  DET NN NN  uva (S (NP –vazio-) S  NP VP V  comi (VP (VP (V comi) NP  -vazio- DET  uma (NP (DET uma) VP  VP PP NN  maça (NN maça) ) ) VP  V NP PREP  de (PP (PREP de) NP  DET NN NN  manhã (NP (NN manhã) ) ) ) ) PP  PREP NP NP  NN

Probabilidades de expansão do NP NP  PN : 1  Prob (NP PN) = 0.2 NP  DET NN: 2  0.4 NP  -vazio- : 1  0.2 NP  NN: 1  0.2 TOTAL: 5 (S (NP (PN Ivo) ) S  NP VP PN  Ivo (VP (V viu) NP  PN V  viu (NP (DET a) VP  V NP DET  a (NN uva) ) ) ) NP  DET NN NN  uva (S (NP –vazio-) S  NP VP V  comi (VP (VP (V comi) NP  -vazio- DET  uma (NP (DET uma) VP  VP PP NN  maça (NN maça) ) ) VP  V NP PREP  de (PP (PREP de) NP  DET NN NN  manhã (NP (NN manhã) ) ) ) ) PP  PREP NP NP  NN

CFG (não probabilística) From Jurafsky & Martin 2000

CFG From Jurafsky & Martin 2000

PCFG From Jurafsky & Martin 2000

Derivações da PCFG para uma sentença From Jurafsky & Martin 2000

Exemplos de corpus anotado Penn Treebank http://www.cis.upenn.edu/~treebank/ Penn PropBank Floresta Sintática (Linguateca) http://www.linguateca.pt/Floresta/milhafre/ Sites: http://ldc.upenn.edu/ http://www.elra.info/ http://www.linguateca.pt/

Caso 2: Resolução de pronomes usando algoritmo (naive) de Jerry Hobs (entre outros) Veja artigo sobre resolução de pronomes em: http://revistaseletronicas.pucrs.br/ojs/index.php/fale/article/view/598