A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Processamento da Linguagem Natural

Apresentações semelhantes


Apresentação em tema: "Processamento da Linguagem Natural"— Transcrição da apresentação:

1 Processamento da Linguagem Natural
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes Processamento da Linguagem Natural

2 Apresentação Processamento da Linguagem Natural Sistemas Multi Agentes
Processamento Baseado em Corpus Etiquetação Conclusões Sistemas Multi Agentes Arquitetura de Etiquetadores Multi-Agentes Referências Palestra sobre PLN abordagem PBC aplicação etiquetador Usando técnicas de MAS apresentar nosso trabalho

3 Processamento da Linguagem Natural
Ramo da I.A. Objetivos interpretar e processar o conhecimento disponível compreensão geração melhorar a comunicação Homem X Máquina interdisciplinar computação lingüística ciências cognitivas Aquisição de conhecimento da linguagem

4 Processamento da Linguagem Natural
Aplicações tradução automática correção de textos geração de resumos sistemas inteligentes interface consultas bibliográficas consultas tipo SQL em BD síntese / análise de voz

5 Processamento da Linguagem Natural
língua X linguagem processamento interpretação texto representação geração representação texto Língua hábitos cultura gestos conhecimentos crenças linguagem representação simbólica geração/produção

6 Processamento da Linguagem Natural
natural artificial geral - restrita complexa - limitada contextual - específica ambígua - não ambígua português - fortran inglês - pascal francês - C espanhol - java Artificial/formal

7 Fenômenos lingüísticos
Elipse Não ganhei na loto. Zeugma Comprei uma caixa de maças e outra de ameixas. Metáfora Um mar de problemas. Metonímia Gosto de ler Érico Veríssimo. Anáfora João gosta de Maria. Ela gosta de José. Ambigüidade casa - substantivo ou verbo manga - fruta ou peça do vestuário Se você quer comprar um carro rápido. Léxica-categorial casa - substantivo/verbo léxica-semântica fazenda - tecido/estância sintática

8 Domínios do PLN Léxico-morfológico Sintático Semântico-pragmático
Domínios X níveis

9 Domínio Léxico-morfológico
Analisador léxico-morfológico léxico (dicionário) categorias gramaticais substantivo adjetivo verbo adverbio numeral artigo pronome preposição ambigüidade léxica-morfológica casa, mato, morro Palavras Quando iniciar a guerra eu mato ou morro.

10 Domínio Sintático Relações entre palavras da sentença gramaticalidade
Unidades sintáticas (sintágmas) sujeito predicado complemento verbal / nominal concordância regência posicionamento Gramática é uma especificação finita de um conjunto de sentenças formadas por palavras de um vocabulário de uma linguagem.

11 Domínio Sintático léxico gramática parser texto
estrutura da sentença gramática parser todas sentença texto léxico-morf. Eu vi a moça com o binóculos. Árvore de derivações

12 Domínio Semântico-pragmático
Representação do significado e sentido. Semântica léxica gramatical Um assador de churrasco gaúcho fenômenos de referência anáfora pronominal Ela gosta do Zé. elipse sarcasmo

13 Geração de textos texto formalismos representação representação texto
templates Eliza[MIT60]

14 Fala Fonética Fonologia Prosódia sarcasmo agressividade excitação amor
volume entonação tempo (velocidade e ritmo) sarcasmo agressividade excitação Reconhecimento/produção Fonética - estudo dos sons, voz, indep da linguagem. Fonologia - inter-relaciona os padrões sonoros com a ling. Allen p612 amor simpatia

15 fala fala proc. sinal sintet. voz caracteres f. i. class. acústica
fonética intonação reconhecimento Allen arquitetura de sistema compreensão de fala palavras palavras Sistema PLN ALLEN

16 Processamento baseado em Corpus
Corpus - coleção de textos escritos ou orais representativos da linguagem computacionalmente disponíveis o plural - corpora estudo do conhecimento lingüístico através de exemplos vantagens acessibilidade velocidade exatidão / fidelidade

17 Processamento baseado em Corpus
treino e teste de sistemas de PLN corpus simples marcados / anotados / rotulados / etiquetados ? Utilização

18 PLN - conclusões Ainda é um problema sem solução
relacionamento entre os domínios interdisciplinar IA lingüística ciências cognitivas pesquisa soluções domínios restritos aplicações reconhecimento de voz, geração de texto formalismos para representação Devido as caracte. Geral complexo contextual ambígua

19 Domínios do PLN Léxico-morfológico Sintático Semântico-pragmático
Domínios X níveis

20 PLN - conclusões Arquiteturas módulos hierárquicos independentes
seqüenciais explosão combinatória Distribuição (IAD) SMA interdependentes

21 PLN - conclusões Trabalhos na área
Ambigüidade léxica categorial [Silva97] Anáfora do pronome possessivo [Paraboni97] Léxico semântico [Abrahão97] Tradução automática [Agustini] Elipse [Unicamp] SBIA - PROPOR -

22 Etiquetação Sentença marcada sentença ETIQUETADOR Quem/pronome indef.
casa/verbo intransitivo ,/vírgula quer/verbo trans. direto casa/substantivo comum ./ponto final Quem casa, quer casa. Modelo de markov etiq / rotulação/ marcação/ tagging

23 Etiquetador estatístico - padrões corpora
baseado em regras - lingüísticas misto - regras obtidas processo estatístico [BRILL93]

24 Etiquetador Estatístico (fases)
- treinamento - aprende (corpus marcado) - teste - marcação (corpus conhecido) avalidação (medida de precisão) - marcação - marca sentenças - HMM - forma de modelar

25 Rotulador Estatístico de Categorias Morfo-Sintáticas
para a Língua Portuguesa Classes de ambiguidade e rótulos Corpus de treinamento Construtor do HMM classificador treinamento dicionário HMM teste Corpus de teste Classes de ambiguidade classificador Viterbi Rótulos Class - atribui classe de ambi. Const - gera HMM n-gramas e freq relativa Viterbi - descobre a seq de rótulos + provável. Corpus Radiobras

26 Sistemas Multi-Agentes
Sociedade - coleção de entidades - coordenação Agentes - entidades atuam na sociedade - autonomia - cooperação - aprendizagem - objetivos - conhecimentos MAS sub-área da IA coordenação comportamento inteligente soc de agentes atributos autonomia - sem interferencia humana aprendizagem - incorpora novos conhecimentos agentes e ambiente cooperação multipos agentes objetivo comum.

27 Sistemas Multi-Agentes
agentes + ambiente + interações + organização [DEMA95] interações - protocolos apresentação troca de conhecimentos negociação Agentes ativas entidades ambiente passiva interações comunicação troca de mensagens protocolos negociação organização restrições aplicadas aso agentes para atingir os objetivos da soc.

28 Agente Genérico Modelo de agente [DEMA90] Escolha Conhecimento
Comunicação Capacidades de raciocínio Possibilidades Capacidades de Decisão Percepção Objetivos Modelo de agente [DEMA90]

29 ARQUITETURA DO SISTEMA
Problema - conhecimento lingüístico - conhecimento distribuído - processos distribuídos - genérico - específico

30 precisão corpus de treinamento muito grande
fase de treinamento (tempo) corpus único perde dependência ao domínio motiva múltiplos corpora MAS

31 Fase de treinamento . . . corpus T1 corpus T2 corpus T3 corpus Tn
Agente T1 Agente T2 Agente T3 Agente Tn HMM T1 HMM T2 HMM T3 HMM Tn Agente Genérico HMM Genérico

32 Fase de Marcação . . . ou ou sentenças Agente Genérico sentenças
semi-marcadas ou ou Agente T1 Agente T2 Agente Tn . . . sentenças marcadas sentenças marcadas sentenças marcadas

33 Modelo do Agente Conhecimento - HMM (treinamento)
Objetivos - aquisição de conhecimento - marcação Comunicação - corpus treinamento / sentenças - interação social (prot. KQML) Raciocínio social - negociação Ações - marcação - atualização conhecimentos - comunicação entre agentes

34 Cooperação entre os Agentes
INTERAÇÕES Apresentação Despedida Requisição ao agente genérico Requisição a outro agente específico Negociação

35 Protótipo em desenvolvimento
Conhecimento modelo bigramas (HMM) DPSK+P ambiente (MASENV) KQML NALAMAS Etiquetador - UNL Bigrama n-grama (n-1) precedente

36 Hidden Markov Model HMM tuplas <S, s1, W, T> onde:
S conjunto de estados s1 estado inicial W conjunto símbolos T as transições

37 Hidden Markov Model HMM tuplas <S, s1, W, T> onde:
S conjunto de estados rótulos s1 estado inicial W conjunto símbolos palavras T as transições palavras

38 Hidden Markov Models P(a) = 0,3 P(a) = 0,4 P(a) = 0,2 P(b) = 0,1 1 2
HMM generalização da cadeia de markov com mais de uma tansição com o mesmo símbolo partindo do mesmo estado. P(b) = 0,1

39 Referências de PLN [ALLE94] ALLEN, J. Natural language understanding. The Benjamin/Cumming Company [BEAR91] BEARDON, C; LUMSDEN, D.; HOLMES, G. Natural Language and Computational Linguistics. Ellis Horwood Ltd. Melsham-Wiltshire, England, 1991. [CHARN93] CHARNIAK. E. Statistical language learning. London: Abradford Book.The MIT Press p. [DE LIMA96] DE LIMA, V.L.S. - Processamento da Linguagem Natural - premissas e desafios -IV Escola Regional de Informática - SBC. 1996 [DE LIMA97] DE LIMA, V.L.S. - Projeto NALAMAS - Atividades setembro 1996/ agosto PUCRS - Relatório Técnico -1997

40 Ricardo Annes annes@pucrs.campus2.br PONTIFÍCIA UNIVERSIDADE CATÓLICA
DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes


Carregar ppt "Processamento da Linguagem Natural"

Apresentações semelhantes


Anúncios Google