A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Processamento da Linguagem Natural PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes.

Apresentações semelhantes


Apresentação em tema: "Processamento da Linguagem Natural PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes."— Transcrição da apresentação:

1 Processamento da Linguagem Natural PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes

2 2 Apresentação Processamento da Linguagem Natural –Processamento Baseado em Corpus –Etiquetação –Conclusões Sistemas Multi Agentes Arquitetura de Etiquetadores Multi-Agentes Referências

3 3 Processamento da Linguagem Natural Ramo da I.A. Objetivos –interpretar e processar o conhecimento disponível compreensão geração –melhorar a comunicação Homem X Máquina interdisciplinar –computação –lingüística –ciências cognitivas

4 4 Processamento da Linguagem Natural Aplicações –tradução automática –correção de textos –geração de resumos –sistemas inteligentes –interface –consultas bibliográficas –consultas tipo SQL em BD –síntese / análise de voz

5 5 Processamento da Linguagem Natural língua X linguagem processamento –interpretação textorepresentação –geração representaçãotexto

6 6 Processamento da Linguagem Natural Linguagem naturalartificial –geral- restrita –complexa- limitada –contextual- específica –ambígua- não ambígua –português- fortran –inglês- pascal –francês- C –espanhol- java

7 7 Fenômenos lingüísticos Elipse Não ganhei na loto. Zeugma Comprei uma caixa de maças e outra de ameixas. Metáfora Um mar de problemas. Metonímia Gosto de ler Érico Veríssimo. Anáfora João gosta de Maria. Ela gosta de José. Ambigüidade casa - substantivo ou verbo manga - fruta ou peça do vestuário Se você quer comprar um carro rápido.

8 8 Domínios do PLN Léxico-morfológico Sintático Semântico-pragmático

9 9 Domínio Léxico-morfológico Analisador léxico-morfológico léxico (dicionário) categorias gramaticais –substantivoadjetivo –verboadverbio –numeralartigo –pronomepreposição ambigüidade léxica-morfológica – casa, mato, morro

10 10 Relações entre palavras da sentença gramaticalidade Unidades sintáticas (sintágmas) –sujeito –predicado –complemento verbal / nominal concordância regência posicionamento Domínio Sintático

11 11 Domínio Sintático texto estrutura da sentença gramática léxico todas sentença léxico-morf. parser Eu vi a moça com o binóculos. Árvore de derivações

12 12 Representação do significado e sentido. Semântica –léxica –gramatical Um assador de churrasco gaúcho fenômenos de referência –anáfora pronominal Ela gosta do Zé. –elipse sarcasmo Domínio Semântico-pragmático

13 13 texto formalismos representação representaçãotexto templates Eliza[MIT60] Geração de textos

14 14 Fonética Fonologia Prosódia –volume –entonação –tempo (velocidade e ritmo) sarcasmo agressividade excitação Fala amor simpatia

15 palavras proc. sinal reconhecimento fala class. acústica Sistema PLN fonética intonação palavras caracteres f. i. sintet. voz fala ALLEN

16 Processamento baseado em Corpus Corpus - coleção de textos –escritos ou orais –representativos da linguagem –computacionalmente disponíveis –o plural - corpora estudo do conhecimento lingüístico através de exemplos vantagens –acessibilidade –velocidade –exatidão / fidelidade

17 Processamento baseado em Corpus treino e teste de sistemas de PLN corpus –simples –marcados / anotados / rotulados / etiquetados

18 18 PLN - conclusões Ainda é um problema sem solução –relacionamento entre os domínios –interdisciplinar IA lingüística ciências cognitivas –pesquisa soluções domínios restritos aplicações –reconhecimento de voz, geração de texto –formalismos para representação

19 19 Domínios do PLN Léxico-morfológico Sintático Semântico-pragmático

20 20 PLN - conclusões Arquiteturas módulos hierárquicos independentes –seqüenciais –explosão combinatória Distribuição (IAD)SMA interdependentes

21 21 PLN - conclusões Trabalhos na área –Ambigüidade léxica categorial [Silva97] –Anáfora do pronome possessivo [Paraboni97] –Léxico semântico [Abrahão97] –Tradução automática [Agustini] –Elipse [Unicamp] –www.portugues.mct.pt/recursos.html –SBIA - –PROPOR -

22 Etiquetação ETIQUETADOR sentença Sentença marcada Quem casa, quer casa. Quem/pronome indef. casa/verbo intransitivo,/vírgula quer/verbo trans. direto casa/substantivo comum./ponto final

23 Etiquetador estatístico - padrões corpora baseado em regras - lingüísticas misto - regras obtidas processo estatístico [BRILL93]

24 Etiquetador Estatístico (fases) - treinamento - aprende (corpus marcado) - teste - marcação (corpus conhecido) avalidação (medida de precisão) - marcação - marca sentenças - HMM - forma de modelar

25 Corpus de treinamento classificador Classes de ambiguidade e rótulos Construtor do HMM Corpus de teste classificador Classes de ambiguidade Viterbi Rótulos dicionárioHMM treinamento teste Rotulador Estatístico de Categorias Morfo-Sintáticas para a Língua Portuguesa

26 Sistemas Multi-Agentes Sociedade - coleção de entidades - coordenação Agentes - entidades atuam na sociedade - autonomia - cooperação - aprendizagem - objetivos - conhecimentos

27 Sistemas Multi-Agentes agentes + ambiente + interações + organização [DEMA95] interações - protocolos apresentação troca de conhecimentos negociação

28 Agente Genérico Conhecimento Escolha Comunicação Capacidades de Decisão Possibilidades Capacidades de raciocínio Percepção Objetivos Modelo de agente [DEMA90]

29 ARQUITETURA DO SISTEMA Problema - conhecimento lingüístico - conhecimento distribuído - processos distribuídos - genérico - específico

30 precisão corpus de treinamento muito grande fase de treinamento (tempo) corpus único perde dependência ao domínio motivamúltiplos corpora MAS

31 Fase de treinamento corpus T1 HMM T1 Agente T1 corpus T3 HMM Genérico Agente Genérico... corpus T2 corpus Tn HMM T2 Agente T2 HMM T3 Agente T3 HMM Tn Agente Tn

32 Fase de Marcação sentença s Agente Genérico sentenças semi-marcadas Agente T1 ou sentenças marcadas... Agente T2 Agente Tn sentenças marcadas sentenças marcadas

33 Modelo do Agente Conhecimento - HMM (treinamento) Objetivos - aquisição de conhecimento - marcação Comunicação - corpus treinamento / sentenças - interação social (prot. KQML) Raciocínio social - negociação Ações - marcação - atualização conhecimentos - c omunicação entre agentes

34 Cooperação entre os Agentes INTERAÇÕES –Apresentação –Despedida –Requisição ao agente genérico –Requisição a outro agente específico –Negociação

35 Protótipo em desenvolvimento Conhecimento modelo bigramas (HMM) DPSK+P ambiente (MASENV) KQML NALAMAS Etiquetador - UNL

36 Hidden Markov Model HMM tuplas onde: S conjunto de estados s1 estado inicial W conjunto símbolos T as transições

37 Hidden Markov Model HMM tuplas onde: S conjunto de estadosrótulos s1 estado inicial W conjunto símbolospalavras T as transiçõespalavras

38 Hidden Markov Models 1 2 P(a) = 0,3 P(b) = 0,1 P(a) = 0,2 P(b) = 0,2 P(b) = 0,5 P(a) = 0,4 P(a) = 0,2

39 Referências de PLN [ALLE94] ALLEN, J. Natural language understanding. The Benjamin/Cumming Company [BEAR91] BEARDON, C; LUMSDEN, D.; HOLMES, G. Natural Language and Computational Linguistics. Ellis Horwood Ltd. Melsham-Wiltshire, England, [CHARN93] CHARNIAK. E. Statistical language learning. London: Abradford Book.The MIT Press p. [DE LIMA96] DE LIMA, V.L.S. - Processamento da Linguagem Natural - premissas e desafios -IV Escola Regional de Informática - SBC [DE LIMA97] DE LIMA, V.L.S. - Projeto NALAMAS - Atividades setembro 1996/ agosto PUCRS - Relatório Técnico -1997

40 PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes


Carregar ppt "Processamento da Linguagem Natural PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL - PUCRS Faculdade de Informática Ricardo Annes."

Apresentações semelhantes


Anúncios Google