A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN Stéphane Rodrigues Dias Stéphane Rodrigues Dias PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS.

Apresentações semelhantes


Apresentação em tema: "A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN Stéphane Rodrigues Dias Stéphane Rodrigues Dias PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS."— Transcrição da apresentação:

1 A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN Stéphane Rodrigues Dias Stéphane Rodrigues Dias PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS

2 O Modelo de Pesquisa Abordagem por interfaces: Metateoria das Interfaces (COSTA, 2007) Linguagem: objeto complexo – Linguística/Ciências formais Interfaces externas: Linguística/Ciência da Computação Interfaces internas: Sintaxe /Processamento Automático de Línguas Naturais (PLN) e/ou Linguística Computacional (LC) Objeto: conceito de gramática

3 Objetivo geral Tendo em vista a diversidade de conceitos, de terminologia e de representações subjacentes a diferentes teorias gramaticais de base linguística e computacional, este artigo objetiva explicitar os fundamentos epistemológicos de gramática subjacentes às propostas de Gramática Categorial (TAG) e de Dependências (Gramática de Valências) na relação com a formalização para PLN, observando: (i) diferenças e semelhanças em termos de interfaces internas (morfologia/sintaxe, sintaxe/semântica; (ii) a relação gramática/léxico (abordagem (bi)lexical, categorial) e (iii) a explicitude dessas escolhas na interface amigável teoria lingüística/ aplicação computacional, parte do compromisso teórico dos pesquisadores para uma interface clara e relevante para ambas as áreas). Tendo em vista a diversidade de conceitos, de terminologia e de representações subjacentes a diferentes teorias gramaticais de base linguística e computacional, este artigo objetiva explicitar os fundamentos epistemológicos de gramática subjacentes às propostas de Gramática Categorial (TAG) e de Dependências (Gramática de Valências) na relação com a formalização para PLN, observando: (i) diferenças e semelhanças em termos de interfaces internas (morfologia/sintaxe, sintaxe/semântica; (ii) a relação gramática/léxico (abordagem (bi)lexical, categorial) e (iii) a explicitude dessas escolhas na interface amigável teoria lingüística/ aplicação computacional, parte do compromisso teórico dos pesquisadores para uma interface clara e relevante para ambas as áreas).

4 Interface Linguística/Ciência da Computação Linguística computacional como sinônimo de PLN LC como matriz e PLN como interface LC como subárea da Inteligência Artificial (IA) – interface homem/máquina via linguagem natural LC como subárea da Linguística Aplicada LC como interseção entre Linguística e Ciências da Computação (DIAS-DA- SILVA, 2006) Processamento computacional de língua natural, tanto no modo escrito quanto oral, registrada em meio escrito (DIAS-DA-SILVA, 2009) Abordagem linguisticamente motivada: especificação explícita de propriedades e de regras ou padrões regulares de comportamento linguístico (idem). Processamento automático das línguas naturais > automatic natural language processing, Inteligência Artificial e das Ciências da Computação. Natural language processing (PLN e o estudo do processamento da linguagem humana, no âmbito da Ciência Cognitiva (Garret, 1990).

5 Tomando por base o fato de os falantes processarem as estruturas lingüísticas instantaneamente e os resultados obtidos com a implementação computacional da Teoria Padrão (Chomsky, 1965), Gazdar (1982) mostra que as gramáticas gerativas, com seu grande número de dispositivos formais, são completamente inadequadas para servir de modelo de processamento das estruturas lingüísticas pelos falantes. A partir dessa análise, constrói um novo modelo de gramática, sem as clássicas transformações e o denomina Gramática Sintagmática Generalizada, origem da gramática Head-driven Phrase Structure Grammar, mais conhecida pela sigla HPSG (Pollard & Sag, 1994). Esses dois exemplos evidenciam que a argumentação de base computacional pode trazer novos recursos para se repensar as teorias lingüísticas (DIAS-DA- SILVA, 2009). Tomando por base o fato de os falantes processarem as estruturas lingüísticas instantaneamente e os resultados obtidos com a implementação computacional da Teoria Padrão (Chomsky, 1965), Gazdar (1982) mostra que as gramáticas gerativas, com seu grande número de dispositivos formais, são completamente inadequadas para servir de modelo de processamento das estruturas lingüísticas pelos falantes. A partir dessa análise, constrói um novo modelo de gramática, sem as clássicas transformações e o denomina Gramática Sintagmática Generalizada, origem da gramática Head-driven Phrase Structure Grammar, mais conhecida pela sigla HPSG (Pollard & Sag, 1994). Esses dois exemplos evidenciam que a argumentação de base computacional pode trazer novos recursos para se repensar as teorias lingüísticas (DIAS-DA- SILVA, 2009).

6 Formalismo na interface A representação de uma ontologia pode variar segundo o grau de formalização. Uma ontologia formal, em especial, apresenta os conceitos e as relações (entre conceitos) explicitamente definidas, ou seja, legíveis pela máquina (GRUBER, 1995). A representação de uma ontologia pode variar segundo o grau de formalização. Uma ontologia formal, em especial, apresenta os conceitos e as relações (entre conceitos) explicitamente definidas, ou seja, legíveis pela máquina (GRUBER, 1995). Gramáticas: sistemas formais que, (i) descrevem as estruturas das sentenças de uma dada língua, e (ii) permitem, juntamente com o léxico, reconhecer e gerar sentenças dessa língua (KAPLAN, 2004). Gramáticas: sistemas formais que, (i) descrevem as estruturas das sentenças de uma dada língua, e (ii) permitem, juntamente com o léxico, reconhecer e gerar sentenças dessa língua (KAPLAN, 2004). Numa abordagem segundo a concepção linguisticamente motivada, o computador não poderá emular uma língua natural se não conseguir, em alguma medida, compreender o assunto que está em discussão (DIAS-DA-SILVA, 2009, 188p.)

7 Três fases para o desenvolvimento de sistemas especialistas e para uma metodologia para PLN (DIAS-DA-SILVA, 1999): Três fases para o desenvolvimento de sistemas especialistas e para uma metodologia para PLN (DIAS-DA-SILVA, 1999): Linguística: construção do corpo de conhecimentos sobre a própria linguagem, dissecando e compreendendo os fenômenos linguísticos necessários para o desenvolvimento do sistema. Linguística: construção do corpo de conhecimentos sobre a própria linguagem, dissecando e compreendendo os fenômenos linguísticos necessários para o desenvolvimento do sistema. Linguístico-computacional: construção conceitual do sistema, envolvendo a seleção e/ou proposição de sistemas formais de representação para os resultados propostos pela fase anterior. Linguístico-computacional: construção conceitual do sistema, envolvendo a seleção e/ou proposição de sistemas formais de representação para os resultados propostos pela fase anterior. Implementacional (computacional): codificação das representações elaboradas em termos de linguagens de programação e planejamento global do sistema. Implementacional (computacional): codificação das representações elaboradas em termos de linguagens de programação e planejamento global do sistema.

8 Pires de Oliveira (2009), esclarece sobre o metatermo formal: Pires de Oliveira (2009), esclarece sobre o metatermo formal: O linguista deve construir teorias capazes de formalização metalinguística unívoca. O linguista deve construir teorias capazes de formalização metalinguística unívoca. O linguista pode ser formal no sentido de defender a autonomia da sintaxe (gerativismo (autonomia pura), funcionalismo compatível (sintaxe, semântica – decorrência de funções). O linguista pode ser formal no sentido de defender a autonomia da sintaxe (gerativismo (autonomia pura), funcionalismo compatível (sintaxe, semântica – decorrência de funções). Funcionalismo: raciocínio indutivo, parte dos dados, das manifestações efetivas produzidas por falantes reais, e elabora generalizações que os explicam. Funcionalismo: raciocínio indutivo, parte dos dados, das manifestações efetivas produzidas por falantes reais, e elabora generalizações que os explicam. Gerativismo: raciocínio abdutivo, as regras são elaboradas a partir da intuição do falante sobre um caso particular e devem ser confrontadas com outros casos. Porém, não somente testa uma hipótese, mas reconhece aquilo que não é possível (dado negativo). Gerativismo: raciocínio abdutivo, as regras são elaboradas a partir da intuição do falante sobre um caso particular e devem ser confrontadas com outros casos. Porém, não somente testa uma hipótese, mas reconhece aquilo que não é possível (dado negativo). Como os gerativistas, os gramáticos categoriais abordam a língua natural como um cálculo. Como os gerativistas, os gramáticos categoriais abordam a língua natural como um cálculo.

9 Gramática: Linguística Assim, têm-se o manual de gramática e o dicionário como os inventários descritivos de gramática e léxico, sendo que "o que é geral e regular na língua integra a gramática, e o que é particular e irregular integra o léxico" (p. 71). Entretanto, visto que o léxico tanto faz parte da gramática quanto da semântica e os vocábulos funcionam tanto na zona gramatical quanto não- gramatical, essa divisão muitas vezes acaba tornando-se irreal (PEREIRA DE ANDRADE) Assim, têm-se o manual de gramática e o dicionário como os inventários descritivos de gramática e léxico, sendo que "o que é geral e regular na língua integra a gramática, e o que é particular e irregular integra o léxico" (p. 71). Entretanto, visto que o léxico tanto faz parte da gramática quanto da semântica e os vocábulos funcionam tanto na zona gramatical quanto não- gramatical, essa divisão muitas vezes acaba tornando-se irreal (PEREIRA DE ANDRADE)

10 A análise gramatical grega baseava-se na palavra. Platão fez a classificação de nome e verbo. Aristóteles acrescentou as conjunções à classificação de Platão. Os estóicos acrescentaram o artigo. Dionísio da Trácia descreve oito partes do discurso: substantivo, verbo, particípio, artigo, pronome, preposição, advérbio e conjunção. A sintaxe estava ausente e sua gramática tinha um fim pedagógico. Já Apolônio Díscolo (séc. II a.C.) chegou a fazer um estudo sintático. Na Idade Média, sob influência aristotélica, passa-se a estudar a língua cientificamente, portanto, de forma universal. Suas gramáticas, chamadas especulativas, viam a língua como um meio de analisar a realidade. Assim, privilegiavam o estudo da significação. Após os estudos comparativistas, surge no século XX o estruturalismo: adoção dos princípios behaviorista e empirista, explicação dos atos lingüísticos como resposta a um estímulo e do processo de aquisição da língua como um processo de imitação e memorização, análise lingüística em constituintes imediatos, caráter taxionômico.

11 Chomsky se interessa pelas características universais, as quais são um componente da mente humana. Ele acrescenta a noção de transformação gramatical à análise de estrutura em constituinte. O objeto de estudo da lingüística gerativa é duplo, envolve tanto a faculdade de linguagem, quanto a gramática específica das línguas. Chomsky se interessa pelas características universais, as quais são um componente da mente humana. Ele acrescenta a noção de transformação gramatical à análise de estrutura em constituinte. O objeto de estudo da lingüística gerativa é duplo, envolve tanto a faculdade de linguagem, quanto a gramática específica das línguas. (PEREIRA DE ANDRADE)

12 GRAMÁTICA: INTERFACE Gramática de Valência (Lucien Tesnière) - química Construído em torno do conceito de valência, este modelo perspectiva uma estruturação hierarquizada dos elementos que compõem uma frase, sendo que o núcleo, o elemento central, é o verbo, à volta do qual "gravitam" os seus satélites. Uma frase é pois uma unidade autônoma e independente que possui um verbo. O verbo funciona como um elemento regente e hierarquicamente superior, do qual dependem outras palavras, ou satélites, que são regidas por esse verbo. Neste momento surge o conceito de valência, que é a "capacidade de as palavras estabelecerem, com base no seu significado léxico, determinadas relações com outras palavras" (Vilela, 1999: 34).

13 Quando os elementos estabelecem relações fortes com o seu núcleo designam-se por actantes, ou dependentes da valência. Quando os elementos estabelecem relações fortes com o seu núcleo designam-se por actantes, ou dependentes da valência. Não criam dependências com o núcleo: circunstantes, ou complementos livres. Não criam dependências com o núcleo: circunstantes, ou complementos livres. Complementos que dependem do verbo, que preenchem os lugares vazios previstos pela estrutura semântico-sintáctica do verbo constituem os seus actantes, que podem ser obrigatórios ou facultativos. Os actantes obrigatórios não podem ser suprimidos, ao passo que os actantes facultativos podem ser elididos sem risco de agramaticalidade (noção sintática). Complementos que dependem do verbo, que preenchem os lugares vazios previstos pela estrutura semântico-sintáctica do verbo constituem os seus actantes, que podem ser obrigatórios ou facultativos. Os actantes obrigatórios não podem ser suprimidos, ao passo que os actantes facultativos podem ser elididos sem risco de agramaticalidade (noção sintática). Dependency grammarDependency grammar is a different type of approach in which structure is determined by the relations (such as grammatical relations) between a word (a head) and its dependents, rather than being based in constituent structure. For example, syntactic structure is described in terms of whether a particular noun is the subject or agent of the verb, rather than describing the relations in terms of trees (one version of which is the parse tree) or other structural system. (http://www.worldlingo.com/ma/enwiki/en/Syntax#Categorial_gram mar) relationsgrammatical relationsheadnounsubjectagentverbparse treehttp://www.worldlingo.com/ma/enwiki/en/Syntax#Categorial_gram mar Dependency grammarrelationsgrammatical relationsheadnounsubjectagentverbparse treehttp://www.worldlingo.com/ma/enwiki/en/Syntax#Categorial_gram mar

14 {[Ann], [Betty] and [Chloe]} had supper. He said, "Hello, one, two, three, testing, testing, testing." Não é frase no sentido de uma cadeia de dependência sintático-semântica. Regra especial de coordenação: (4) {[word*]* conjunction [word*]}, where * = 1 or more and […] is a conjunct. Hudson, Word Grammar, English Word Grammar. (HUDSON, 1990). Desafio conceitual

15 That-clauses The problem: that must be the head of its clause (because it is the word selected), but it is optional. How can this simple fact be stated without referring to 'clause' (or CP)? I know (that) you are tired. I know that you are tired. I know you are tired. Solução: relação de representação (o argumento é o verbo, cujo valor pode ser tanto othat, na relação de dependência, quanto o próprio verbo). A questão que se coloca é se a noção de dependência é assumida para ser não somente necessária, mas também suficiente para a análise sintática de estruturas em língua natural.

16 As conexões entre suportes teóricos e sistemas computacionais são indiretas em relação a análises baseadas em dependência, provavelmente mais do que em relação a teorias e parsers baseados em análise de constituintes. Provavelmente, o problema se relaciona com o baixo grau de formalização da gramática de dependências, e essa é parte da razão por optarmos por descrever parsers com representação de dependência, ao invés de parsers com gramática de dependência (NIVRE). Most versions of dependency grammar follow Tesniere in assuming that the nodes of a dependency structure are not linearly ordered in themselves but only in relation to a particular surface realization of this structure. Que visão de linguagem/língua está comprometida? O artigo traz definições conceituais, visão não-normativa da formalização, mas descritiva no sentido de adequada às realizações.

17 Problemas de critérios Syntactic versus semantic heads. Quando há divergência: I believe in the system. Sintático: in como dependente de believe e como head de system. Semântico: é mais natural tratar system como dependente direto de believe e in como dependente de system. I believe in the system. (3)

18 The distinction between projective and non-projective dependency grammar often made in the literature thus refers to the issue of whether this constraint is assumed or not. Broadly speaking, we can say that whereas most practical systems for dependency parsing do assume projectivity, most dependency- based linguistic theories do not. CAPTURAR A REALIDADE DA LÍNGUA. Isso pressupõe assumir uma abordagem mais holista ou atomista dos fenômenos. Se a formalização assumida vai assumir um potencial maior de generalidade ou vai dar conta de um certo número de casos considerados canônicos. More precisely, most theoretical formulations of dependency grammar regard projectivity as the norm but also recognize the need for nonprojective representations of certain linguistic constructions, e.g. long-distance dependencies (Melˇcuk, 1988; Hudson, 1990). It is also often assumed that the constraint of projectivity is too rigid for the description of languages with free or flexible word order. (aspects of representation -2)

19 Benefícios da interface Ter uma representação mais restrita, onde o número de nós é fixado pela sequência de entrada em si, deve permitir métodos conceitualmente mais simples e computacionalmente mais eficientes para análise. Ao mesmo tempo, é claro que uma representação mais restrita é uma representação menos expressiva e que as representações apresentam necessariamente dependência subespecificada com relação a certos aspectos da estrutura sintática.

20 Considerações Há muitas gramáticas ad hoc, porém há uma preocupação com a coerência entre os conceitos de gramática, visando a uma adequação descritiva e de formalização POS tagging/parsing (etiquetagem, análise sintática), em uma interface mais amigável entre teoria linguística e engenharia das línguas naturais. As abordagens trabalham com a noção de gramática como teoria construída. No entanto, explicitam que as formalizações não contemplam a complexidade da criatividade linguística.

21 Referências BORDWELL, David. Narration in the Fiction Film. Madison: University of Wisconsin Press, BORDWELL, David. Narration in the Fiction Film. Madison: University of Wisconsin Press, COSTA, Jorge Campos da. A relevância da pragmática na pragmática da relevância [recurso eletrônico] / Porto Alegre : EDIPUCRS, Disponível em: Acesso em: 02 ago COSTA, Jorge Campos da. A relevância da pragmática na pragmática da relevância [recurso eletrônico] / Porto Alegre : EDIPUCRS, Disponível em: Acesso em: 02 ago ______. The sciences of language: communication, cognition and computation - Inter/Intradisciplinary Relations. In: Inovação e interdisciplinaridade na universidade. Porto Alegre: EDIPUCRS, p FODOR, Jerry A. The Modularity of Mind. 5th ed. The MIT Press, ______. The sciences of language: communication, cognition and computation - Inter/Intradisciplinary Relations. In: Inovação e interdisciplinaridade na universidade. Porto Alegre: EDIPUCRS, p FODOR, Jerry A. The Modularity of Mind. 5th ed. The MIT Press, GRICE, Paul. Logic and Conversation. In: Studies in the Way of Words. Harvard University Press, Cambridge (MA), GRICE, Paul. Logic and Conversation. In: Studies in the Way of Words. Harvard University Press, Cambridge (MA), JOLY, Martine. Introdução à análise da imagem. 2. ed.Campinas: Papirus, JOLY, Martine. Introdução à análise da imagem. 2. ed.Campinas: Papirus, LEVINSON, Steve. Presumptive Meanings: the theory of generalized conversational implicature. MIT Press LEVINSON, Steve. Presumptive Meanings: the theory of generalized conversational implicature. MIT Press LYONS, J. Linguistic semantics: an introduction. Cambridge: Cambridge UP, Disponível em:. Acesso em: 2 jun LYONS, J. Linguistic semantics: an introduction. Cambridge: Cambridge UP, Disponível em:. Acesso em: 2 jun MCLUHAN, M., Understanding Media: the extensions of man. New York: McGraw-Hill, MCLUHAN, M., Understanding Media: the extensions of man. New York: McGraw-Hill, METZ, Christian. A significação no cinema. Tradução de Jean-Claude Bernardet. São Paulo: Perspectiva, METZ, Christian. A significação no cinema. Tradução de Jean-Claude Bernardet. São Paulo: Perspectiva, MÜLLERSCHÖN, Nikolai. The Red Baron (Der Rote Baro). [Filme DVD]. Produção de MÜLLERSCHÖN, Nikolai. The Red Baron (Der Rote Baro). [Filme DVD]. Produção de Nikolai Müllerschön et alli., direção de Nikolai Müllerschön. Alemanha, DVD, 106 min. color. Nikolai Müllerschön et alli., direção de Nikolai Müllerschön. Alemanha, DVD, 106 min. color. SILVEIRA, Jane R. Caetano. A imagem: Interpretação e comunicação. Linguagem em SILVEIRA, Jane R. Caetano. A imagem: Interpretação e comunicação. Linguagem em (Dis)curso, v. 5, n. esp., p , Disponível em: (Dis)curso, v. 5, n. esp., p , Disponível em:. Acesso em:. Acesso em: 05 ago ago _____; FELTES, Heloísa P. de Moraes. Pragmática e cognição: a textualidade pela relevância. 2. ed. Porto Alegre: EDIPUCRS, _____; FELTES, Heloísa P. de Moraes. Pragmática e cognição: a textualidade pela relevância. 2. ed. Porto Alegre: EDIPUCRS, SPERBER, D.; WILSON, D. Relevance: Communication & Cognition. 2nd ed. Cambridge,Mass.: Harvard University Press, SPERBER, D.; WILSON, D. Relevance: Communication & Cognition. 2nd ed. Cambridge,Mass.: Harvard University Press, VIÉGAS-FARIA, Beatriz. Implicaturas em Romeu e Julieta: a teoria de Grice e suas implicações para o estudo da tradução. In: IBAÑOS, Ana T.; SILVEIRA, Jane Rita C. da (Orgs.). Na interface semântica/pragmática – programa de pesquisa em lógica e linguagem natural. Porto Alegre: EDIPUCRS, p VIÉGAS-FARIA, Beatriz. Implicaturas em Romeu e Julieta: a teoria de Grice e suas implicações para o estudo da tradução. In: IBAÑOS, Ana T.; SILVEIRA, Jane Rita C. da (Orgs.). Na interface semântica/pragmática – programa de pesquisa em lógica e linguagem natural. Porto Alegre: EDIPUCRS, p WILSON, Deirdre. New directions for research on pragmatics and modularity. Lingua 115: WILSON, Deirdre. New directions for research on pragmatics and modularity. Lingua 115: Disponível em: Disponível em: . Acesso em: 26 out Philosophy%20handbook.doc>. Acesso em: 26 out XAVIER, Ismail. O discurso cinematográfico: a opacidade e a transparência. 3. ed. São Paulo: Paz e Terra, XAVIER, Ismail. O discurso cinematográfico: a opacidade e a transparência. 3. ed. São Paulo: Paz e Terra, 2005.

22 (Publicações eletrônicas – Revista Graduação)


Carregar ppt "A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN Stéphane Rodrigues Dias Stéphane Rodrigues Dias PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS."

Apresentações semelhantes


Anúncios Google