Tratamento estatístico do conhecimento lingüístico

Slides:



Advertisements
Apresentações semelhantes
«Forte do Bom Sucesso (Lisboa) – Lápides 1, 2, 3» «nomes gravados, 21 de Agosto de 2008» «Ultramar.TerraWeb»
Advertisements

INFORMAÇÕES COMPLEMENTARES
EXERCÍCIOS RESULTADO.
Propriedades físicas representativas de
EVOLUÇÃO E DESAFIOS DAS EXPORTAÇÕES DE CARNES DE AVES E SUÍNOS
A busca das mulheres para alcançar seu espaço dentro das organizações
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
João Lúcio de Azevedo ESALQ/USP, UMC, UCS, CBA
Capa Disciplina: Ajustamento de Observações
Exercício do Tangram Tangram é um quebra-cabeças chinês no qual, usando 7 peças deve-se construir formas geométricas.
MISSÕES ESTADUAIS.
Nome : Resolve estas operações começando no centro de cada espiral. Nos rectângulos põe o resultado de cada operação. Comprova se no final.
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
O Índice de Desenvolvimento da Educação Básica - IDEB
Curso de ADMINISTRAÇÃO
PUCRS - PROGRAMA DE PÓS-GRADUAÇÃO EM PEDIATRIA E SAÚDE DA CRIANÇA Início do Mestrado: 1995 Início do Doutorado: 2004 Formou 63 Mestres e 3 doutores Conceito.
EXPRESSÕES ARITMÉTICAS
OPORTUNIDADES E CARREIRA DO ADMINISTRADOR
Aula 4 Nomes, Vinculações, Tipos e Escopos
Yolanda Dora Martinez Évora Rosana Suemi Nakamura
ESTATÍSTICA.
Renda até 2 SM.
Diagnósticos Educativos = Diagnósticos Preenchidos 100% = 1.539
ESTATÍSTICA.
PESQUISA SOBRE PRAZO MÉDIO DA ASSISTÊNCIA NA SAÚDE SUPLEMENTAR
AUTOMEDICAÇÃO EM ESTUDANTES DE MEDICINA
Regulamento FMTKD adaptado para Categorias Não-Oficiais
Bolha Posição de máx. W2 Ponto de Estagnação
Secretaria de Estado da Educação de Minas Gerais.
CATÁLOGO GÉIA PÁG. 1 GÉIA PÁG. 2 HESTIA PÁG. 3.
PROCESSOS PRINCIPAIS Alunos - Grau de Satisfação 4971 avaliações * Questões que entraram em vigor em 2011 ** N.A. = Não Aplicável Versão: 07/02/2012 INDICADORES.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Nível de Serviço ANO II – Nº 11.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO IV – Nº 11.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Nivel de Serviço ANO III – Nº 2.
ESTATÍSTICA.
Trabalho sobre Cor Thiago Marques Toledo.
Indicadores do Mercado de Meios Eletrônicos de Pagamento Setembro de 2006.
Indicadores do Mercado
1 Indicadores do Mercado de Meios Eletrônicos de Pagamento Junho de 2006 Indicadores do Mercado de Meios Eletrônicos de Pagamento Junho de 2006.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO IV – Nº 09.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO IV – Nº 12.
FISCALIZAÇÃO DIRECIONADA CONDUTA - AUXILIAR ANO III – Nº 05.
FISCALIZAÇÃO DIRECIONADA NÍVEL DE SERVIÇO ANO I – Nº 9.
FISCALIZAÇÃO DIRECIONADA NÍVEL DE SERVIÇO ANO I – Nº 4.
Medidas de posição  Estudando as distribuições de  frequência,  percebe-se que existe uma  posição de  concentração dos valores, que podem estar mais concentrados no início, no meio ou no 
Coordenação Geral de Ensino da Faculdade
Funcionários - Grau de Satisfação 2096 avaliações
O comportamento informacional dos alunos de cursinho pré-vestibular no processo de escolha da orientação vocacional. Apresentação de trabalho da disciplina.
PERFIL DOS BENEFICIÁRIOS E NÃO-BENEFICIÁRIOS DO PROGRAMA BOLSA FAMÍLIA EM TERMOS DE MERCADO DE TRABALHO: CONSIDERAÇÕES METODOLÓGICAS E SUBSTANTIVAS Alessandra.
Dra. Renata Mota Mamede Carvallo Juliana Granja Urosas
Tributação da Exportação nas Empresas optantes pelo Simples Nacional
Projeto Marcas que Eu Gosto 1 PROJETO MARCAS QUE EU GOSTO Estudos Quantitativo de Consumidores Janeiro / 2005.
Modelagem Estatística
Núcleo de Estatística e Gestão Estratégica- NEGEST.
1/40 COMANDO DA 11ª REGIÃO MILITAR PALESTRA AOS MILITARES DA RESERVA, REFORMADOS E PENSIONISTAS - Mar 06 -
APOIOS PEDAGÓGICO ACRESCIDO
Projeto Medindo minha escola.
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Conservação - Frota ANO V – Nº 03.
Modelagem Estatística
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Estatística Aula 9 – 28/02/2011.
1 Aplicações do Fecho Regular. 2 A interseção de uma linguagem livre de contexto e uma linguagem regular é uma linguagem livre de contexto livre de contexto.
CONCEITOS FUNDAMENTAIS
Olhe fixamente para a Bruxa Nariguda
LINHAS MAIS RECLAMADAS Ranking Negativo para Fiscalização Direcionada Nível de Serviço ANO III – Nº 09.
3ª PESQUISA DE REMUNERAÇÃO
Equipe Bárbara Régis Lissa Lourenço Lucas Hakim Ricardo Spada Coordenador: Gabriel Pascutti.
DADOS DE REFERÊNCIA ACERCA DO ATEDIMENTO AOS USOS MÚLTIPLOS PELO SISTEMA HIDRÁULICO DA BACIA HIDROGRÁFICA DO RIO PARAÍBA DO SUL Brasília-DF Julho/2014.
PAUTA: 1.- EDUC 2.- INADIMPLÊNCIA 3.- PERSPECTIVAS ECONÔMICAS
Aula 11 - Teste de hipóteses, teste de uma proporção
Transcrição da apresentação:

Tratamento estatístico do conhecimento lingüístico Christina Abreu Gomes Departamento de Lingüística e Filologia/UFRJ

Questões básicas da ciência lingüística Chomsky, 1986: O que constitui o conhecimento lingüístico? Como esse conhecimento é adquirido? Como esse conhecimento é usado? Rizzi, 1998: (iv) Como o conhecimento é representado na mente? (v) Como esse conhecimento é acessado?

Postulação de um conhecimento inato (GU) Argumento da pobreza de estímulo Input degenerado Ausência de evidência negativa (Gold, 1967: linguagens formais não podem ser adquiridas / aprendidas somente com base em evidência positiva.

Abordagem estocástica do conhecimento lingüístico O uso lingüístico real é altamente variável, gradiente e rico em fenômenos contínuos; Há um conjunto de experimentos que demonstraram que os julgamentos dos falantes apresentam propriedades de contínuo e comportamento gradiente, e que a cognição humana é baseada em processamento probabilístico. A faculdade da linguagem apresenta propriedades probabilísticas presentes na representação, no processamento, na mudança, na aquisição e na produção.

Pressupostos Teóricos: Modelos baseados no Uso, Lingüística Probabilística, Fonologia de Laboratório “grammar is usage, and usage is grammar” (Bybee,2005): gramática é a organização cognitiva da experiência do falante com a língua e aspectos dessa experiência têm impacto na representação, aquisição e mudança. abandono da doutrina do dualismo: “language as a cognitive system imputed to the individuals is thus to be explained in terms of general facts of the physical world (...); in terms of specific capabilities of the human species which arose through evolution (...): and in terms of interactions of the organism with its environment (...). Social interaction is subsumed under the same umbrella, as a phenomenon of nature (Pierrehumbert, Beckman & Ladd, 2001) Modelagem probabilística da organização do conhecimento lingüístico: ”Knowledge of language can be understood not as a minimal set of categorical rules or constraints, but as a (possible redundant) set of gradient rules, which may be characterized by a statistical distribution” (Bod, Rens & Jannedy, 2003) As estruturas emergem do sistema de armazenagem

Gramática probabilística como solução para a ausência de evidência negativa Jurafsky, 2003 Input lingüístico: contém ruído, ambíguo e não segmentado; Outras ciências cognitivas utilizam modelos estatísticos para lidar com problemas semelhantes: – processamento visual humano (Rao et al. 2001; Weiss & Fleet 2001) – categorização (Tenenbaum 2000; Tenenbaum and Griffiths 2001b; Tenenbaum and Griffiths 2001a) – compreensão humana da causatividade (Rehder 1999; Glymour and Cheng 1998). Proposição de um modelo probabilístico: - Modelo probabilístico é um modelo que serve para resolução de problemas de tomada de decisão sob incerteza Evidência positiva: possui uma quantidade suficiente de dados para modelagem estatística Generalizações baseadas em inferência estatística tornam-se mais robustas

Probabilidades onde? “Everywhere”. Probabilities permeate linguistic system (Bod, Hay and Jannedy, 2002). Integração entre conhecimento lingüístico e uma perspectiva probabilística. Processamento: “The complex houses married and single students and their families (Jurafsky, 1996) “differences in sound change a word, ...” “a bela casa na fazenda”

Fonotática: Julgamentos fonotáticos e de boa formação apresentam característica de contínuo associados à freqüência de ocorrência de cada difone. Representação: efeito de freqüência de type e de token

Fonologia Probabilística Distribuição probabilística de qualquer unidade é atualizada através da experiência; conhecimento implícito de detalhes quantitativos da pronúncia faz parte da competência, e se desenvolve cedo a partir de uma predisposição inata de observar a fala. para modelar esse conhecimento são necessários dois ingredientes: um mapa cognitivo e uma representação análoga da realidade física.

memórias extremamente detalhadas da experiência são estocadas memórias extremamente detalhadas da experiência são estocadas. Essas percepções gradualmente preenchem uma região do mapa cognitivo correspondendo a uma categoria ou rótulo. Uma categoria encontrada várias vezes vai ser representada por numerosas memórias que povoam densamente a região correspondente ao rótulo ou categoria. Categorias menos freqüentes terão uma representação mais empobrecida. A classificação perceptual de um novo dado é realiza através uma regra de escolha estatística que computa o rótulo mais provável dada a localização e a contagem de distribuições competidoras, da região do novo dado. mesmo modelo para a produção: produção se realiza ativando um subregião do espaço de exemplar para uma categoria. As propriedades agregadas dessa subregião servem como metas de produção do planejamento articulatório.

As crianças são sensíveis às freqüências de distribuição das formas lingüísticas no input, mas o efeito da freqüência de type e de token pode ser diferenciado em função do estágio aquisitivo (Henry,2002, Pierrehumbert, 2003). A variação sociofonética tem um papel na abstração de padrões fonológicos, uma vez que as variantes são formas fonéticas em competição da mesma palavra e podem refletir também competição entre padrões fonológicos.

CARACTERIZAÇÃO DOS TIPOS SIILÁBICOS C(l)V e C(r)V C(r)V ~ CøV p, b, t, d, k, g, f, v + (r) Ausência favorecida em sílabas finais átonas e em presença de outros grupos na palavra. Ex.: [kuatøu]; [pøo’blemə]; Plosivas e obstruintes surdas (Mollica & Paiva, 1991) [‘prכpriu] ~ [‘prכpiu] [pri’sizə]~[pi’sizə] [‘otru] ~ [‘otu] C(l)V ~ C(r)V p, b, k, g, f + (l) tl: limita-se à palavras emprestadas: atlas, Atlântico, atleta Ausência de restrições fonéticas regulares. Condicionamento lexical. (Gomes, 1987, Cristófaro-Silva, 2003). [bisiklεtə] ~ [bisikrεtə] [‘bluzə] ~ [‘bruzə]

Freqüência dos Tipos de Onsets Complexos Coletado de Michaelis –www Freqüência dos Tipos de Onsets Complexos Coletado de Michaelis –www. uol. com. br /michaelis/ por Cristófaro-Silva (2003) Estrutura C(l)V Tipo menos freqüente CV 279.083 CC 43.584 C(l) 7.971 Estrutura C(r)V Tipo mais freqüente CV 279.083 CC 43.584 C(r) 35.613

AVALIAÇÃO SOCIAL VARIAÇÃO POR FALANTE C(l)V ~ C(r)V: Marcador social C(r)V ~ CøV: Depende do item lexical Não percebido em: [prכpriu] ~ [prכpiu] Altamente estigmatizado em: [progrãmə] ~ [pøgrãmə]

Estudos sobre a Aquisição do Padrão CCV no Português: Lamprecht (1991): CV e V > CVC > CCV - aquisição pode iniciar pelos encontros com a lateral como com não lateral, fricativa ou plosiva Ribas (2004): CV, V >> CVV >> CVC >> CCV adquirido até aos 4;0 >> aos 5;0 - não há ordem de domínio dos diferentes grupos de onset complexo. - C(r)V: labial-r > dorsal-r > coronal-r C(l)V: parece não haver preferência

Distribuição de Ocorrências de CCV nos dados da amostra AQUIVAR AMOSTRA: 18 crianças entre 2;0 e 5;0 Total de Dados: 666/1219 Total de C(r)V: 551/1043 Total de C(l)V: 115/176

Distribuição das ocorrências de CCV por faixa etária 2;0 2;6 3;0 3;6 4;0 5;0 4/108 4% 11/85 13% 94/210 45% 44/68 65% 297/512 58% 216/236 92%

Realização do padrão silábico CCV em função da idade e do tipo silábico 2;0 2;6 3;0 3;6 4;0 5;0 Total C(l)V 2/14 14% .13 5/25 20% .18 18/28 64% .61 6/6 100% 51/68 75% .72 33/35 94% .93 176 C(r)V 2/94 2% .02 6/60 10% .09 76/182 42% .38 38/62 61% .58 246/444 55% .47 183/201 91% .90 1043

Distribuição de ocorrências de C(l)V e C(r)V por idade X2=2108.337, df=23 p.val < 2.2 e-16

Evolução da sílaba C(r)V em função da tonicidade da sílaba

Evolução da sílaba C(l)V em função da tonicidade da sílaba

Comparação de C(l)V e C(r)V em sílabas tônicas X2=1150.991, df=23 p.val < 2.2 e-16

Realização do padrão silábico CCV em sílaba tônica em função da idade e do tipo silábico 2;0 2;6 3;0 3;6 4;0 5;0 Total C(l)V 2/10 20% .13 3/15 13/21 62% .48 6/6 100% 34/44 77% .66 24/26 92% .87 122 C(r)V 1/38 3% .02 3/30 10% .06 38/100 38% .26 15/28 54% .40 145/222 65% .52 110/114 96% .94 532

Discussão As diferenças desenvolvimentais observadas para os dois tipos de cluster parecem indicar: A abstração é gradual, dependente do tipo estrutural e de contexto fonológico (tonicidade, por exemplo) As crianças abstraem o tipo C(l)V antes do C(r)V; uma vez que a variação no input - C(r)V ~ C_V – gera também a possibilidade de representação de itens sem a 2a. consoante no grupo.

Conclusões Finais Há interação entre os dois processos: variabilidade desenvolvimental e reflexo da variação do input Diferenças na atuação de contextos estruturais são consistentes com o observado para as variáveis sociolingüísticas no input