MAC 499 Trabalho de Formatura Supervisionado preSotaq Aluno: Julio Shnaider Gejer – shnaider@linux.ime.usp.br Orientador: Arnaldo Mandel – am@ime.usp.br
Situação encontrada - Geral Rhythmic Patterns Parameter Setting & Language Change Modelar o relacionamento entre prosódia e sintaxe no processo de mudança na linguaguem Prosódia (parte da gramática que trata da pronúncia das palavras) Sonority Vocale (ferramena para anotação automática de intervalos vocálicos e de consoantes) Projeto Tipal (ferramenta probabilística para identificação de padrões aplicada a lingüística) Acento Secundário em Português Europeu e Brasileiro Sotaq
Sotaq – O que é? Programa que permite fazer testes de modelos para localização de acentos secundários, baseado na Teoria de Otimalidade. Para validarmos esses modelos precisamos de uma grande quantidade de dados reais.
Sotaq – Qual o problema? Os dados que são analisados eram preparados e anotados manualmente! Para isso criamos o preSotaq um programa que possibilita a preparação de dados em massa, para que sejam utilizados pelo Sotaq.
preSotaq Processo de Desenvolvimento O Desenvolvimento do preSotaq contou com as seguintes etapas: Aprendizado sobre o Sotaq, e sua forma de trabalhar com arquivos de entrada. Análise de uma melhor forma sobre como fazer a entrada dos dados. Conclusão: XML
preSotaq Processo de Desenvolvimento Definição sobre linguagem e ambiente de desenvolvimento. Conclusão: Java + Swing + Netbeans Definição sobre forma de processar os arquivos. Conclusão: DOM
preSotaq - Funcionalidades Adicionar frases no formato XML. Editar/Excluir/Salvar frases. Separação/Junção automática e manual de sílabas. Edição de propriedades das sílabas. Determinar automaticamente as propriedades.
Decomposição das frases preSotaq + Sotaq preSotaq Coleção de Frases Sotaq Decomposição das frases em Segmentos Rítmicos
preSotaq Situação Atual Desenvolvido conversores de XML para o formato do Sotaq e vice-versa. Desenvolvido um protótipo recém aprovado.
preSotaq Cronograma para finalização Conclusão do desenvolvimento do ambiente para manipulação de frases. Prazo previsto: dezembro/03
Quer saber mais? http://www.ime.usp.br/~tycho http://www.linux.ime.usp.br/~shnaider/mac499