Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia.

Slides:



Advertisements
Apresentações semelhantes
O computador entra na sala de aula /ICT in the classroom
Advertisements

Rede de saúde em português
Ensino do português língua estrangeira públicos, dificuldades e materiais Síntese da análise.
Escola Secundária Manuel Teixeira Gomes
Trabalho de Língua Portuguesa
Projeto língua portuguesa
Novo Acordo Ortográfico da Língua Portuguesa
Escuela Superior de Comercio “Prof. Prudencio Cornejo”
VARIEDADES DO PORTUGUÊS – AFRICANAS E BRASILEIRA
Quem quer ser um génio das línguas?
Cursinho Vitoriano Aulas de Gramática – tarde Profª Beatriz
Gramática da língua portuguesa
PAÍSES E NACIONALIDADES CONTINENTES E OCEANOS
Reforma Ortográfica Desde o dia 1ª de janeiro de 2009 entraram em vigor no Brasil as novas regras ortográficas da língua portuguesa. Resultado de acordo.
LER E COMUNICAR: EDUCAR PARA A INCLUSÃO MENINOS DO MUNDO
NOVO ACORDO ORTOGRÁFICO 2010 HISTÓRICO Professora: Márcia Cristiane da Silva Galindo.
Encontro Lusófono São Paulo , 31 de maio de 2015.
A origem da língua portuguesa
Carlos Varandas “Ciência 2010” 1 CFNCFP IMPACTE DO JET NO PROGRAMA PORTUGUÊS DE FUSÃO NUCLEAR PERSPECTIVAS PARA O ITER por Carlos Varandas Head da Association.
Linguateca: 10 anos Milena Uzeda Garrão Maria Carmelita Pádua Dias PUC-Rio Apresentação: Claudia Freitas Uma abordagem estatística para a identificação.
Processamento de Linguagem Natural: Identificação de Expressões Multipalavra Vítor De Araújo Prof. Edson Prestes e Silva Jr. Profª Aline Villavicencio.
FERRAMENTA PARA CONTROLE E MONITORAMENTO DE SERVIÇOS NA ÁREA DE TI Rafael Antonio Pires Orientador: Francisco Adell Péricas.
Gerador de aplicativos Oracle PL/SQL WEB baseado na estrutura das tabelas do banco de dados Oracle Wagner da Silva Orientando Prof. Alexander Roberto Valdameri.
COMPONENTE DE GERAÇÃO DE BOLETOS BANCÁRIOS EM DELPHI Aluno: Jonas Ricardo Viel Prof. Adilson Vahldick - Orientador.
Processamento de Linguagem Natural: Identificação de Expressões Multipalavra O que é? Expressões multipalavra (EMs): combinações de palavras que apresentam.
Apresentação do Projecto Ciência na Escola Hugo Domingos Administrador do projecto.
SOFTWARE DE GERENCIAMENTO DE LIBERAÇÃO E ATUALIZAÇÃO DE VERSÃO EDUARDO SIEMANN ORIENTADOR: JHONY ALCEU PEREIRA.
PAÍSES E NACIONALIDADES PAÍSES E NACIONALIDADES CONTINENTES E OCEANOS PAÍSES LUSÓFONOS.
1º. ENCONTROS ACADÊMICOS DA FACULDADE LUCIANO FEIJÃO IX ENCONTRO DE INICIAÇÃO À PESQUISA 08, 09 E 10 DE NOVEMBRO DE 2016 INTRODUÇÃO TÍTULO DO TRABALHO.
Ana Frankenberg-Garcia Linguateca - Fundação para a Computação Científica Nacional (FCCN) Instituto Superior de Línguas e Administração (ISLA) 9 anos de.
LEARNING ANALYTICS CRUZEIRO DO SUL Dr. Alberto Messias da Costa Souza
COMUNICAÇÃO AUMENTATIVA E ALTERNATIVA
O UNIVERSO DA LINGUAGEM
(60pt Calibri bold; 70pt de espaçamento entre linhas)
LÍNGUA PORTUGUESA Ensino Médio A língua, seus signos e a gramática
O aprendiz de investigador
Centro de Linguística da Universidade NOVA de Lisboa: novas formas de conhecimento, representação e uso da língua Rute Costa | Matilde Gonçalves | Raquel.
Mapeamento de repertórios básicos de leitura e escrita em uma escola com baixo índice na Prova Brasil. Carolina C. Silveira1, Camila Domeniconi2, Elenice.
AULA 1.
RESULTADOS E DISCUSSÃO
Democratizar Descolonizar Desenvolver
HIPOTERMIA TERAPÊUTICA NO RECÉM-NASCIDO:
Para ler, para escrever e Horizontes
Modelo para a formatação (coloque aqui o titulo de seu trabalho) Coloque aqui a Programa de Pós-Graduação pertinente Autor 1 Resumo Este documento.
Módulo I Capítulo 1: Introdução ao curso
(60pt Calibri bold; 70pt de espaçamento entre linhas)
17 A 24 JULHO 2016.
Relatório de resultados do processo quantitativo
LÍNGUA PORTUGUESA VARIEDADE GEOGRÁFICA
O Colonialismo Português no Século XIX
Mobilidade – tecnologia para automação
(60pt Calibri bold; 70pt de espaçamento entre linhas)
ARTIGOS CIENTÍFICOS APRESENTAÇÃO.
CC8. Comunicação e colaboração Tecnologias da Informação e Comunicação Prof.(a) Sofia Morais.
OBSERVAÇÃ O: Para mudar a imagem deste slide, selecione a imagem e exclua-a. Em seguida, clique no ícone Imagens do espaço reservado pra inserir sua própria.
Como estudar em Portugal
Implementando soluções de IA utilizando os serviços cognitvos no Azure
Departamento de Estatística
Guiné Bissau Dos desafios às oportunidades
SANTA LUZIA DISCIPLINAS: CIÊNCIAS E REDAÇÃO 8º ANO – E. F.
Kansallisuudet português.
Aplicação DO CONCEITO ACARDE NO REAPROVEITAMENTO DE OBJETOS DE APRENDIZAGEM EM LINHA DE PRODUÇÃO PARA EAD.
Detecção e Identificação de Vogais
TÍTULO DO TRABALHO INTRODUÇÃO CONCLUSÃO METODOLOGIA REFERÊNCIAS
BILINGUISMO O termo aplicado ao indivíduo, pode significar simplesmente a capacidade de expressar-se em duas línguas. BILINGUISMO.
e-­Lattes:­ Extração e Análise de CV Lattes
HIPOTERMIA TERAPÊUTICA NO RECÉM-NASCIDO:
Universidade Estadual do Paraná Curso de Matemática
I – inTrodução à linguística:
TÍTULO DO TRABALHO INTRODUÇÃO CONCLUSÃO MÉTODO REFERÊNCIAS
Transcrição da apresentação:

Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft D aniela Miguel Sales Dias Promoted by: Microsoft Language Development Center Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft D aniela Miguel Sales Dias Promoted by: Microsoft Language Development Center Encontro da Linguateca 10 Anos, 11 Setembro 2008, Curia, Portugal

Sumário Introdução Objectivos Linguateca no desenvolvimento de tecnologia de voz na MS Conclusões

Introdução -Posição do Português no conjunto das línguas mais faladas do mundo com 235 milhões de falantes -língua materna (com cerca de 235 milhões de falantes) -língua oficial de 9 Estados Independentes (Angola, Brasil, Cabo Verde, Guiné Bissau, Moçambique, Portugal, São Tomé e Príncipe, Timor)

Objectivos Mostrar a importância da Linguateca no desenvolvimento de tecnologia de voz em Português Europeu e do Brasil na Microsoft Elencar os pontos de aplicabilidade dos recursos disponíveis

Linguateca no desenvolvimento de tecnologia de voz na MS Principais recursos utilizados: –CETNFolha –CETEMPúblico –COMPARA –Floresta Sintáctica e Floresta Virgem

Linguateca no desenvolvimento de tecnologia de voz na MS Tarefas executadas sobre CETEMPublico, CETENFolha e COMPARA: –Selecção automática de scripts para a voice font –Selecção de casos de teste para validação de algoritmos de: Separador de frases Separador de palavras Normalização de texto Desambiguação de homógrafos Conversão grafema-fone –Obtenção e generalização de padrões para criação de regras de normalização de texto –Obtenção de listas de frequência de léxico em certos domínios

Linguateca no desenvolvimento de tecnologia de voz na MS Tarefas executadas sobre Floresta Sintáctica e Florestas Virgem: –Extracção de tags de POS e extrapolação para léxico, após o mapeamento –Utilização do corpus da Floresta Sintáctica para treino dos POS tagger automático

Conclusões Há 10 anos eram muito escassos os recursos disponíveis para a comunidade científica, sobretudo em formatos inteligíveis para processamento computacional A Linguateca veio preencher com sucesso essa lacuna, contribuindo não só para a aproximação entre as comunidades científicas portuguesa e brasileira que trabalham em Processamento da Linguagem Natural, Linguística Computacional e áreas relacionadas, como também para a divulgação de trabalhos académicos e bases de dados que de outra forma se manteriam dispersos e dificilmente acessíveis

Daniela Braga Program Manager Lead