Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia.

Slides:

Advertisements

Apresentações semelhantes

O computador entra na sala de aula /ICT in the classroom

Advertisements

Rede de saúde em português

Ensino do português língua estrangeira públicos, dificuldades e materiais Síntese da análise.

Escola Secundária Manuel Teixeira Gomes

Trabalho de Língua Portuguesa

Projeto língua portuguesa

Novo Acordo Ortográfico da Língua Portuguesa

Escuela Superior de Comercio “Prof. Prudencio Cornejo”

VARIEDADES DO PORTUGUÊS – AFRICANAS E BRASILEIRA

Quem quer ser um génio das línguas?

Cursinho Vitoriano Aulas de Gramática – tarde Profª Beatriz

Gramática da língua portuguesa

PAÍSES E NACIONALIDADES CONTINENTES E OCEANOS

Reforma Ortográfica Desde o dia 1ª de janeiro de 2009 entraram em vigor no Brasil as novas regras ortográficas da língua portuguesa. Resultado de acordo.

LER E COMUNICAR: EDUCAR PARA A INCLUSÃO MENINOS DO MUNDO

NOVO ACORDO ORTOGRÁFICO 2010 HISTÓRICO Professora: Márcia Cristiane da Silva Galindo.

Encontro Lusófono São Paulo , 31 de maio de 2015.

A origem da língua portuguesa

Carlos Varandas “Ciência 2010” 1 CFNCFP IMPACTE DO JET NO PROGRAMA PORTUGUÊS DE FUSÃO NUCLEAR PERSPECTIVAS PARA O ITER por Carlos Varandas Head da Association.

Linguateca: 10 anos Milena Uzeda Garrão Maria Carmelita Pádua Dias PUC-Rio Apresentação: Claudia Freitas Uma abordagem estatística para a identificação.

Processamento de Linguagem Natural: Identificação de Expressões Multipalavra Vítor De Araújo Prof. Edson Prestes e Silva Jr. Profª Aline Villavicencio.

FERRAMENTA PARA CONTROLE E MONITORAMENTO DE SERVIÇOS NA ÁREA DE TI Rafael Antonio Pires Orientador: Francisco Adell Péricas.

Gerador de aplicativos Oracle PL/SQL WEB baseado na estrutura das tabelas do banco de dados Oracle Wagner da Silva Orientando Prof. Alexander Roberto Valdameri.

COMPONENTE DE GERAÇÃO DE BOLETOS BANCÁRIOS EM DELPHI Aluno: Jonas Ricardo Viel Prof. Adilson Vahldick - Orientador.

Processamento de Linguagem Natural: Identificação de Expressões Multipalavra O que é? Expressões multipalavra (EMs): combinações de palavras que apresentam.

Apresentação do Projecto Ciência na Escola Hugo Domingos Administrador do projecto.

SOFTWARE DE GERENCIAMENTO DE LIBERAÇÃO E ATUALIZAÇÃO DE VERSÃO EDUARDO SIEMANN ORIENTADOR: JHONY ALCEU PEREIRA.

PAÍSES E NACIONALIDADES PAÍSES E NACIONALIDADES CONTINENTES E OCEANOS PAÍSES LUSÓFONOS.

1º. ENCONTROS ACADÊMICOS DA FACULDADE LUCIANO FEIJÃO IX ENCONTRO DE INICIAÇÃO À PESQUISA 08, 09 E 10 DE NOVEMBRO DE 2016 INTRODUÇÃO TÍTULO DO TRABALHO.

Ana Frankenberg-Garcia Linguateca - Fundação para a Computação Científica Nacional (FCCN) Instituto Superior de Línguas e Administração (ISLA) 9 anos de.

LEARNING ANALYTICS CRUZEIRO DO SUL Dr. Alberto Messias da Costa Souza

COMUNICAÇÃO AUMENTATIVA E ALTERNATIVA

O UNIVERSO DA LINGUAGEM

(60pt Calibri bold; 70pt de espaçamento entre linhas)

LÍNGUA PORTUGUESA Ensino Médio A língua, seus signos e a gramática

O aprendiz de investigador

Centro de Linguística da Universidade NOVA de Lisboa: novas formas de conhecimento, representação e uso da língua Rute Costa | Matilde Gonçalves | Raquel.

Mapeamento de repertórios básicos de leitura e escrita em uma escola com baixo índice na Prova Brasil. Carolina C. Silveira1, Camila Domeniconi2, Elenice.

RESULTADOS E DISCUSSÃO

Democratizar Descolonizar Desenvolver

HIPOTERMIA TERAPÊUTICA NO RECÉM-NASCIDO:

Para ler, para escrever e Horizontes

Modelo para a formatação (coloque aqui o titulo de seu trabalho) Coloque aqui a Programa de Pós-Graduação pertinente Autor 1 Resumo Este documento.

Módulo I Capítulo 1: Introdução ao curso

(60pt Calibri bold; 70pt de espaçamento entre linhas)

17 A 24 JULHO 2016.

Relatório de resultados do processo quantitativo

LÍNGUA PORTUGUESA VARIEDADE GEOGRÁFICA

O Colonialismo Português no Século XIX

Mobilidade – tecnologia para automação

(60pt Calibri bold; 70pt de espaçamento entre linhas)

ARTIGOS CIENTÍFICOS APRESENTAÇÃO.

CC8. Comunicação e colaboração Tecnologias da Informação e Comunicação Prof.(a) Sofia Morais.

OBSERVAÇÃ O: Para mudar a imagem deste slide, selecione a imagem e exclua-a. Em seguida, clique no ícone Imagens do espaço reservado pra inserir sua própria.

Como estudar em Portugal

Implementando soluções de IA utilizando os serviços cognitvos no Azure

Departamento de Estatística

Guiné Bissau Dos desafios às oportunidades

SANTA LUZIA DISCIPLINAS: CIÊNCIAS E REDAÇÃO 8º ANO – E. F.

Kansallisuudet português.

Aplicação DO CONCEITO ACARDE NO REAPROVEITAMENTO DE OBJETOS DE APRENDIZAGEM EM LINHA DE PRODUÇÃO PARA EAD.

Detecção e Identificação de Vogais

TÍTULO DO TRABALHO INTRODUÇÃO CONCLUSÃO METODOLOGIA REFERÊNCIAS

BILINGUISMO O termo aplicado ao indivíduo, pode significar simplesmente a capacidade de expressar-se em duas línguas. BILINGUISMO.

e-Lattes: Extração e Análise de CV Lattes

HIPOTERMIA TERAPÊUTICA NO RECÉM-NASCIDO:

Universidade Estadual do Paraná Curso de Matemática

I – inTrodução à linguística:

TÍTULO DO TRABALHO INTRODUÇÃO CONCLUSÃO MÉTODO REFERÊNCIAS

Transcrição da apresentação:

Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft D aniela Miguel Sales Dias Promoted by: Microsoft Language Development Center Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de voz na Microsoft D aniela Miguel Sales Dias Promoted by: Microsoft Language Development Center Encontro da Linguateca 10 Anos, 11 Setembro 2008, Curia, Portugal

Sumário Introdução Objectivos Linguateca no desenvolvimento de tecnologia de voz na MS Conclusões

Introdução -Posição do Português no conjunto das línguas mais faladas do mundo com 235 milhões de falantes -língua materna (com cerca de 235 milhões de falantes) -língua oficial de 9 Estados Independentes (Angola, Brasil, Cabo Verde, Guiné Bissau, Moçambique, Portugal, São Tomé e Príncipe, Timor)

Objectivos Mostrar a importância da Linguateca no desenvolvimento de tecnologia de voz em Português Europeu e do Brasil na Microsoft Elencar os pontos de aplicabilidade dos recursos disponíveis

Linguateca no desenvolvimento de tecnologia de voz na MS Principais recursos utilizados: –CETNFolha –CETEMPúblico –COMPARA –Floresta Sintáctica e Floresta Virgem

Linguateca no desenvolvimento de tecnologia de voz na MS Tarefas executadas sobre CETEMPublico, CETENFolha e COMPARA: –Selecção automática de scripts para a voice font –Selecção de casos de teste para validação de algoritmos de: Separador de frases Separador de palavras Normalização de texto Desambiguação de homógrafos Conversão grafema-fone –Obtenção e generalização de padrões para criação de regras de normalização de texto –Obtenção de listas de frequência de léxico em certos domínios

Linguateca no desenvolvimento de tecnologia de voz na MS Tarefas executadas sobre Floresta Sintáctica e Florestas Virgem: –Extracção de tags de POS e extrapolação para léxico, após o mapeamento –Utilização do corpus da Floresta Sintáctica para treino dos POS tagger automático

Conclusões Há 10 anos eram muito escassos os recursos disponíveis para a comunidade científica, sobretudo em formatos inteligíveis para processamento computacional A Linguateca veio preencher com sucesso essa lacuna, contribuindo não só para a aproximação entre as comunidades científicas portuguesa e brasileira que trabalham em Processamento da Linguagem Natural, Linguística Computacional e áreas relacionadas, como também para a divulgação de trabalhos académicos e bases de dados que de outra forma se manteriam dispersos e dificilmente acessíveis

Daniela Braga Program Manager Lead