Aplicações de Processamento de Voz

Slides:

Advertisements

Apresentações semelhantes

Eletrônica (1): Sinais de pulsos e o padrão NIM

Advertisements

Electrónica Programada Para TIC

Serviço de Coleta Colaborativo

Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA.

por Fernando Luís Dotti

por Fernando Luís Dotti

Projeto de Filtros Digitais c/ Matlab

MULTIMÍDIA Mídia, Multimídia e Sistema Multimídia (Slide - 2)

Rastreamento de Múltiplos Objetos utilizando uma Combinação de Filtros de Partículas e K-Médias Dr. Hemerson Pistori Universidade Católica Dom Bosco –

Princípios Transmissão de Dados

MO Prof. Paulo Cesar Centoducatte MC542 Organização de Computadores Teoria e Prática.

Comunicação local Assíncrona

Mel Frequency Cepstral Coefficients for Music Modeling

Matraca – Software para Auxílio de Invisuais no Uso do Computador

Universidade Federal de Minas Gerais

I – Informação Digital Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações Tecnologias de.

Open Systems Interconnection

SOLUÇÕES DE PRODUTOS E SERVIÇOS PARA O PODER PÚBLICO.

Carlos Alberto de Freitas Pereira Júnior

Instruções aos autores: conteúdo e importância para a

Stream-Oriented Communication

Título Completo do Trabalho Título Completo do Trabalho SOBRENOME, Nome, Orientador: Prof. Eng. Eletricista Fulano Núcleo de Instrumentação e Processamento.

Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.

Estado da Arte Anderson Gomes Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS.

Redes de Computadores Transmissão da Informação.

Impressão vocal Alunos: Daniel de Carvalho Cayres Pinto

Sistemas e Sinais (LEIC) – Capítulo 11 – Amostragem e Reconstrução Carlos Cardeira Diapositivos para acompanhamento da bibliografia de base (Structure.

CELP Artur Benneman Rafael Henrique de Moraes Feron

Introdução O interesse em métodos para processamento digital de imagens origina-se em duas principais aplicações: Melhoramento da informação da imagem.

Contadores e Divisores de Frequência

Departamento de Electrónica e Telecomunicações da Universidade de Aveiro Sistemas Multimédia Ana Maria Tomé e José Vieira Departamento de Electrónica,

Aplicações dos Bancos de Filtros

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS

UNIVERSIDADE FEDERAL SANTA CATARINA Curso de Biblioteconomia Disciplina: Recuperação Da Informação Professora: Ursula Blattmann Acadêmicas:: Mara Suchy.

Reconhecimento de voz.

Estruturas Algébricas

Processamento Digital de Sinal

Prof. Celso Cardoso Neto. (2) ALINHAMENTO Caso 1.

Prof. Leandro da Silva Taddeo

Tema: Camadas física e enlace

01/05/01 1 INTRODUÇÃO 1 Referências bibliográficas Barsoum, M. W. Fundamentals of ceramics. New York, McGraw-Hill, 1997.

Prof. Msc. Wellington W. F. Sarmento

CONTROLE II Prof. Samuel Bettoni.

PROCESSAMENTO DIGITAL DE SINAIS

Síntese de voz utilizando avatares GPVoz Gabriel de Albuquerque Styve Stallone.

Julio Cesar Dal Bello TECNOLOGIAS MODERNAS DE TELECOMUNICAÇÕES.

Beatriz C A Caiuby Novaes

Prof. Carlos Alberto Kamienski – Avaliação de Desempenho de Redes e Sistemas (INF-103) Santo André, Fevereiro de 2012 Apresentação da.

Universidade de Brasília Faculdade de Tecnologia

1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira 8 Janeiro 2005.

1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira.

Projetando e Publicando Publicações Eletrônicas Interativas na World Wide Web Curso.

Tipos de sinal.

Aulas 6 e 7 (continuação): Suficiência da Portas NAND e NOR

Guido Stolfi 1/17 A Digitalização da Imagem e do Som Curso: Televisão Digital Mackenzie – 2008 Eng. Guido Stolfi.

Introdução à Disciplina Computação Gráfica e Processamento de Imagens Luciana de Toro Gomes Guimarães União das.

Avaliação de Desempenho de Redes e Sistemas (INF-103)

Processamento Digital de Sinais Universidade de Brasília Faculdade de Tecnologia Departamento de Engenharia Elétrica Prof. Francisco Assis de O. Nascimento.

GEOMETRIA DE TRAÇOS MODELO NÃO LINEAR Fonologia Gerativa

Análise e Processamento de sinais fisiológicos

Faculdade de Engenharia da Universidade do Porto Licenciatura em Engenharia Electrotécnica e de Computadores Ramo de Telecomunicações, Electrónica e Computadores.

Separação e Recuperação de Bioprodutos Prof. Arnaldo Márcio R. Prata

Guido Stolfi 1 / 46 Compressão de Áudio MPEG AAC Guido Stolfi Mackenzie 2008.

I – Informação Digital – Trabalho Grupo Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP-018 – O Produto Internet e suas Aplicações.

PSI2653: Meios Eletrônicos Interativos I I – Informação Digital Escola Politécnica da USP Engenharia de Sistemas Eletrônicos Meios Eletrônicos Interativos.

UTFPR – Campus Ponta Grossa Disciplina: Processamento de Sinais

PARA TER O SINAL DIGITAL.

Universidade federal do paraná

Bruno de Almeida de Freitas Barbosa Prof. Dr. Eduardo Parente Ribeiro

Transcrição da apresentação:

Aplicações de Processamento de Voz Prof. Marcio Eisencraft

Universidade Presbiteriana Mackenzie Sumário Introdução Modelagem básica Aplicações: Geração de fonemas Reconhecimento de fonemas Voz sintética Codificação Trabalhos presentes e futuros Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 1. Introdução Processamento de voz é um dos mais importantes instrumentos da era digital. Exemplos de aplicação: discagem automática atendimento automático auxílio de pessoas deficientes Segurança Uma das grandes áreas de pesquisa dentro da Engeharia de Telecomunicações Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 2. Modelagem básica (1/2) O trato vocal Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 2. Modelagem básica (2/2) Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3. Aplicações Geração de fonemas Reconhecimento de fonemas Voz sintética Codificação e compactação Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3.1 Geração de fonemas Trato vocal modelado como filtros digitais com atrasos e ganhos. Universidade Presbiteriana Mackenzie

3.2 Reconhecimento de fonemas (1/2) Universidade Presbiteriana Mackenzie

3.2 Reconhecimento de fonemas (2/2) Formantes e relação entre elas são tabeladas e usadas para identificar vogais e sexo do falante. Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3.3 Voz sintética Tendo um banco de dados com os coeficientes para cada fonema, é possível gerar voz sintética. Problema: sons são vocálicos ou fricativos. Universidade Presbiteriana Mackenzie

3.4 Codificação – Compactação Coeficientes de predição – LPC Transmite-se apenas o erro de predição ao invés do próprio sinal São necessários menos bits para a codificação Usado, por exemplo, em sistemas de telefonia digital – economia de até 50% na taxa de transmissão. Universidade Presbiteriana Mackenzie

4. Alguns trabalhos atuais e futuros Eliminação de ruído em voz (videoconferência) Sincronismo automatizado entre articulação e fala para animações Reconhecimento de voz em ambientes barulhentos Novas técnicas de compactação baseadas em percepção auditiva (wavelets) Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie Algumas Referências PICKETT, J. M. Acoustics Of Speech Communication: Fundamentals, Speech Perception Theory, And Technology. 2. ed. New Jersey: Prentice Hall. 1999. 404 p RABINER, L.R.; SCHAFER, R. W. Digital Processing of Speech Signals. 7. ed., Prentice Hall. 1978. STONICK, V. L. Labs for signals and systems: using MATLAB. PWS, c1996. BURRUS, C. S. et al. Computer-based exercises for signal processing using Matlab 5. Prentice-Hall, c1998. BEHLAU, M. S.; et al. Análise Espectrográfica de Formantes das vogais do português brasileiro. Revista ACTA AWHO, Volume VII, n. 2, p. 74-85, 1988. MONTEIRO, M. C. Uma análise espectrográfica das formantes das vogais orais do português brasileiro falado em São Paulo. 1995. 74f. Monografia (Especialização)-Escola Paulista de Medicina, São Paulo, São Paulo, 1995. Universidade Presbiteriana Mackenzie

FIM Contato: marcioft@mackenzie.br meusite.mackenzie.br/marcioft Universidade Presbiteriana Mackenzie