Aplicações de Processamento de Voz

Slides:



Advertisements
Apresentações semelhantes
Eletrônica (1): Sinais de pulsos e o padrão NIM
Advertisements

Electrónica Programada Para TIC
Serviço de Coleta Colaborativo
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA.
por Fernando Luís Dotti
por Fernando Luís Dotti
Projeto de Filtros Digitais c/ Matlab
MULTIMÍDIA Mídia, Multimídia e Sistema Multimídia (Slide - 2)
Rastreamento de Múltiplos Objetos utilizando uma Combinação de Filtros de Partículas e K-Médias Dr. Hemerson Pistori Universidade Católica Dom Bosco –
Princípios Transmissão de Dados
MO Prof. Paulo Cesar Centoducatte MC542 Organização de Computadores Teoria e Prática.
Comunicação local Assíncrona
Mel Frequency Cepstral Coefficients for Music Modeling
Matraca – Software para Auxílio de Invisuais no Uso do Computador
Universidade Federal de Minas Gerais
I – Informação Digital Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações Tecnologias de.
Open Systems Interconnection
SOLUÇÕES DE PRODUTOS E SERVIÇOS PARA O PODER PÚBLICO.
Carlos Alberto de Freitas Pereira Júnior
Instruções aos autores: conteúdo e importância para a
Stream-Oriented Communication
Título Completo do Trabalho Título Completo do Trabalho SOBRENOME, Nome, Orientador: Prof. Eng. Eletricista Fulano Núcleo de Instrumentação e Processamento.
Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.
Estado da Arte Anderson Gomes Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS.
Redes de Computadores Transmissão da Informação.
Impressão vocal Alunos: Daniel de Carvalho Cayres Pinto
Sistemas e Sinais (LEIC) – Capítulo 11 – Amostragem e Reconstrução Carlos Cardeira Diapositivos para acompanhamento da bibliografia de base (Structure.
CELP Artur Benneman Rafael Henrique de Moraes Feron
Introdução O interesse em métodos para processamento digital de imagens origina-se em duas principais aplicações: Melhoramento da informação da imagem.
Contadores e Divisores de Frequência
Departamento de Electrónica e Telecomunicações da Universidade de Aveiro Sistemas Multimédia Ana Maria Tomé e José Vieira Departamento de Electrónica,
Aplicações dos Bancos de Filtros
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS
UNIVERSIDADE FEDERAL SANTA CATARINA Curso de Biblioteconomia Disciplina: Recuperação Da Informação Professora: Ursula Blattmann Acadêmicas:: Mara Suchy.
Reconhecimento de voz.
Estruturas Algébricas
Processamento Digital de Sinal
Prof. Celso Cardoso Neto. (2) ALINHAMENTO Caso 1.
Prof. Leandro da Silva Taddeo
Tema: Camadas física e enlace
01/05/01 1 INTRODUÇÃO 1 Referências bibliográficas Barsoum, M. W. Fundamentals of ceramics. New York, McGraw-Hill, 1997.
Prof. Msc. Wellington W. F. Sarmento
1.
CONTROLE II Prof. Samuel Bettoni.
PROCESSAMENTO DIGITAL DE SINAIS
Síntese de voz utilizando avatares GPVoz Gabriel de Albuquerque Styve Stallone.
Julio Cesar Dal Bello TECNOLOGIAS MODERNAS DE TELECOMUNICAÇÕES.
Beatriz C A Caiuby Novaes
Prof. Carlos Alberto Kamienski – Avaliação de Desempenho de Redes e Sistemas (INF-103) Santo André, Fevereiro de 2012 Apresentação da.
Universidade de Brasília Faculdade de Tecnologia
1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira 8 Janeiro 2005.
1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira.
Projetando e Publicando Publicações Eletrônicas Interativas na World Wide Web Curso.
Tipos de sinal.
Aulas 6 e 7 (continuação): Suficiência da Portas NAND e NOR
Guido Stolfi 1/17 A Digitalização da Imagem e do Som Curso: Televisão Digital Mackenzie – 2008 Eng. Guido Stolfi.
Introdução à Disciplina Computação Gráfica e Processamento de Imagens Luciana de Toro Gomes Guimarães União das.
Avaliação de Desempenho de Redes e Sistemas (INF-103)
Processamento Digital de Sinais Universidade de Brasília Faculdade de Tecnologia Departamento de Engenharia Elétrica Prof. Francisco Assis de O. Nascimento.
GEOMETRIA DE TRAÇOS MODELO NÃO LINEAR Fonologia Gerativa
Análise e Processamento de sinais fisiológicos
Faculdade de Engenharia da Universidade do Porto Licenciatura em Engenharia Electrotécnica e de Computadores Ramo de Telecomunicações, Electrónica e Computadores.
Separação e Recuperação de Bioprodutos Prof. Arnaldo Márcio R. Prata
Guido Stolfi 1 / 46 Compressão de Áudio MPEG AAC Guido Stolfi Mackenzie 2008.
I – Informação Digital – Trabalho Grupo Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP-018 – O Produto Internet e suas Aplicações.
PSI2653: Meios Eletrônicos Interativos I I – Informação Digital Escola Politécnica da USP Engenharia de Sistemas Eletrônicos Meios Eletrônicos Interativos.
UTFPR – Campus Ponta Grossa Disciplina: Processamento de Sinais
PARA TER O SINAL DIGITAL.
Universidade federal do paraná
Bruno de Almeida de Freitas Barbosa Prof. Dr. Eduardo Parente Ribeiro
Transcrição da apresentação:

Aplicações de Processamento de Voz Prof. Marcio Eisencraft

Universidade Presbiteriana Mackenzie Sumário Introdução Modelagem básica Aplicações: Geração de fonemas Reconhecimento de fonemas Voz sintética Codificação Trabalhos presentes e futuros Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 1. Introdução Processamento de voz é um dos mais importantes instrumentos da era digital. Exemplos de aplicação: discagem automática atendimento automático auxílio de pessoas deficientes Segurança Uma das grandes áreas de pesquisa dentro da Engeharia de Telecomunicações Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 2. Modelagem básica (1/2) O trato vocal Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 2. Modelagem básica (2/2) Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3. Aplicações Geração de fonemas Reconhecimento de fonemas Voz sintética Codificação e compactação Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3.1 Geração de fonemas Trato vocal modelado como filtros digitais com atrasos e ganhos. Universidade Presbiteriana Mackenzie

3.2 Reconhecimento de fonemas (1/2) Universidade Presbiteriana Mackenzie

3.2 Reconhecimento de fonemas (2/2) Formantes e relação entre elas são tabeladas e usadas para identificar vogais e sexo do falante. Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie 3.3 Voz sintética Tendo um banco de dados com os coeficientes para cada fonema, é possível gerar voz sintética. Problema: sons são vocálicos ou fricativos. Universidade Presbiteriana Mackenzie

3.4 Codificação – Compactação Coeficientes de predição – LPC Transmite-se apenas o erro de predição ao invés do próprio sinal São necessários menos bits para a codificação Usado, por exemplo, em sistemas de telefonia digital – economia de até 50% na taxa de transmissão. Universidade Presbiteriana Mackenzie

4. Alguns trabalhos atuais e futuros Eliminação de ruído em voz (videoconferência) Sincronismo automatizado entre articulação e fala para animações Reconhecimento de voz em ambientes barulhentos Novas técnicas de compactação baseadas em percepção auditiva (wavelets) Universidade Presbiteriana Mackenzie

Universidade Presbiteriana Mackenzie Algumas Referências PICKETT, J. M. Acoustics Of Speech Communication: Fundamentals, Speech Perception Theory, And Technology. 2. ed. New Jersey: Prentice Hall. 1999. 404 p RABINER, L.R.; SCHAFER, R. W. Digital Processing of Speech Signals. 7. ed., Prentice Hall. 1978. STONICK, V. L. Labs for signals and systems: using MATLAB. PWS, c1996. BURRUS, C. S. et al. Computer-based exercises for signal processing using Matlab 5. Prentice-Hall, c1998. BEHLAU, M. S.; et al. Análise Espectrográfica de Formantes das vogais do português brasileiro. Revista ACTA AWHO, Volume VII, n. 2, p. 74-85, 1988. MONTEIRO, M. C. Uma análise espectrográfica das formantes das vogais orais do português brasileiro falado em São Paulo. 1995. 74f. Monografia (Especialização)-Escola Paulista de Medicina, São Paulo, São Paulo, 1995. Universidade Presbiteriana Mackenzie

FIM Contato: marcioft@mackenzie.br meusite.mackenzie.br/marcioft Universidade Presbiteriana Mackenzie