Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouLeonardo Pedrosa Alterado mais de 10 anos atrás
1
Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira
2
Introdução A fala é um dos meios básicos de comunicação; Através da voz, várias informações podem ser transmitidas e interpretadas pelo homem; É evidente a necessidade de se prover equipamen- tos que utilizem a voz como meio de comunica- ção; Vantagens: Naturalidade, rapidez e liberdade para outras tarefas; Aplicação importante: reconhecimento de voz.
3
Características da Voz Fala: estrutura lingüística transmitida ao aparelho fonador. Este produz ondas acústicas que se propagam ao ouvinte; No sinal de voz, duas formas de onda podem ser observadas: sinais aleatórios de baixa amplitude (não vozeados) e sinais periódicos de alta amplitu- de (vozeados);
4
Geração da Voz Uma variação na pressão do ar nos pul- mões produz um fluxo do mesmo atra- vés da glote. Quando as cordas vocais são tensionadas, a passagem pela glote fica interrompida, modulando o ar em pulsos discretos. Parte que vai da glote aos lábios é cha- mada de trato vocal. O período de oscilação das ondas das cordas vocais é chamado de Período Fundamental (Pitch).
5
Modelo de Geração de Voz Não considera a interferência do trato vocal na fonte de geração do som; As fontes são diferentes para sons vozeados e não- vozeados; Trato vocal pode ser modelado como um filtro modelável no tempo; Assumindo g(t) como fonte e h(t) como articula- ção.
6
Modelo Digital de Gerador Gerador de Impulsos Periódicos produz sons vozeados e o intervalo correspondente ao pitch; Gerador de Números Aleatórios simula a onda for- mada pela liberação do ar contido por um bloqueio ao trato vocal; Filtro digital possui parâmetros variáveis de acordo com a transmissão do trato vocal.
7
Representação de um Sinal de Voz A forma mais básica de se representar digitalmen- te a voz é diretamente a sua forma de onda; PCM (pulse code modulation) codifica o sinal de forma linear usando um número fixo de bits por amostra; Taxa de amostragem: 20 KHz (sinal de voz abran- ge, em média 10 KHz); A informação necessária está praticamente toda abaixo de 3 KHz.
8
Variabilidade do Sinal de Voz
9
Parâmetros Importantes do Sinal de Voz A idéia fundamental da representação do sinal de voz é extrair características que descrevam as pro- priedades acústicas da voz; Medida de Energia: características da variação temporal da potência do sinal; Cruzamento por Zero: detecção dos limites das pa- lavras; Análise espectral: medida das freqüências do sinal através da Transformada de Fourier;
10
Mais Parâmetros... Análise Cepstral: estima Período Fundamental (Pitch) do sinal de voz; Codificação Linear Prediletiva (LPC): caracteriza o modelo de produção da voz utilizando parâme- tros do filtro (h(t)). Eq. Filtro Transformada Z Pólos e Zeros.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.