A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira.

Apresentações semelhantes


Apresentação em tema: "Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira."— Transcrição da apresentação:

1 Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira

2 Introdução A fala é um dos meios básicos de comunicação; Através da voz, várias informações podem ser transmitidas e interpretadas pelo homem; É evidente a necessidade de se prover equipamen- tos que utilizem a voz como meio de comunica- ção; Vantagens: Naturalidade, rapidez e liberdade para outras tarefas; Aplicação importante: reconhecimento de voz.

3 Características da Voz Fala: estrutura lingüística transmitida ao aparelho fonador. Este produz ondas acústicas que se propagam ao ouvinte; No sinal de voz, duas formas de onda podem ser observadas: sinais aleatórios de baixa amplitude (não vozeados) e sinais periódicos de alta amplitu- de (vozeados);

4 Geração da Voz Uma variação na pressão do ar nos pul- mões produz um fluxo do mesmo atra- vés da glote. Quando as cordas vocais são tensionadas, a passagem pela glote fica interrompida, modulando o ar em pulsos discretos. Parte que vai da glote aos lábios é cha- mada de trato vocal. O período de oscilação das ondas das cordas vocais é chamado de Período Fundamental (Pitch).

5 Modelo de Geração de Voz Não considera a interferência do trato vocal na fonte de geração do som; As fontes são diferentes para sons vozeados e não- vozeados; Trato vocal pode ser modelado como um filtro modelável no tempo; Assumindo g(t) como fonte e h(t) como articula- ção.

6 Modelo Digital de Gerador Gerador de Impulsos Periódicos produz sons vozeados e o intervalo correspondente ao pitch; Gerador de Números Aleatórios simula a onda for- mada pela liberação do ar contido por um bloqueio ao trato vocal; Filtro digital possui parâmetros variáveis de acordo com a transmissão do trato vocal.

7 Representação de um Sinal de Voz A forma mais básica de se representar digitalmen- te a voz é diretamente a sua forma de onda; PCM (pulse code modulation) codifica o sinal de forma linear usando um número fixo de bits por amostra; Taxa de amostragem: 20 KHz (sinal de voz abran- ge, em média 10 KHz); A informação necessária está praticamente toda abaixo de 3 KHz.

8 Variabilidade do Sinal de Voz

9 Parâmetros Importantes do Sinal de Voz A idéia fundamental da representação do sinal de voz é extrair características que descrevam as pro- priedades acústicas da voz; Medida de Energia: características da variação temporal da potência do sinal; Cruzamento por Zero: detecção dos limites das pa- lavras; Análise espectral: medida das freqüências do sinal através da Transformada de Fourier;

10 Mais Parâmetros... Análise Cepstral: estima Período Fundamental (Pitch) do sinal de voz; Codificação Linear Prediletiva (LPC): caracteriza o modelo de produção da voz utilizando parâme- tros do filtro (h(t)). Eq. Filtro Transformada Z Pólos e Zeros.

11


Carregar ppt "Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira."

Apresentações semelhantes


Anúncios Google