Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira.

Slides:



Advertisements
Apresentações semelhantes
VIII Espectroscopia luz luz Método envolve: excitação detecção Fontes
Advertisements

Lista 3!!!.
Lista 3!!!.
Por que será que o som é diferente nestas duas circunstâncias?
Modelo planetário: errado Elétrons são descritos por meio de funções de onda Mecânica Quântica : probabilidades.
Ondas distúrbio / variação de uma grandeza física se propagam
Ondas distúrbio (de um meio) se propagam
INTRODUÇÃO À COMPUTAÇÃO PARALELA
Investigação de Surtos
Representação Binária da Informação
SISTEMAS DE NUMERAÇÃO Material elaborado pelo Prof. José Luiz Mendes e alterado pela Profa Janine.
IDENTIFICAÇÃO DE CÉLULAS DE DERIVA LONGITUDINAL LITORÂNEA, NAS PRAIAS DO MUNICÍPIO DE SÃO FRANCISCO DO SUL (SC). Ana Paula de Martini de Souza Bolsa voluntária.
O BIG-BANG 1a parte.
 MORAL DA HISTÓRIA?? Nesse caso, os e - de maior  contribuição importante   pressão do gás; é a chamada PRESSÃO DE DEGENERESCÊNCIA. ►►
Prof. Dr. Helder Anibal Hermini
Reconstrução filogenética: Inferência Bayesiana
1. Equivalência entre portas 2. Derivação de expressões booleanas 3
COMPRESSÃO DE FILMES GRUPO: Alessandra Antunes Vargas Anderson Konzen
Gustavo Vieira Pereira
Compressão por Hardware
DISPONÍVEL EM: tema 1.1. Elabore uma dissertação, com cerca de 20 linhas, na qual você discuta a relação do progresso tecnológico do.
Algoritmos Genéticos - Capítulo 10 Desvantagens da Representação Binária Prof. Ricardo Linden.
Técnicas de Processamento Imagens
Introdução A fim de preparar a geração de código, deve-se relacionar o fonte estático do programa às ações em tempo de execução. Durante a execução, o.
Técnicas de Processamento Imagens
Diretoria de Ensino – Região de Mogi Mirim. Questões de múltipla escolha: elaboradas por professores e analisadas por especialistas; pré-testadas; realiza.
Sensor de Proximidade Capacitivo
Sensor Fotoelétrico por Sistema de Difusão
Prof: Encoder Angular Prof:
Controle Digital Prof. Cesar da Costa 6.a Aula – Equações às diferenças.
CES-11 LAB 03 Bitmap Quadtree
Segurança de Dados no MAER.
Processamento de Imagens
Probabilidade e Esperança Condicional
Marcelo Bernardes Vieira
Intervalos de confiança Sejam X 1, X 2, …, X n i.i.d. com distribuição F. Um intervalo de confiança de nível 1– para é um par de estatísticas [T 1 (X),
Probabilidade Modelo matemático para incerteza Desenvolvimento relativamente recente –Cardano (século XVI) –Pascal (século XVII) Peter Bernstein, Against.
TÉCNICAS DE CODIFICAÇÃO DE SINAIS
MODULAÇÃO DIGITAL Evelio M. G. Fernández
CODIFICAÇÃO DE CANAL PARA SISTEMAS DE COMUNICAÇÃO DIGITAL
TE 054 CIRCUITOS ELETRÔNICOS LINEARES
TÉCNICAS DE CODIFICAÇÃO DE SINAIS
TÉCNICAS DE CODIFICAÇÃO DE SINAIS INTRODUÇÃO Evelio M. G. Fernández
PRINCÍPIOS DE COMUNICAÇÕES
TE 043 CIRCUITOS DE RÁDIO-FREQÜÊNCIA
Introdução à Codificação de Canal Evelio M. G. Fernández
AMPLIFICADORES DE POTÊNCIA TE 054 CIRCUITOS ELETRÔNICOS LINEARES
OSCILADORES SENOIDAIS TE 054 CIRCUITOS ELETRÔNICOS LINEARES
CÓDIGOS CORRETORES DE ERROS
COMUNICAÇÃO DIGITAL TRANSMISSÃO DIGITAL EM BANDA BASE Evelio M. G. Fernández
INTRODUÇÃO À TEORIA DE INFORMAÇÃO Evelio M. G. Fernández
Departamento de Engenharia Elétrica
7. INTEGRAÇÃO NUMÉRICA Parte 1
VELOCIDADE DE REAÇÃO 1.A CONCENTRAÇÃO E A VELOCIDADE DE REAÇÃO 2.A VELOCIDADE INSTANTÂNEA DE REAÇÃO 3.AS LEIS DE VELOCIDADE E A ORDEM DE REAÇÃO.
Recursividade Estrutura de Dados.
Marco Antonio Montebello Júnior
Prof: Graciano Notação Científica.
CLIMATOLOGIA.
PROTEÍNAS.
Otimização Aplicada ao Dimensionamento e Operação de Reservatórios
LINGUAGENS DE PROGRAMAÇÃO
Conceitos Básicos de Redes de Computadores e acesso a Internet
Formação de Imagem - Sampling
Robótica: Sistemas Sensorial e Motor
Antialiasing MC930 Computação Gráfica Luiz M. G. GOnçalves.
Processamento de Pixel
Prof. André Laurindo Maitelli DCA-UFRN
Introdução Ciência da Computação estudo de algoritmos –ÊNFASE ao estudo de DADOS armazenamento manipulação refinamento (a partir de dados cru) estrutura.
1 Seja o resultado de um experimento aleatório. Suponha que uma forma de onda é associada a cada resultado.A coleção de tais formas de ondas formam um.
8. Uma Função de duas Variáveis Aleatórias
Transcrição da apresentação:

Compressão de Voz Francisco Socal Tiago Peres Leonardo Silveira

Introdução A fala é um dos meios básicos de comunicação; Através da voz, várias informações podem ser transmitidas e interpretadas pelo homem; É evidente a necessidade de se prover equipamen- tos que utilizem a voz como meio de comunica- ção; Vantagens: Naturalidade, rapidez e liberdade para outras tarefas; Aplicação importante: reconhecimento de voz.

Características da Voz Fala: estrutura lingüística transmitida ao aparelho fonador. Este produz ondas acústicas que se propagam ao ouvinte; No sinal de voz, duas formas de onda podem ser observadas: sinais aleatórios de baixa amplitude (não vozeados) e sinais periódicos de alta amplitu- de (vozeados);

Geração da Voz Uma variação na pressão do ar nos pul- mões produz um fluxo do mesmo atra- vés da glote. Quando as cordas vocais são tensionadas, a passagem pela glote fica interrompida, modulando o ar em pulsos discretos. Parte que vai da glote aos lábios é cha- mada de trato vocal. O período de oscilação das ondas das cordas vocais é chamado de Período Fundamental (Pitch).

Modelo de Geração de Voz Não considera a interferência do trato vocal na fonte de geração do som; As fontes são diferentes para sons vozeados e não- vozeados; Trato vocal pode ser modelado como um filtro modelável no tempo; Assumindo g(t) como fonte e h(t) como articula- ção.

Modelo Digital de Gerador Gerador de Impulsos Periódicos produz sons vozeados e o intervalo correspondente ao pitch; Gerador de Números Aleatórios simula a onda for- mada pela liberação do ar contido por um bloqueio ao trato vocal; Filtro digital possui parâmetros variáveis de acordo com a transmissão do trato vocal.

Representação de um Sinal de Voz A forma mais básica de se representar digitalmen- te a voz é diretamente a sua forma de onda; PCM (pulse code modulation) codifica o sinal de forma linear usando um número fixo de bits por amostra; Taxa de amostragem: 20 KHz (sinal de voz abran- ge, em média 10 KHz); A informação necessária está praticamente toda abaixo de 3 KHz.

Variabilidade do Sinal de Voz

Parâmetros Importantes do Sinal de Voz A idéia fundamental da representação do sinal de voz é extrair características que descrevam as pro- priedades acústicas da voz; Medida de Energia: características da variação temporal da potência do sinal; Cruzamento por Zero: detecção dos limites das pa- lavras; Análise espectral: medida das freqüências do sinal através da Transformada de Fourier;

Mais Parâmetros... Análise Cepstral: estima Período Fundamental (Pitch) do sinal de voz; Codificação Linear Prediletiva (LPC): caracteriza o modelo de produção da voz utilizando parâme- tros do filtro (h(t)). Eq. Filtro Transformada Z Pólos e Zeros.