Guido Stolfi 1 / 46 Compressão de Áudio MPEG AAC Guido Stolfi Mackenzie 2008.

Slides:



Advertisements
Apresentações semelhantes
Representação da Informação como padrões de bits
Advertisements

Aula 3 – Transmissão Digital
PRINCÍPOS DE COMUNICAÇÕES
O Áudio (Parte I) Prof. AMOUSSOU DOROTHÉE
Sistemas Multimídia Som
Diagramas de Blocos e Graphos
Entrada e Saída Introdução.
Diagramas de Blocos e Graphos
por Fernando Luís Dotti
Wesley Barbosa Thereza
Conversão Analógica/Digital PCM
Prof. Eduardo Leivas Bastos
1 M P 3 Paulo Centoducatte Guido Araújo Rodolfo Azevedo Rafael Espíndula Valdiney Pimenta Blablabla.... Daniel Feber.
1. SINAIS Contém informações sobre uma variedade de coisas e atividades em nosso mundo físico. PROCESSAMENTO DE SINAIS Ato de extrair as informações necessárias.
1.1. CONTROLE DIGITAL SISTEMAS DE CONTROLE DIGITAL podem executar duas funções: SUPERVISÃO (externa à malha de realimentação): sincronismo de tarefas,
10. Análise de Fourier usando DFT
4. Amostragem de Sinais Contínuos no Tempo
Mel Frequency Cepstral Coefficients for Music Modeling
A Review of Algorithms for Audio Fingerprinting Autores : Pedro Cano Ton Kalker IEEE - MMSP – International WorkShop on Multimedia Signal Processing 2003.
Trabalho Final da Cadeira de Sistemas Embarcados
Comunicações Digitais
MODULAÇÃO Conceito de Modulação
Sinais e tipos de transmissão;
MODULAÇÃO POR CÓDIGO DE PULSO
Aquisição e reprodução de som
Fundamentos de Análise de Sinais
Teleinformática e Redes I
Sistemas de Radiodifusão de Áudio Digital
Compressão de Imagens em Movimento
Sistemas de Aquisição e Processamento de Dados
Sistemas e Sinais (LEIC) – Análise em Frequência
CELP Artur Benneman Rafael Henrique de Moraes Feron
Fundamentos de Análise de Sinais
Fundamentos de Telecomunicações
Compressão de Áudio Digital
Aplicações dos Bancos de Filtros
Prof. Marcelo de Oliveira Rosa
Orthogonal Frequency Division Multiplexing - OFDM
Compressão de áudio Márcio Dahia e Geber Ramalho
Processamento de sinais de áudio
Speech processing toolbox for MATLAB André Palhares
Centro de Informática - UFPE Computação Musical
Compressão de áudio Márcio Dahia e Geber Ramalho
SISTEMAS DE GERENCIAMENTO I EEA102
PROCESSAMENTO DIGITAL DE SINAIS
Modulação e Multiplexação
Síntese de voz utilizando avatares GPVoz Gabriel de Albuquerque Styve Stallone.
Comunicações Ópticas em Transmissão de Dados
1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira 8 Janeiro 2005.
1AT 2004 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição António Teixeira.
1AT 2006 Conceitos de Sinais e Sistemas Mestrado em Ciências da Fala e da Audição Edição 2006/7 António Teixeira.
Controle Digital Prof. Flávio Vidal, MSc..
Administração e Projeto de Redes
Guido Stolfi 1/155 Digitalização de Vídeo e Áudio Guido Stolfi Mackenzie 4 / 2008.
Aquisição e reprodução de som
Guido Stolfi 1/65 Percepção Auditiva Princípios de Televisão Digital Mackenzie 4 / 2008 Guido Stolfi.
Análise e Processamento de sinais fisiológicos
Princípios de Comunicação Conceitos de FM (2ª. Parte)
Faculdade de Engenharia da Universidade do Porto Licenciatura em Engenharia Electrotécnica e de Computadores Ramo de Telecomunicações, Electrónica e Computadores.
O áudio.
A música e a voz A música e a voz © 2001 Wilson de Pádua Paula Filho.
Prof. José Mauricio Neto
TV DIGITAL Paulo Ernesto Moreira 18/04/2017.
Propriedades físicas do som Vibrações e som
Processamento de Sinais
Alocação Ótima de Bits Alan Dantas de Medeiros Endalécio Diego Berg Brum Nilson Carvalho Silva Junior Victor Pereira da Costa Vitor Borges Coutinho da.
MODULAÇÃO POR CÓDIGO DE PULSO
1 Processamento de Sinais CDESC Rodolfo Araujo Victor RH/UP/ECTEP Aula 1 03/11/2010.
Compressão de Voz por Processamento Tempo - Frequência
Transcrição da apresentação:

Guido Stolfi 1 / 46 Compressão de Áudio MPEG AAC Guido Stolfi Mackenzie 2008

Guido Stolfi 2 / 46 MPEG-2 AAC (Advanced Audio Coding) Derivado do MPEG-2 Nível III 1 a 48 canais de áudio 8 a 96 kHz de amostragem Patentes: AT&T, Sony, Dolby, Fraunhofer Usado no sistema ISDB, XM Radio e DRM –Low Complexity AAC (AAC-LC) –High Efficiency (HE-AAC ou “AACPlus” –Scalable Sample Rate (AAC-SSR) –Bit Sliced Arithmetic Coding (BSAC)

Guido Stolfi 3 / 46 Diferenças do AAC x MPEG-2 Banco de filtros implementado por DCT modificada, 1024 pontos (Processamento T / F) Não é compatível com MPEG-1 Utiliza preditor linear para pré-codificação Efetua “Noise Shaping” adaptativo Pode utilizar replicação espectral (SBR) Otimização da codificação estatística dos símbolos transmitidos –Resultado: redução de 50% na taxa de bits

Guido Stolfi 4 / 46 Diagrama de Blocos da Codificação AAC

Guido Stolfi 5 / 46 Controle de Ganho LP HP LP HP LP HP Controle de Ganho (0-24 kHz) (0-6 kHz) (6-12 kHz) (12-18 kHz) (18-24 kHz) (Coeficientes)

Guido Stolfi 6 / 46 Banco de Filtros: DCT com Janela Temporal DCT (1024 / 128 Coeficientes) Janela Longa / Curta

Guido Stolfi 7 / 46 Janelas Temporais Superpostas 1 Frame (1024 Amostras) DCT Longa (2048 Amostras) 8 DCTs Curtas (256 Amostras) DCT Transição (2048 Amostras) DCT Transição (2048 Amostras) Janelas Longas Janelas Curtas

Guido Stolfi 8 / 46 Codificador com Preditor Preditor y(t) ^ ^ e(t) + - Transmissor Receptor Canal S1 S2 Eficácia do preditor reduz a energia do sinal transmitido e(t) Chaves S1 e S2 devem ser abertas em instantes apropriados

Guido Stolfi 9 / 46 Preditor Espectral Espectro de Entrada Espectro Quantizado Do Frame Anterior Erro Espectral Filtro de 2 a Ordem Filtro de 2 a Ordem Filtro de 2 a Ordem Coeficientes Espectrais P/ Quantizador

Guido Stolfi 10 / 46 Noise Shaping Q Sinal Ruído de Quantização Quantizador Q Sinal Ruído de Quantização Quantizador FF -1 Equalizador (Pré-ênfase) De-ênfase

Guido Stolfi 11 / 46 TNS – Temporal Noise Shaping F Espectro do Sinal Filtro no Domínio Da Freqüência Envoltória Espectral 1/x Equalização (Pré-ênfase) Q Quantizador Sinal com “Noise Shaping” Forma do “Noise Shaping” é Variável no Tempo

Guido Stolfi 12 / 46 Quantizador Não Linear QX 0,75 X 1,333 Fator de Escala (Frame / Freqüência) Coeficiente Espectral Coeficiente Quantizado (Restauração no Decodificador) Quantizador (Frame / Freqüência)

Guido Stolfi 13 / 46 Quantizador Não Linear s(x) s(x) 0,75

Guido Stolfi 14 / 46 Compactação dos Coeficientes Fatores de Escala: –Codificação Diferencial em relação ao Frame anterior –Resolução de 1,5 dB Quantizador: –Selecionado com resolução de 1,5 dB Fator de Escala + Quantizador: –Codificado como um símbolo conjunto –Vários dicionários (Huffmann) selecionáveis para codificação Coeficientes Quantizados: –Agrupados (2 ou 4) e codificados com um de 11 dicionários, válidos por faixas de freqüência.

Guido Stolfi 15 / 46 MPEG-4 AAC Ferramentas Adicionais

Guido Stolfi 16 / 46 MPEG-4 – Ferramentas de Codificação Codificação de Áudio Natural: –MPEG-2 AAC –SBR: Spectral Band Replication –CELP: Code Excited Linear Prediction Codificação paramétrica: –HVXC: Harmonic Vector Excitation Coding –HILN: Harmonic, Individual Line + Noise Áudio Sintético: –M-TTS: MPEG Text To Speech –SAOL: Structured Audio Orchestra Language –SASL: Structured Audio Score Language –SASBF: Structured Audio Sample Bank Format –MIDI: Musical Instruments Digital Interface

Guido Stolfi 17 / 46 SBR ( Spectral Band Replication )

Guido Stolfi 18 / 46 Decodificação SBR ( Spectral Band Replication )

Guido Stolfi 19 / 46 MPEG-4 AAC – Decodificador Paramétrico HVXC – Harmonic Vector Excitation Coding –Codificação de Voz, 1.2 a 4 kb/s –Amostragem: 8 kHz –Processamento: Frames de 20 ms (160 amostras) HILN – Hamonic and Individual Line + Noise –Voz e música, > 4 kb/s –Usa PNS (Perceptual Noise Substitution)

Guido Stolfi 20 / 46 MPEG-4 AAC – Decodificador Paramétrico Modo de Codificação: PARAmode = 0 HVXC 1HILN 2 Comutado HVXC / HILN (fading 20 ms) 3Combinado HVXC / HILN

Guido Stolfi 21 / 46 Decodificador HVXC Sinais Vocálicos: –Quantização Vetorial da envoltória espectral dos resíduos da codificação LPC (VQ) Sinais Não Vocálicos: –Codificação por Excitação Vetorial (VXC)

Guido Stolfi 22 / 46 Conceitos Básicos Vocoder LPC (Linear Predictive Coding) Quantização Vetorial (VQ) Decodificação Excitada por Código Síntese harmônica PNS (Perceptual Noise Substitution)

Guido Stolfi 23 / 46 Síntese Básica de Voz (Vocoder) freqüência ganho ruído formantesvogais

Guido Stolfi 24 / 46 Síntese por LPC (Linear Predictive Coding) Preditor y(n) ^ ^ e(n) + - (Filtro Linear) Receptor Canal S1 S2 Transmissor LMS Algoritmo de Ajuste do Filtro Preditor Coeficientes do Filtro Exemplo de Filtro FIR:

Guido Stolfi 25 / 46 Quantização Vetorial Conjunto N-dimensional de valores de entrada é quantizado como um vetor (de N dimensões), escolhido entre um conjunto de M vetores possíveis, de acordo com um critério de “mínima distância”; A lista dos M vetores possíveis é o “dicionário de vetores” (codebook); O conjunto de valores de entrada é convertido em um número (índice) que identifica o vetor quantizado dentro da lista.

Guido Stolfi 26 / 46 Quantização Vetorial M Ganho Índice m Sinal de Entrada V Q (m) E Q (m) Vetor quantizado é dado pelo índice m para o qual foi obtido o menor erro de quantização E Q (m).

Guido Stolfi 27 / 46 Decodificação Excitada por Código M Filtro LPC Ganho Índice Resíduo (erro de predição) Coeficientes LPC Saída Vetor de Excitação

Guido Stolfi 28 / 46 Síntese Harmônica M Ganho Índice Freqüência Interpolador Resíduo Preditor LPC Coeficientes LPC Envoltória Espectral Envoltória Espectral Interpolada Espectro de Saída

Guido Stolfi 29 / 46 PNS (Perceptual Noise Substitution) M Ganho Índice Ruído Branco Interpolador Componentes harmônicas Envoltória Espectral Envoltória Espectral Interpolada Ruído perceptual Espectro composto

Guido Stolfi 30 / 46 Decodificador HVXC (Line Spectral Pairs)

Guido Stolfi 31 / 46 Decodificador HVXC Excitação Vocálica do Decodificador HVXC

Guido Stolfi 32 / 46 Codificador HVXC

Guido Stolfi 33 / 46 Codificador HILN

Guido Stolfi 34 / 46 Decodificador MPEG-4 CELP

Guido Stolfi 35 / 46 Modos de Operação MPEG-4 CELP Taxa de Amostragem de 8 kHz: –Quantizador Vetorial –Taxas de Bits de 3850 a bps Taxa de Amostragem de 16 kHz: –Quantizador Escalar –Taxas de Bits continuamente variáveis de a bps e de a bps

Guido Stolfi 36 / 46 Ferramentas Específicas do Decodificador CELP MPEG-4

Guido Stolfi 37 / 46 Requisitos Computacionais Típicos (MPEG-4) f A (kHz) MOPSkWords AAC Principal4855 AAC-LC4833 AAC-SSR4843 LTP4844 AAC Escalável4854 VQ Duplo2423 CELP CELP8/1631 HVXC821

Guido Stolfi 38 / 46 Áudio Sintético Síntese Musical –SAOL: Structured Audio Orchestra Language –SASL: Structured Audio Score Language –SASBF: Structured Audio Sample Bank Format –MIDI: Musical Instruments Digital Interface Síntese de Fala –TTS (Text To Speech)

Guido Stolfi 39 / 46 Modelo de Síntese Musical

Guido Stolfi 40 / 46 Elementos da Sintaxe SASBF Geradores de: –Índice: apontam para outra estrutura de dados –Range: indicam uma faixa de valores onde um parâmetro (nota, intensidade) é definido –Substituição: atribuem um valor numérico a um evento –Amostra: afetam as propriedades de um som amostrado –Valor: afetam diretamente parâmetros do som sintetizado.

Guido Stolfi 41 / 46 Gerador de Amostra Start StartLoop EndLoop End SampleID PITCH: Afeta freqüência de amostragem, após modificado por Vibrato, Modulação etc.

Guido Stolfi 42 / 46 Sintaxe MIDI ( Musical Instruments Digital Interface ) Canal MIDI: 1 a 16 – identifica módulo que deve receber o comando. Note ON: identifica o Canal MIDI, a nota musical (0 a 127) e a velocidade de acionamento (1 a 127, associada geralmente à intensidade). Note OFF: idem, com velocidade de “desacionamento”. Controlador: CC 0 a 127: atribui valores contínuos (14 bits) a parâmetros pré-determinados (volume, pitch bend, filtro, etc.) Program Change: seleciona configuração pré-programada para conjunto de parâmetros de síntese (ex. General Midi estabelece lista de instrumentos padronizados).

Guido Stolfi 43 / 46 Sintaxe MIDI ( Musical instruments Digital Interface ) Aftertouch: parâmetro que afeta uma nota de um dado canal, após o evento Note ON (p. ex, alterando a modulação ou intensidade). System Exclusive: Informação específica para um determinado equipamento (p. ex., programação de parâmetros). Standard Midi File (SMF): seqüência de comandos MIDI com informaçoes de temporização relativa entre os comandos

Guido Stolfi 44 / 46 Mensagem MIDI 1000nnnn “Note ON”Canal = n+1 0kkkkkkk Nota k (64 = Dó Central) 0vvvvvvv Velocidade (0 = Note OFF) Comando / Dado

Guido Stolfi 45 / 46 Codificador MPEG-4 TTS ( Text To Speech )

Guido Stolfi 46 / 46 Aplicação do Codificador TTS Sintetizador de Voz Sintetizador Facial Controlador DMUX Base de Dados (Histórias) “Contador de Histórias” sob demanda