A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Compressão de Áudio Digital Joaquim Macedo Departamento de Informática da Universidade do Minho.

Apresentações semelhantes


Apresentação em tema: "Compressão de Áudio Digital Joaquim Macedo Departamento de Informática da Universidade do Minho."— Transcrição da apresentação:

1 Compressão de Áudio Digital Joaquim Macedo Departamento de Informática da Universidade do Minho

2 Sumário Princípios de Compressão Áudio Redundância Estatística Redundância Temporal Codificação perceptual áudio Normas de compressão áudio Norma de Compressão Áudio MPEG-1 Norma de Compressão Áudio MPEG-2 Normas de Compressão Áudio AC Comparação de Algoritmos de Compressão Formatos Áudio

3 Exemplo 7.1 Queremos transmitir áudio estéreo em tempo real num canal de 56Kbps. Considere os seguintes cenários a) Usamos uma frequência de amostragem de 44.1KHz. Quantos bits podemos usar para cada amostra áudio? b) Usamos 16 bits/amostra/canal. Qual a máxima frequência de amostragem? O que podemos fazer para evitar o aliasing c) Queremos usar uma frequência de amostragem de 44.1 Khz e 16 bits/amostra/canal. Qual a razão mínima de compressão para transmitir o sinal áudio?

4 Princípios de Compressão Áudio Redundância Estatística Mais bits para valores de amostra mais comuns Redundância Temporal Correlação entre valores de amostras vizinhas Redundância inter-amostra Redundância do Conhecimento Explorar conhecimento partilhado entre codificador e descodificador Ficheiros MIDI Propriedades do Sistema Humano de Audição Aumentar a qualidade subjectiva do sinal áudio

5 Função Taxa de Distorção Teorema de Shannon para codificação da fonte sem erros Limite na compressão sem erros Fontes áudio naturais Compressão sem perdas máxima 2:1 Compressão com perdas usada na prática Obtenção de maior razão de compressão.

6 Função Taxa de Distorção distorção d m Débito D(d m ) Codificador simples Codificador complexo Limite da teoria da informação

7 Redundância Estatística Compressão de Texto Métodos de compressão eficientes baseados na entropia Pode-se usar a mesma abordagem na compressão de áudio

8 Exemplo 7.2 Considere um sistema de aquisição áudio que tem amostras de áudio mono com resolução de 3 bits com níveis entre 0 e 7. O número de ocorrências para os oito níveis foram [700,900,1500,3000,1700,1100,800,300] Calcule e desenhe a função densidade de probabilidade para cada símbolo Calcule a entropia da fonte

9 Solução p[0] = 700/10000 = 0.07 p[1] = 900/10000 = 0.09 p[2] = 1500/10000 = 0.15 p[3] = 3000/10000 = 0.30 p[4] = 1700/10000 = 0.17 p[5] = 1100/10000 = 0.11 p[6] = 800/10000 = 0.08 p[7] = 300/10000 = 0.03

10 Sinal chord.wav Fig. 4.14(a) Fig. 7.3,pag.149

11 Redundância Estatística O método de codificação baseado na entropia Não consegue altos níveis de compressão para a maioria dos sinais áudio Mas disponibiliza bom desempenho quando aplicado a coeficientes de transformada Norma MPEG-1 utiliza codificação baseada na entropia

12 Codificação MU-LAW ghh*g* Quantificador Uniforme

13 Codificação MU-LAW Caratcterísticas de E/S com

14 Exemplo 7.3 Considere o sinal áudio chord. Quantifique o sinal uniformemente com 8 bits, utilizando a compressão com mu=255. Expanda o sinal e calcule a relação sinal- ruído (SNR). Compare a SNR com a obtida com o exemplo 4.6

15 Redundância Temporal

16 DPCM Differential Pulse Code Modulation No DPCM Uma amostra áudio é prevista com base nas amostras anteriores O valor previsto é aproximado mas diferente do valor da amostra Fórmula usada pela técnica LPC(Linear Preditive Coding)

17 Codificador DPCM Esquema simplificado Codificador Previsor Áudio original Áudio Compactado Quantificador

18 Descodificador DPCM Esquema simplificado Descodificador Previsor Áudio Reconstruído Áudio Compactado

19 DPCM

20 Exemplo 7.4 Considere o sinal áudio chord. Determine o conjunto óptimo de coeficientes de previsão de 1ª,2ª e 3ª ordem.

21 Erros de previsão

22 DPCM Depois de obtida o erro da sequência en É codificado para reconstruir o sinal perfeitamente Na codificação com perdas uma qualidade de reconstrução razoável é aceitável A quantificação é a única operação na codificação DPCM que introduz ruído

23 Exemplo 7.5 As 4 primeiras amostras duma sequência digital áudio são [70,75,80,82,...]. São necessários no mínimo 7 bits para codificar cada uma das amostras. As amostras áudio são codificadas usando o DPCM usando o previsor de primeira ordem. Os coeficientes de erro de predição são quantificados por 2 e arredondados para o próximo inteiro e armazenados sem perdas. Determine o número aproximado de bits necessários para representar cada amostra e o erro reconstruído em cada instância de amostra.

24 Codificação DPCM vários passos para a sequência [70,75,80,82,...] Instâncias deamostras 0123 Sinal original Erro do sinal = = =4.8 Erro do sinal quantificado07.1/2=46.4/2=34.8/2=2 Erro reconstruído04*2=83*2=62*2=4 Sinal reconstruído = = = 81.2 Sinal previsto para próxima amostra 70*0.97= *0.97= *0.97= *0.97 =78.8 Erro de reconstrução Nº de bits necessários7322

25 Codificação do Áudio Perceptível

26

27 Normas de Compressão Áudio Codificadores áudio de baixo débito Para telefone ITU-G.711 Defeito para ISDN 8000 amostras/seg, 8 bits/amostra Usam u-law e A-law companding ITU-G.722 Áudio de maior fidelidade Codifica 7KHz em 64Kbit/seg ITU-G.729 Voz a 8 KHz Usa uma estrutura conjugada Algebraic-Code-excited, Linear Prediction Agorithm

28 Normas de Compressão Áudio Codificadores áudio genéricos MPEG-1 Adoptada em 1992 Para áudio digital de alta fidelidade Norma de compressão genérica Pode compactar sinais áudio provenientes duma larga diversidade de fontes MPEG-2 Baseada na MPEG-1 com alguns melhoramentos MPEG-4 Compacta tanto som natural (música, voz) como sintetizado O som sintetizado pode ser representado por texto ou pela descripção de intrumentos musicais com diferentes efeitos

29 Normas de Compressão Áudio Codificadores áudio genéricos AC-2 e AC-3 Desenvolvidos pela Dolby Digital Laboratories Para codificação de áudio de alata fidelidade multi-canal

30 Norma MPEG-1 Áudio Explora as propriedades psico-acústicas do ouvido humano Taxa de amostragem áudio:32, 44.1 ou 48 KHz pode compactar: mono ou estéreo (2 canais) 3 camadas independentes de compressão Compromisso entre complexidade, relação de compressão, qualidade Camada 1 : mais simples, débitos acima de 128kbps/canal Camada 2: complexidade moderada, débito à volta de 128 bits/canal Camada 3 (mp3): maior complexidade, débitos à volta de 64 kbps/canal e oferece a melhor qualidade áudio Adequada para transmissão áudio em ISDN

31 Codificador Áudio MPEG-1 Banco de Filtros de Análise Alocação, Quantificação e Codificação de bits Formatação da sequência de bits Modelo Psico- Acústico Dados auxiliares (opcional) Sequência de bits codificada Entrada Áudio

32 Descodificador Áudio MPEG-1 Desempacotamento da sequência de bits Reconstrução da frequência de amostragem Banco de Filtros de Síntese Dados auxiliares Sequência de bits codificada Áudio Reconstruído

33 Áudio MPEG-1 Banco de Filtros Para conseguir melhor desempenho As larguras de banda dos filtros no banco de filtros devem unificar com as sub-bandas críticas Mais pequenas na gama inferior de frequências Maiores na gama superior Para simplificar o desenho do codificador Existem 32 sub-bandas de igual largura Os filtros são relativamente simples Boa resolução no tempo e uma resolução razoável na frequência O banco de filtros não é reversível Mesmo que os coeficientes de sub-banda não sejam quantificados, o sinal de áudio reconstruído não é igual ao original

34 MPEG camada 1,2 e 3 Codificação de camada Filtro sub-banda 3 Filtro sub-banda 2 Filtro sub-banda 1 Filtro sub-banda Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras 12 Amostras Agrupadas Amostras Áudio Quadro da camada 2 e 3Quadro da camada 1

35 Codificação do MPEG-1 camada 3 Banco de Filtros da Camada 1 e da Camada 2 Redução do Aliasing, Quantificação e codificação Janela MDCT MDCT Entrada Áudio PCM Áudio Compactado 1 32

36 Norma MPEG-2 Define duas normas MPEG-2 BC BC (Backward Compatible) Extensão da norma MPEG-1 Inclui codificação multi-canal e multilingue É permitida codificação a frequências abaixo de 32 KHz MPEG-2 AAC ACC (Advanced Audio Coding) Codificador áudio altamente avançado com um desempenho de compressão superior

37 MPEG-2 AAC 3 Perfis ou Modos Modo Low Complexity (LC) Aplicações em que o gargalo é a velocidade de processamento e a memória Modo Main Quando há capacidade de computação e memória disponíveis Mode SSR (Scalable Sample Rate) Quando as aplicações precisam de descodificação escaláveis.

38 Codificador MPEG-2 AAC Esquema simplificado Modelo Perceptual Processo de Controlo da Taxa de Distorção Banco de Filtros Calibragem do ruído temporal Previsão Factores de Escala Quantizador Codificação sem ruído Multiplexador da Sequência de bits Entrada do Sinal Áudio Sequência codificada de bits áudio

39 Normas de Compressão Áudio AC Áudio Digital Áudio O codificador AC-3 é largamente utilizado para transportar Áudio multi-canal em aplicações como Vídeo DVD TV Digital TV de alta definição (HDTV) Aplicações de éstudio O codificador AC-3 foi precedido por AC-1e AC-2. AC-1: Utiliza modulação delta adaptativa combinada com companding analógica. Não é um codificador perceptual. AC-2: Um codificador perceptual que usa uma transformada de baixa Complexidade TDAC (Time domain alias cancellation) transform. Usa MDCT, MDST.Àudio de alta qualidade a um débito de 256 kbps por canal. AC-3: Superior ao AC-2. Alta qualidade a 384 kbps/seis-canais

40 Codificador AC-3 Esquema simplificado Empacotador do sequência de bits Alocação de bits Qunatificador da mantissa, Vírgula flutuante em bloco Transformação TDAC Expoentes Mantissas Quantificadas Coeficientes de transformada Mantissas Áudio Codificado Amostras Áudio

41 Codificação de Expoente Os expoentes são valores de 5 bits que indicam o número de zeros da frente Os valores dos expoentes variam de 0 a 24 São codificados de forma diferencial Os diferentes expoentes são combinados em grupos no bloco áudio A Estratégia do expoente define como os diferentes expoentes são codificados

42 Descodificador AC-3 Esquema simplificado Desempacotador do expoente Alocação de bits Desempacotador da mantissa, Normalização Ponto flutuante para fixo Transformação inversa TDAC Canais 5.1 de saída Sequência de bits codificada

43 Comparação de algoritmos Débito (em Kb/seg) QualidadeAplicaçãoDisponível desde MPEG Camada Boa a 192 Kbps/canal DCC1991 MPEG Camada Boa a 256 Kbps/canal Difusão de Áudio Digital, CD-I, DVD 1991 MPEG Camada Boa a 96 Kbps/canal 1993 AC-3 Dolby32-640Boa a 384 Kbps/5.1 canais HDTV, Cabo, DVD 1991

44 Formatos Áudio típicos para armazenamento de som Extensão/ tipo de ficheiro Comentários aiffÁudio não compactado, tipicamente 16 bits/amostra. Pode ter outra resolução, tipicamente usado em Mac/Unix auUsa compressão mu-law. Usado em plataformas Sun movVídeo QuickTime mpa/mp2Formato MPEG áudio. São usadas várias camadas para compromisso entre a complexidade e o desempenho mp3Camada 3 do MPEG áudio qtFormato QuickTime. Proprietário da Apple Ra,ramFormato Real Áudio. Proprietário da Real Networks. Suporta áudio ao vivo na Internet wavÁudio não compactado, tipicamente 16 bits/amostra wmaÁudio usado no Windows Media. Proprietário da Microsoft Formatos usados para cadeias de áudio na Internet


Carregar ppt "Compressão de Áudio Digital Joaquim Macedo Departamento de Informática da Universidade do Minho."

Apresentações semelhantes


Anúncios Google