A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Conceitos Básicos em Codificação com Perdas Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital.

Apresentações semelhantes


Apresentação em tema: "1 Conceitos Básicos em Codificação com Perdas Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital."— Transcrição da apresentação:

1

2 1 Conceitos Básicos em Codificação com Perdas

3 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II2 Em codificação sem perdas: Limite da taxa de compressão atingível (em bits/símbolo) é dado pela entropia da fonte de acordo com a Teoria da Informação de Shannon. Em codificação com perdas: Há um compromisso entre a taxa de compressão e a qualidade do sinal reconstruído.

4 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II3 Codificação com perdas: Maior distorção possível: Perda total do sinal Taxa de compressão máxima! Isto é, não necessita enviar dado nenhum. Menor distorção possível: Codificação sem perdas Taxa de compressão dada pela entropia da fonte. Teoria da Distorção pela Taxa (Rate Distortion Theory)

5 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II4 Otimizar um codificador: Obter a menor distorção possível para uma dada taxa de compressão. (imposição do meio de armazenamento ou canal de comunicação) Como medir a distorção??

6 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II Critérios de Distorção O que é a distorção?? É uma medida de quanto o sinal reconstruído se diferencia do sinal original. A fidelidade da reconstrução depende do usuário final. Medidas subjetivas: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político.

7 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II6 Medidas subjetivas da distorção: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político. Baseado em escores: Excelente, ótimo, bom, aceitável, ruim, péssimo, inaceitável, horroroso, pior que isso não poderia ser, etc.

8 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II7 Problemas com este tipo de medida: Difícil de se computar, pois depende muito de pessoa para pessoa. Para se obter uma medida independente de gostos, deve-se trabalhar com um número muito grande de pessoas. O que torna a medida muito complicada e trabalhosa de ser realizada. Logo: definição de medidas objetivas da distorção facilita muito o projeto dos codificadores.

9 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II8 Medidas objetivas da distorção: Geralmente baseadas em erros entre o sinal original e o reconstruído: Onde: É a distorção de ordem p entre o sinal original x e o sinal reconstruído y. N é o número de componentes (dimensões) dos sinais.

10 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II9 Média das diferenças absolutas Medidas mais comuns: Erro médio quadrático (EMQ) Mean Squared Error (MSE) Distância Euclidiana ao quadrado.... Erro máximo. Usado em casos onde o erro só é percebido Acima de um determinado limiar (threshold)

11 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II10 Considerando que a distorção imposta ao sinal original como sendo um ruído de codificação: Podemos ter medidas baseadas na relação Sinal-Ruído Energia do Sinal Energia do Ruído (d 2,EMQ,MSE) Medida em dB Relação sinal ruído de pico Muito usado em imagem: x 2 max =255 2

12 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II11 Medidas Objetivas: Matematicamente tratáveis. Não incorpora os aspectos da fidelidade perceptível do ponto de vista humano. Vimos 2 formas de medidas da fidelidade da reconstrução: Medidas Subjetivas: Medidas precisas da fidelidade baseada nos aspectos e limitações humanas. São matematicamente difíceis de se manusear e usar no projeto de codificadores.

13 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II12 Medida ótima? Aquela que modela matematicamente as limitações humanas. Porém essas limitações (de ordem biológica) são difíceis de se determinar matematicamente, logo usa-se aproximações e modelos. Ex.: Sistema Visual: modelo do olho e percepção de imagens e vídeo Sistema passa baixas com persistência temporal. Razão de Weber: Sistema Auditivo: modelo do ouvido e percepção de sons. Limitação 20Hz a 20KHz com resolução de 1000:1 1kHz a 20dB percepção semelhante a 50Hz a 50dB Mascaramento de nível sonoro e mascaramento espectral

14 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II Teoria da Distorção pela Taxa Ex.: 2 se cruzando (MPEG1 e MPEG2)

15 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II14 Problema: Como calcular a função Distorção(Taxa) R(D) ? - Resultado depende do modelo usado Ex.: Fonte Gaussiana e distorção medida pelo erro médio quadrático:

16 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II15 A função R(D) da distribuição Gaussiana possui a propriedade de ser a maior função R(D) para qualquer outra distribuição que possua a mesma variância ( 2 ). Logo pode ser vista como um limite superior. Shannon demonstrou em seu artigo de 1948 que o limite inferior da função R(D) para uma variável aleatória contínua medida pelo erro médio quadrático, é dada por: Onde h(X) é a entropia diferencial da variável X

17 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II16 Problema: Para sinais reais é difícil definir sua função distribuição de probabilidade e assim calcular h(X). Para distribuição Gaussiana: Prova-se que h(X) da distribuição gaussiana é maior que qualquer outra h(X) para a mesma variância ( 2 ).

18 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II Modelos Modelos Probabilísticos Distribuição Uniforme: Distribuição Gaussiana: Distribuição Laplaciana: Distribuição Gamma: Mais usada Mais centrada em zero, Ex.: voz, dif. imagem Mais centrada ainda em zero, menos tratável modelo da ignorância

19 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II18

20 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II Modelos baseados em Sistemas Lineares Uma grande classes de processos podem ser modelados pela Equação de Diferenças: Onde x n são as amostras do processo que desejamos modelar e n é uma sequência de ruído branco. Em DSP nada mais é que um filtro digital com N pólos e M zeros. Em estatística é chamado um modelo média móvel autoregressivo (ARMA – Autoregressive Moving Average) ARMA(N,M)

21 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II20 Se todos os b j forem zero. Fica apenas a componente autoregressiva. Que é um filtro IIR com apenas pólos (all-pole) e também chamado modelo autoregressivo de ordem N, AR(N), muito usado em compressão de voz. Como a amostra atual depende apenas das N amostras anteriores: Isto significa que um AR(N) é um processo de Markov de ordem N. Ver exemplos no livro.

22 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II Modelos Físicos Modelos baseados na física da fonte do sinal. Geralmente complicados e não bem tratáveis matematicamente. Uma exceção é a geração de voz que será vista em detalhes oportunamente.

23 22 Quantização Escalar

24 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II23 Quantização Escalar Definição: Representar uma infinidade de valores em um conjunto limitado de códigos; ou seja, poucos códigos de saída para muitos valores de entrada; Mais simples métodos de compressão com perdas; Ex: Valores de amostras entre -10 e 10:

25 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II24 Quantização Escalar Esquema do quantizador: Representar o valor de cada entrada em uma saída com o valor do numero inteiro mais próximo: -2,47 -2,0 3, ,0 4,5 4,0 ou 5,0 (aleatoriamente).

26 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II25 Quantização Escalar Para os infinitos valores entre -10 a 10, o alfabeto de saída se reduz a apenas 21 valores: {-10,.....,0,.....,10} Quando um valor de saída é 3, qual foi a sua entrada? 2.95 ? ?2,51 ?

27 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II26 O Problema da Quantização O compressor divide a faixa de entradas em intervalos, {-10,.....,0,.....,10}; Intervalo = palavra de código; Como vários valores de entrada podem cair em um mesmo intervalo, o código somente informa que a amostra pertence aquele intervalo. 8,01 código x 1 8 8,20 código x 2 8 7,51 código x 3 8

28 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II27 O Problema da Quantização Esta perda de informação é irrecuperável; Também chamado de Ruído de Quantização. Como o código representa um intervalo, então o decodificador gera um valor que melhor represente os valores do intervalo.

29 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II28 Quantização Escalar Quando as entradas são analógicas, o processo é também conhecido como conversão analógico-digital A/D. A reconstituição do código em valor analógico se chama conversão digital-analógico D/A. Aplicação mais conhecida: Digitalização de áudio, PCM30 (telefonia)

30 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II29 Quantização Escalar Códigos Saída , , , , , , , ,5 Definição dos intervalos de entrada e os respectivos códigos. Valores de saída para os códigos (níveis de reconstrução).

31 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II30 Quantização Escalar Ex: f(t) = 4.cos(2 t), com amostras a cada 0,05 s

32 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II31 Ruído de Quantização Definição: q 2 = msqe: é a média quadrada da diferença entre a entrada [x] e a saída [y = Q(x)] do quantizador. onde: f X (x) = função probabilidade da entrada M = número de intervalos msqe = mean squared quantization error.

33 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II32 Taxa do Quantizador Para palavras código fixas, o próprio comprimento do código especifica a taxa do quantizador. Se o número de saídas do quantizador é M então a taxa é dada por: R = log 2 M Em códigos de tamanhos variáveis, a taxa é função da probabilidade de ocorrência de cada código, e do seu respectivo comprimento[ l i ]:

34 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II33 Quantizador Uniforme Intervalos igualmente espaçados (entrada e saída) Idem para os limites de decisão e valores de reconstrução. Espaço = Quantizador Midrise Não possui o nível 0 Número de saídas pares Quantizador Midtread Possui o nível 0 Número de saídas impares

35 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II34 Quantizador Uniforme e Fonte Uniforme Fonte uniformemente distribuída pelo intervalo. Intervalo [ -X max, X max ] dividido em M partes iguais ( ) Ruído de quantização para fonte uniforme: q = x - Q(x)

36 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II35 Quantizador Uniforme e Fonte Uniforme O ruído de quantização se torna: Assumindo que a variância dos valores de entrada no intervalo [ -X max, X max ] é:

37 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II36 Quantizador Uniforme e Fonte Uniforme SNR: Signal Noise Ratio ou Razão Sinal Ruído: SNR = 6,02.n [dB] A cada bit adicionado (n) no quantizador, ocorre um aumento de 6,02 dB na razão sinal ruído. A cada bit retirado do esquema do quantizador, o ruído inserido é 4 vezes maior que o esquema anterior.

38 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II37 Compressão de Imagens Modelo de probabilidade para imagens: quase impossível Aproximação Pixels distribuídos entre: 0 e 2 b -1, onde b é o número de bits por pixel. Assume-se que os valores dos pixels variam de 0 a bit/pixel dividir [0, 255] em [0, 127] e [128, 255]; com limites de decisão [0, 128, 255] e valores de reconstrução {64, 196}. 2 bit/pixel limites de decisão [0, 64, 128, 196, 155] e valores de reconstrução {32, 96, 160, 224}.

39 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II38 Imagem Original 1 bit/pixel 2 bits/pixel 3 bits/pixel

40 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II39 Nota-se que para distribuições não uniformes, a divisão das entradas e saídas em partes igualmente separadas não é satisfatória.

41 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II40 Erros de Combinação Diferenças entre os modelos escolhidos e os modelos reais. 1º caso: Variância assumida Variância real. 2º caso: Modelo de distribuição Tipo do quantizador. ideal Modelos de distribuição Parâmetros da distribuição {

42 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II41 Erros de Combinação Variância assumida Variância real. Quantizador uniforme com distribuição Gaussiana

43 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II42 Erros de Combinação Modelo do quantizador não casa com o modelo da distribuição

44 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II43 Quantização Adaptativa Eliminar problemas de erros de combinação Adaptar o quantizador ( ) em relação à estatística da fonte. Método I: Forward Adaptive Quantization Método II: Backward Adaptive Quantization

45 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II44 Forward Adaptive Quantization Passos: Fonte dividida em blocos de dados, Parâmetros analisados e ajustados antes da quantização, Dados + ajustes enviados. Desvantagens: Atraso por processamento dos blocos, Envio de informação lateral. Ponto ótimo entre: Blocos pequenos Muita informação lateral Blocos extensos Demora no processamento

46 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II45 Exemplo 8.5.1: Palavra test, digitalizada com 8000 amostras/s e 16 bits/amostra. Comprimida com quantização de 6 níveis (3 bits). Perda de resolução na amplitude. Quantização uniforme.

47 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II46 Blocos de 128 amostras Obtenção do desvio padrão dos blocos e quantizado com 8 bits. Amostras normalizadas com o desvio padrão.

48 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II47 Exemplo 8.5.2: Blocos de 8 x 8 pixels, 3 bit Forward Adaptive Uniform Quantization, Informação lateral: Valores máximos e mínimos dos bloco (8x8) = 8 bits. 3 bits/pixel

49 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II48 Backward Adaptive Quantization Análise de amostras quantizadas antigas. Como obter informação de erro somente com a saída do quantizador, e sem conhecer o valor da amostra original? A noção do erro na distribuição das saídas se dá por uma extensa análise da própria saída do quantizador.

50 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II49 Backward Adaptive Quantization Quando a distribuição de entrada combina com o quantizador, tem-se o ideal. Caso contrário, varia-se o tamanho de. Se < ideal, a maioria das amostras incidirão nos níveis mais elevados do quantizador,. Se > ideal, a maioria das amostras incidirão nos níveis mais baixos do quantizador,. Outros: Ex.: Quantizador de Jayant

51 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II50 Quantização Não Uniforme Distribuição concentrada próximo à origem Vantagem: Reduz a distorção onde a distribuição é mais densa (mais informação). Desvantagem: Erros maiores na região de baixa probabilidade de amostras.

52 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II51 Quantização Não Uniforme menor na região próxima à origem, aumenta ao se afastar da origem, Quanto mais afastado da origem, maior o ruído de quantização. Porém o seu msqe é menor que em um quantizador uniforme. Construção mais complexa, Definir os limites de decisão e níveis de reconstrução que minimizam o msqe.

53 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II52 Quantização Não Uniforme

54 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II53 Quantização Ótima ou Lloyd-Max Encontrando {y j } e {b i }: Os valores de reconstrução são os centros das probabilidades em um determinado intervalo. Os limites de decisão são os pontos centrais entre dois valores de reconstrução vizinhos. Como estimar f X (x)?

55 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II54 Companded Quantization Variar proporcionalmente à probabilidade da distribuição. A entrada é mapeada por uma função compressora Expande as regiões onde a probabilidade é maior e encolhe onde é menor. Quantizada por um quantizador uniforme. Para a saída os valores quantizados são expandidos para voltar voltar à sua forma original.

56 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II55 Companded Quantization Função similar à do quantizador não uniforme.

57 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II56 Padrões conhecidos: Lei Compressão em 8159 intervalos de igual amplitude Fator de compressão 0 ~ 255 Usado em Telefonia = 255 EUA e Japão Lei A Compressão em 4096 intervalos de igual amplitude Fator de compressão 1 ~ 100 Usado em Telefonia A = 87,6 Europa e Brasil

58 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II57 Entropy-Coded Quantization Atribuição de códigos aos intervalos de quantização. Taxa do quantizador é o fator de desempenho do processo. Para um quantizador Lloyd-Max de 32 níveis é preciso: 5 bits por amostra se a taxa for constante, 3,799 (entropia) para distribuição Laplaciana. Loyd-Max

59 58 QUANTIZAÇÃO VETORIAL

60 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II59 Eu quis saber apenas como as coisas foram unidas."

61 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II60 Quantização Vetorial Vimos que em codificação sem-perdas, a codificação de sequências de símbolos é mais eficiente que a codificação dos símbolos independentemente. Em codificação com perdas temos a mesma idéia. Isto é: Para uma dada Taxa temos menor Distorção Para uma dada Distorção temos uma menor Taxa

62 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II61 Procurar tirar vantagem da estrutura da fonte. Vetor = sequência ou blocos de amostras Vetor L-dimensional corresponde a L amostras do sinal a ser codificado. Dicionário de Códigos : CodeBook Codewords (ou Codevectors) de Tamanho K e Dimensão L

63 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II62 Quantização Vetorial - Funcionamento Codificação: Agrupamento das amostras; Busca da melhor Codeword; Transmissão do Índice do Codebook; Decodificação: Lookup Table; Desagrupamento;

64 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II63 Algumas definições Unidade de medida bits por amostra; Tamanho do codebook K; Dimensão do vetor de entrada L; Exemplo: Codebook C com K Codewords; O número de bits por vetor : log 2 K; Taxa de quantização de (log 2 K)/L [bits/amostra] Medida de distorção: usaremos o erro quadrático; A codeword Y j será a melhor representação do vetor X se:

65 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II64 EXEMPLO: Entrada (peso, altura); Peso: variação uniforme, 40~80; Altura: variação uniforme de 40~240 Quantização Escalar: bits = 6 bits Vantagem da Quantização Vetorial sobre a Escalar Quanto a distorção? Quanto a eficiência? Flexibilidade?

66 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II65 1- Comece com um conjunto inicial de valores de reconstrução onde: fixa-se k=0, D (0) =0. Define-se o Threshold O algoritmo de Lloyd Quantização Escalar 2- Determine os limites de decisão: j= 1, 2, 3,..., M Compute a distorção: 4- Se D(k)-D(k-1)<, pare, caso contrário, continue; 5- k=k-1, Calcular os novos valores de reconstrução; Volte ao passo 2;

67 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II66 Generalização do Algoritmo de Lloyd (GLA) Quantização Vetorial 1- Comece com um conjunto inicial de valores de reconstrução {Y i (0) } i=1 M onde: fixamos k=0, D (0) =0. Definindo-se o Threshold. 2- Determine a região de quantização: V i (k) ={X:d(x,Y i ) < d(X,Y i ) j i} i=1, 2,..., M-1; 3- Determine a distorção: 4- Se:; pare, caso contrario, continue; 5- K=K+1. Determinar os próximos valores de reconstrução para {Y i (k) } i=1 M como as centróides do conjunto {V i (k-1) } Retorne ao passo 2.

68 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II67 O Algoritmo Linde-Buzo-Gray (LBG) - Publicado em É uma implementação prática do Algoritmo de Loyd Generalizado; - - Semelhante ao K-Means

69 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II68 Algoritmo K-means - -Muito usado em Reconhecimento de Padrões - -Definição: Seja um grande conjunto de amostras, chamada sequência de treino (ST) e um conjunto de k amostras representativas desta ST. Aloque a cada amostra da ST a uma das k amostras representativas, através de alguma medida de distância. Atualize o valor das k amostras representativas pela centroide (média) dos vetores que foram alocadas a cada uma.

70 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II69 Treinado os vetores 1- Comece com um conjunto inicial de valores de reconstrução {Y i (0) } i=1 M e os vetores de treinos {x n } n=1 N, defina k=0, D (0) =0. Define-se o Threshold 2- As região de quantização: {V i (k) } i=1 M são dadas por V i (k) ={X n : d(x n,Y i ) < d(Xn,Y i ) j i} i=1, 2,..., M; obs: Assumimos que nenhuma das regiões de quantização estão vazias 3- Determine a distorção média D (k) entre os vetores de treino e o valor de reconstrução; 4- Se:; pare, caso contrario, continue; 5- k=k+1. Calcule novos valores de reconstrução {Y i (k) } i=1 M como a média dos vetores de cada região de quantização {V i (k-1) } Retorne ao passo 2.

71 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II70 Inicialização do LBG Um dos problemas encontrados é que o codebook projetado é extremamente dependente do conjunto inicial escolhido. Alternativas para a inicialização: Vetores Randômicos Escolha randômica a partir da ST Pairwise Nearest Neighbor (PNN) Split (proposto em conjunto com o LBG)

72 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II71 Exemplo do algoritmo LBG com Split. Vetores de treino dentro da região rosa.

73 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II72 Problema que pode aparecer no LBG Surgimento de região vazia = nenhum vetor alocado à codeword Solução: substituir a codeword por outra que atenda a um dos critérios: Seleção da centróide da região com maior número de vetores Seleção da centróide da região com maior distorção (MSE) Para que seja spliteada.

74 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II73 Uso do LGB na compactação de imagem - Utilização de blocos de pixels de tamanho NxM - Vetor de treinamento dimensão L=N.M com N=M

75 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II74 Quantização da imagem Sinan -Dimensão do vetor 16 = Blocos de 4x4 pixeis; - Codebook de tamanho 64, 256, e 1024

76 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II75

77 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II76 Taxa de compressão para cada codebook; índice: (log 2 k) bits; L : dimensão do vetor taxa (log 2 K)/L bits/pixel Coodebook: BxLxK bits imagem: 256x256 pixels

78 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II77 Como definir a Sequência de Treino?

79 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II78 Problemas da Quantização Vetorial A teoria da Distorção pela Taxa de Shanon diz que, para uma mesma taxa, quanto maior a sequência (dimensão) menor é a distorção. Isso implica que: codificar com codebook de L=8 e k=16 (0.5 bits/amostra) gera mais distorção que usar um codebook de L=20 e k=1024 (0.5 bits/amostra) Se quisesse: 4x4 pixels a 2 bits/pixel: qual K? Problemas: Aumento da memória necessária ao CodebookAumento da memória necessária ao Codebook Aumento da complexidade computacional na codificaçãoAumento da complexidade computacional na codificação

80 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II79 Soluções Métodos de Busca Rápida da melhor codeword Distância Parcial (codebook ordenado) Desigualdade Triangular (pontos de âncora) KD-Tree (pode errar!) outros... Quantização Vetorial Estruturada: Tree-Structured VQ Piramid VQ Lattice VQ outros...

81 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II80 Variações sobre VQ Gain-Shape VQ Normalizar as codewords e enviar, além do índice, o Ganho a ser usado quantizado escalarmente. Mean-Removed VQ Retirar a Média das codewords e enviá-la quantizado escalarmente.

82 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II81

83 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II82 Classified VQ Classificar a entrada em classes definidas e treinar um codebook para cada classe. (ex.: bordas e homogêneo) Q1 Q2 Q3 Q4 Classificador índice1+indice2 Vetor

84 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II83 Multistage VQ Usar cascata de VQs para quantizar os erros das etapas anteriores

85 Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital de Sinais II84 Adaptive VQ Codebook Adaptativo Conjunto de Codebooks Forward e Backward approaches Entropy Coded VQ índices do codebook codificados com códigos de tamanho variável, dependente da probabilidade de ocorrência.


Carregar ppt "1 Conceitos Básicos em Codificação com Perdas Setor de Tecnologia Universidade Federal do Paraná Dep. Engenharia Elétrica TE073 – Processamento Digital."

Apresentações semelhantes


Anúncios Google