A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Compressão de Imagens: Padrão JPEG

Apresentações semelhantes


Apresentação em tema: "Compressão de Imagens: Padrão JPEG"— Transcrição da apresentação:

1 Compressão de Imagens: Padrão JPEG
PTC2547 – Princípios de Televisão Digital Guido Stolfi – 10/2013

2 Estrutura de Amostragem para Vídeo Digital

3 Taxa de Transmissão para Vídeo Digital
Luminância: 640 x 480 pontos x 30 quadros por segundo x 8 bits = 73,7 Mb/s Crominância: 320 x 240 pontos x 2 componentes x 30 quadros por segundo x 8 bits = 36,8 Mb/s Áudio “qualidade CD”: 44,1 kHz x 16 bits x 2 canais = 1,41 Mb/s Total: 112 Mb/s

4 Capacidade de Canais de Comunicação Disponíveis:
Cabo Coaxial (Modulação 64-QAM) (Relação Sinal/Ruído Maior que 30 dB) Taxa Bruta: 43 Mbits/s Taxa Líquida: 38 Mbits/s Radiodifusão / UHF (Modulação 8-VSB) (Relação Sinal/Ruído Maior que 15 dB) Taxa Bruta: 38 Mbits/s Taxa Líquida: 19 Mbits/s Satélite DTH (Direct to Home) (Modulação QPSK) Taxa Bruta: 40 Mbits/s Taxa Líquida: 18 Mbits/s (Taxa Bruta = Taxa Líquida + Códigos de Correção de Erros)

5 Codificador com Perdas
Sinal reconstruído não é exatamente igual ao sinal transmitido; Objetivo: eliminar informação a ser transmitida, desde que o erro de reconstrução seja imperceptível em condições normais de visualização.

6 Padrão de Codificação JPEG
JPEG = Joint Photographic Experts Group Comitê CCITT / ISO – Recomendação JTC1/ Padrão de Compressão de Imagens Naturais Estáticas Compressão Com Perdas (baseline) Taxa de Compressão Indeterminada A Priori Baseada em: Transformada DCT Quantização Codificação RLE Codificação Entrópica (Huffman)

7 Codificador JPEG “Baseline”

8 Decodificador JPEG

9 Desempenho do Padrão JPEG
bits/pixel qualidade da imagem reconstruída 0,083 imagem reconhecível 0,25 imagem usável 0,75 imagem excelente 2,25 indistinguível da original

10 Transformada Discreta de Cossenos (DCT)

11 Transformada Discreta de Cossenos (DCT)

12 Transformada Discreta de Cossenos (DCT)
f(x,y) = 64 elementos de imagem (8x8 pixels) F(u,v) = 64 componentes de freqüências espaciais

13 Transformada Discreta de Cossenos (DCT)
Cada coeficiente F(u,v) expressa a semelhança (correlação) entre o bloco de 8x8 pixels e uma determinada função primitiva correspondente:

14 Primitivas da Transformada Discreta de Cossenos (DCT)

15 Transformada DCT Inversa

16 Exemplo de Transformada DCT
-4 -383 -784 524 76 -128 +127

17 Exemplo de Transformada DCT
-4 -924 325 -217 184

18 Exemplo de Transformada DCT
-514 -471 195 435 -180 75

19 Exemplo de Transformada DCT
-992 -9 -42 25 32 -37 -17 44 2 11 -7 10 5 -12 54 -33 49 23 -58 20 -29 -14 35 -52 9 -24 61

20 Objetivos da DCT na Compressão JPEG
Descorrelacionar os elementos da imagem Representar a imagem em termos de componentes de freqüência espacial para posterior processamento, de acordo com as características da visão humana Simplicidade de processamento (valores reais)

21 Separabilidade da DCT F = C  B  CT onde C8x8 = .354 .490 .416 ..278
.098 -.098 -.278 -.416 -.490 ..462 .191 -.191 -.462 .462 .278 -.354 C8x8 =

22 Separabilidade da DCT DCT unidimensional:
DCT "horizontal" em uma matriz 8 x 8:

23 Separabilidade da DCT DCT "vertical" aplicada sobre os coeficientes DCT obtidos: 1024 multiplicações e 896 somas (8x8);  Algoritmos rápidos:   54 multiplicações e 468 somas e deslocamentos (DCT 8x8).

24 Quantização dos Coeficientes

25 Quantização dos Coeficientes
16 11 10 24 40 51 61 12 14 19 26 58 60 55 13 57 69 56 17 22 29 87 80 62 18 37 68 109 103 77 35 64 81 104 113 92 79 78 121 120 101 72 95 98 112 100 99 17 18 24 47 99 21 26 66 56 Q(u,v) = (Ex. Luminância ) (Ex. Crominância )

26 Dimensionamento da DCT para JPEG
MTF da visão

27 Processamento de Imagens a Cores
Imagem R,G,B é mapeada em componentes: Componentes U e V são sub-amostradas pela metade (h e v).

28 Exemplo de Codificação DCT
52 55 61 66 70 64 73 63 59 90 109 85 69 72 62 68 113 144 104 58 71 122 154 106 67 126 88 79 65 60 77 75 83 87 76 78 94 Bloco 8 x 8

29 Coeficientes DCT -415 -29 -62 25 55 -20 -1 3 7 -21 9 11 -7 -6 6 -46 8
77 -25 -30 10 -5 -50 13 35 -15 -9 -8 -13 -2 1 -4 -10 -3 2

30 Coeficientes DCT Quantizados
-26 -3 -6 2 1 -2 -4 5 -1

31 Coeficientes da DCT reconstruídos
-26 -3 -6 2 1 -2 -4 5 -1 -416 -33 -60 32 48 12 -24 -56 -42 13 80 -40 17 44 -29 18 16 11 10 24 40 51 61 12 14 19 26 58 60 55 13 57 69 56 17 22 29 87 80 62 18 37 68 109 103 77 35 64 81 104 113 92 79 78 121 120 101 72 95 98 112 100 99

32 Imagem Reconstruída Erro de Reconstrução 58 64 67 59 62 70 78 56 55 89
98 88 74 69 60 50 119 141 116 80 51 71 128 149 115 77 68 53 105 84 65 72 76 57 75 83 61 93 81 -6 -9 2 11 -1 -5 7 4 1 -3 3 9 -2 -12 -14 -4 -7 8 5 6 10 Erro de Reconstrução

33 Reconstrução de Imagem JPEG
Imagem Reconstruída Imagem Original

34 Reconstrução de Imagem JPEG
Imagem Reconstruída Imagem Original

35 Reordenação em Zig-zag
-26 -3 -6 2 1 -2 -4 5 -1 [ EOB ]

36 Codificação R.L.E. (Run-Length Encoding)

37 Codificação RLE (Run-Length Encoding )
Número de zeros anteriores Valor do coeficiente 1o. coeficiente [ 0/-3 0/1 0/-3 0/-2 0/-6 0/2 0/-4 0/1 0/-4 0/1 0/1 0/5 1/2 2/-1 0/2 5/-1 0/-1 EOB ] Símbolo

38 Codificação Entrópica (Huffman)
Dados

39 Codificação Entrópica
Símbolos de Comprimento Variável Comprimento do símbolo é tanto menor quanto maior a sua probabilidade de ocorrência Seqüência de símbolos concatenados (bit stream) é univocamente decodificável

40 Codificação dos Coeficientes Quantizados
Primeiro Coeficiente ( F(0,0) ) : Codificação Diferencial (com relação ao Bloco anterior) Valor de F(0,0)  <Prefixo : Mantissa> Prefixo definido pela Categoria (ordem de grandeza) do valor codificado Mantissa define o valor do coeficiente e o seu sinal Prefixo e Mantissa têm comprimento variável.

41 Codificação dos Coeficientes Quantizados
Demais Coeficientes (“AC” ): Tabela de Codificação (Dicionário Huffman Modificado) Código = <Prefixo : Mantissa> Número de zeros + Categoria do Coeficiente  <Prefixo> Valor do Coeficiente  <Mantissa> Códigos especiais para Fim de Bloco (EOB) e seqüências de mais de 15 zeros

42 Categorias de Codificação de Coeficientes
Faixa de Valores Categoria -1; +1 1 -3, -2; +2, +3 2 -7 a –4; +4 a +7 3 -15 a –8; +8 a +15 4 -31 a –16; +16 a +31 5 -63 a –32; +32 a +63 6 -127 a –64; +64 a +127 7 -255 a –128; a +255 8 -511 a –256; a +511 9 -1023 a –512; a +1023 A -2047 a –1024; a +2047 B

43 Prefixos para Codificação de F(0,0)
Categoria Prefixo Comprimento total (bits) Comprimento Mantissa 010 3 1 011 4 2 100 5 00 101 7 110 8 6 1110 10 11110 12 111110 14 9 16 A 18 B 20 11

44 Exemplo de Codificação de F(0,0)
Valor Código -255 -254 -253 ... -128 +128 +129 +200 +255 Ex.: Valor = +200 Representável pela Categoria 8 (faixa de valores: -255 a –128; a +255) Prefixo = Mantissa = 8 bits (vide tabela) = Concatenando ambos: +200 =

45 Tabela de Codificação para Coeficientes AC
Zeros/ Categoria Prefixo Comprim. total 0/1 00 3 0/2 01 4 0/3 100 6 0/4 1011 8 0/5 11010 10 0/6 111000 12 0/7 14 0/8 18 0/9 25 0/A 26 1/1 1100 5 1/2 111001 1/3 Zeros/ Categoria Prefixo Comprim. total 3/1 111010 7 3/2 11 3/3 14 3/4 20 ... 13/1 12 13/2 18 13/3 19 15/7 23 15/8 24 15/9 25 15/A 26 (Trechos)

46 Códigos Especiais da Tabela Huffman Modificada
Fim de Bloco (EOB) : 1010 Extensão de Zeros (seqüência de 16 zeros, correspondente ao par [15 / 0]) :

47 Codificação Huffman por Tabela de Códigos
[ 0/2/-3 0/1/1 0/2/-3 0/2/-2 0/3/-6 0/2/2 0/3/-4 0/1/1 0/3/-4 0/1/1 0/1/1 0/3/5 1/2/2 2/1/-1 0/2/2 5/1/-1 0/1/-1 EOB ] -26 0/2/-3 0/1/1 EOB Bloco original: 8x8x8 = 512 bits; Bloco comprimido: 93 bits (Compressão: 5,5 :1 = 1.45 bits/pixel)

48 Exemplo de Codificação JPEG
“Lena”, © Playboy 1972

49 Imagem Reconstruída por JPEG (~20:1)

50 Detalhes dos Efeitos da Compressão
Imagem Original (40x40) Imagem Comprimida ~20:1

51 Efeitos em Blocos Representativos de Imagens “Normais”

52 Outras Transformadas para Decorrelação Espacial
Transformada de Walsh Transformada de Hadamard Transformada de Karhünen-Loève

53 Transformada de Walsh e de Hadamard
onde bk(z) é o k-ésimo bit da representação binária de z. Funções Primitivas são binárias (+1 / -1)

54 Primitivas da Transformada de Walsh (4x4)

55 Transformada de Karhünen-Loève
Seja uma imagem representada por um conjunto de vetores estocásticos (p. ex., blocos de n pixels de uma imagem) da forma e seja o vetor médio desse conjunto; A Matriz de Covariança desse conjunto de vetores é dada por: (n  n)

56 Transformada de Karhünen-Loève
Sejam os n autovetores e correspondentes autovalores da matriz de covariança, ordenados em ordem decrescente de modo que e seja A a matriz composta pelos autovetores correspondentemente ordenados: Então a expressão corresponde à Transformada de Karhunen-Loève baseada no conjunto de vetores x.

57 Transformada de Karhünen-Loève
Propriedades da KLT: Elementos de y são descorrelacionados; Erro quadrático médio da reconstrução é minimizado; No entanto, as funções-base (matriz A) dependem do conteúdo da imagem.

58 JPEG2000 ISO/IEC :2000 Compressão por “Wavelets” Codificação Aritmética Segmentação: retângulos, planos, regiões de interesse (ROI) Desempenho: arquivos 20-30% menores para mesma qualidade

59 JPEG2000: Filtros “Wavelet”
Filtro passa-baixas + passa-altas + decimação 2:1 Independente no sentido H e V Daubechies (irreversível) ou LeGall (reversível)

60 JPEG2000: Filtragem “Wavelet”

61 JPEG2000: Filtragem “Wavelet” (1 passo)

62 JPEG2000: Filtragem “Wavelet” (2 passos)

63 JPEG2000: Filtragem “Wavelet” (3 passos)

64 Comparação com JPEG JPEG JPEG2000 0,25 bits/pixel


Carregar ppt "Compressão de Imagens: Padrão JPEG"

Apresentações semelhantes


Anúncios Google