COMPRESSÃO DE FILMES GRUPO: Alessandra Antunes Vargas Anderson Konzen Débora Rampanelli Lucia S. Saldivar Dezembro/2000
Tópicos abordados Técnicas de Codificação Normas Compressão MPEG Histórico Características Principais Compressão MPEG Aplicações DVD DiVX
Introdução - Televisão Digital/HDTV - Teleconferência Compressão de Vídeo/Som é usado para: - Televisão Digital/HDTV - Teleconferência - Transmissão de Imagens em Redes de Comunicação - Armazenamento de Imagens
CODIFICAÇÃO: Principais Ferramentas Pulse Code Modulation (PCM) Preditiva Diferenças Espaciais Inter-trama Inter-trama com compensação de movimento De Transformada Entrópica
Esquemas Híbridos de Codificação Codificação de Transformada associada à transmissão de diferenças no tempo com compensação de movimento. Pulse Code Modulation (PCM) Representação discreta no tempo e discreta na amplitude.
Codificação Preditiva DPCM (Differential Pulse Code Modulation) Prediz cada amostra a ser codificada, usando valores de amostras já codificadas. Codifica apenas o erro de predição. Baseia-se no pressuposto da redundância do sinal (no espaço e/ou no tempo). Eficiência: proporcional à precisão das predições. Desvantagem: Propagação de erros, sendo necessário o uso de técnicas não preditivas.
CODIFICAÇÃO DE DIFERENÇAS ESPACIAIS Aplicado à uma imagem fixa, cada amostra é predita usando as amostras vizinhas no espaço e já codificadas. Explora a redundância espacial contida na imagem. CODIFICAÇÃO INTER-TRAMA Cada amostra k de de uma seqüência de imagens é codificada com a predição da amostra correspondente na imagem anterior, k-1. Explora a redundância temporal, transmitindo o erro onde houve mudança.
CODIFICAÇÃO INTER-TRAMA COM COMPENSAÇÃO DE MOVIMENTO Melhora da codificação inter-trama, considerando o movimento existente. Diminuição do erro de predição, a partir da detecção e compensação do movimento, baseando em imagens passadas, futuras ou ambas. Divisão das imagens em blocos, sendo cada bloco estimado em um vetor de movimento.
Exemplo
Codificação de Transformada Converte um bloco de amostras num bloco de coeficientes. Obtida através da quantificação dos coeficientes significativos em termos energéticos. Explora a correlação espacial das amostras. Maior interesse: Transformadas com interpretação na freqüência. Cada coeficiente transporta a energia de uma combinação de freqüências horizontais e verticais, correspondendo à variação espacial do sinal. Quantifica os sinais de modo seletivo, de acordo com a sensibilidade do sistema visual humano. Transformada de Cosseno Discreta: melhor desempenho em compactação de energia.
DCT DCT - Exemplo
Codificação Entrópica Atribui a cada símbolo (gerado por qualquer técnicas de compressão) uma palavra de código, tendo em conta a distribuição estatística da ocorrência dos vários símbolos. Todas as normas internacionais usam a codificação entrópica, normalmente a codificação de Huffman ou codificação aritmética. Principal aspecto: Reversibilidade
Primeira Geração de Normas de Codificação Digital de Imagem e Vídeo
Primeira Geração de Normas de Codificação Digital de Imagem e Vídeo
Principais Normas de Codificação Digital de Imagens e Vídeo ITU-R 601 - Codificação de sinais televisivos em estúdio. - Sinal de luminância, Y, e dois de crominância, U e V, amostrados a uma frequência, de 13.5 e 6.75 MHz, respectivamente. - Não estabelece qualquer método de compressão de informação limitando-se a usar PCM. ITU-T H.120 - Transmissão de videoconferência através das linhas digitais da 1ª. hierarquia. - Usa o preenchimento condicional, uma forma particular de DPCM onde se envia o erro de predição se este for superior a um dado limite. - Ainda não usava compensação de movimento. ITU-T H.261 - Codificação de sinal de vídeo com taxas de px64 Kbits/s, 1<= p <= 30. - Consagra, pela primeira vez, o esquema de codificação híbrida.
Principais Normas de Codificação Digital de Imagens e Vídeo ISO/JPEG - Codificação de imagens fixas. - Algoritmo de codificação para imagens fotográficas multi-nível (tons de cinza) ou a cores baseado na codificação de transformada. - Foram definidos quatro modos principais de operação: sequencial, progressivo, hierárquico e sem perdas. ISO/MPEG1 - Resposta à crescente procura de uma norma para gravação digital de vídeo. - Mesmo esquema de codificação híbrida que a norma H.261. - Como é usada para gravação permite que a codificação não seja em tempo real, podendo manipular-se cuidadosamente a distribuição dos recursos (bits) disponíveis, aumentando com isso a qualidade subjetiva final. - Imagens não entrelaçadas com resolução espacial CIF, a 25Hz. - Norma de codificação de áudio e norma de sistema, definindo a multiplexagem e a sincronização dos sinas de vídeo e áudio. A codificação de áudio pode ser feita segundo vários modos, usando débitos binários entre 32 e 448 kbit/s, e um ou dois canais.
Principais Normas de Codificação Digital de Imagens e Vídeo ISO/MPEG2 ou ITU-T H.262 - Norma de codificação para a televisão digitais, sinais áudio-visuais digitais. - Mesmas ferramentas de codificação que a norma MPEG1. - Destinava-se a média resolução, mas foi estendida também para alta definição. -Taxas entre 4 e 10 Mbit/s para média resolução e aproximadamente 4 vezes maior para alta definição. - Perfis (codificação) e níveis (resolução, débito binário e complexidade). - Considera para áudio taxas entre 32 e 344 Kbit/s (como a norma MPEG1), mas permite o uso de um a cinco canais de áudio. ITU- T H.263 - Melhores desempenhos que a norma H.261 para as taxas mais baixas de uso desta norma, ou seja, 64 e 128 kbit/s = melhoria da codificação híbrida. - Comunicações vídeo-telefônicas a taxas muito baixas. - Aplicações não só em vídeo-telefonia na rede analógica mas também na vídeo-telefonia em redes móveis e controle remoto áudio-visual.
A Norma ISO/MPEG4 -A Revolução Tranqüila- Áreas consideradas pela norma MPEG4 Objetivo da norma MPEG4: solução das expectativas criadas na referida convergência dos três mundos, especificando uma norma de representação de informação áudio- visual com potencialidades em termos de interatividade, elevada compressão e acesso universal. Mais ainda, de modo a levar em conta a rápida evolução dos métodos, do hardware e do software, a norma deverá apresentar boas capacidades em termos de flexibilidade e extensibilidade, ou seja, uma revolução tranqüila.
Funcionalidades da norma MPEG4 Interatividade com base nos conteúdos - capacidade de interagir com os "objetos"/conteúdos áudio-visuais da cena. - acesso a bases de dados multimídia com base em conteúdos, e a manipulação de conteúdos ou a representação integrada de informação natural e sintética Elevada compressão - codificação de cenas com múltiplas perspectivas/vistas, chamadas sequências estereoscópicas, abrindo novas perspectivas em termos do “realismo” das aplicações. - aplicações de entretenimento, de simulação de treino, por exemplo de aviões, e genericamente as apresentações multimídia, destinadas à educação. Acesso universal - escalabilidade de conteúdos: informação de vídeo organizada em termos de "objetos", tendo cada objeto maior ou menor prioridade consoante a sua importância na cena e sendo cada objeto representado de modo adequado às suas características próprias; isto significa que um objeto em movimento deverá ter maior resolução temporal do que um objeto parado na cena e vice-versa. No fundo, a escalabilidade de conteúdos implica uma "descrição organizada da cena" onde os métodos e parâmetros da representação são adaptados a cada unidade de conteúdo.
Exemplo da interatividade com base nos conteúdos: A- Original decodificada B- Decodificada e manipulada - Cada objeto é codificado em vetores de bits separados. - Forma, transparência, coordenadas espaciais,parâmetros descritivos como zoom, rotação, translação, etc. são incluídos nesse vetor de bits. - O usuário pode decodificar a sequência original ou manipulá- la através de operações simples de edição, sem a necessidade de outra codificação.
Compressão MPEG Utiliza dois tipos de métodos de compressão: Interframe - Baseada em técnicas de predição e interpolação Intraframe
Codificação Preditiva É um tipo de codificação interframe, onde apenas as diferenças entre os quadros atual e anterior são codificadas. Predição Bidirecional Também é do tipo interframe e codifica o quadro atual baseado nas diferenças entre o atual, o passado e o próximo quadro do vídeo. Este tipo de codificação interframe é chamado de motion-compensated interpolative enconding.
Tipos de quadros codificados: I-frames (codificação intraframe) P-frames (codificação preditiva) B-frames (codificação bidirecional) I-frame contém um simples quadro codificado. P-frame é construído predizendo as diferenças entre o quadro atual e o anterior I- ou P-frame. B-frame é construído dos dois mais próximos P- ou I-frames .O B-frame deve ser posicionado entre estes I- ou P-frames.
Exemplo de uma seqüência de quadros MPEG
Mas o dado MPEG não é decodificado e mostrado na mesma seqüência em que foi codificado. Por causa do B-frame se referir a dois quadros por predição, ambos quadros devem ser decodificados antes. No exemplo, o I-frame é decodificado primeiro. Mas antes dos B-frames serem decodificados, o P-frame deve ser decodificado e guardado na memória com o I-frame. Depois disso é que os B-frames são decodificados. No exemplo, a cadeia de quadros é: I B B P B B P B B I mas é decodificada assim: I P B B P B B I B B E finalmente mostrada na seqüência original.
Uma vez os quadros construídos, temos uma compressão DCT, similar à utilizada nas arquivos JPEG, onde a codificação interframe reduz a redundância temporal e a codificação DCT reduz a redundância espacial. A sincronização entre áudio e vídeo é feita através de marcadores de tempo que são afixados durante a codificação nos identificadores de blocos.
Algumas “features” do algoritmo de codificação do MPEG4 Padrão MPEG-1 Y:U:V representação de intensidade de luminância e crominância no formato 4:2:0, cada pixel quantizado em 8 bits. O tamanho do quadro e a frequência dependem da aplicação. É compatível com as codificações Intra (I), de predição temporal (P) e predição bi-direcional (B) de quadros. Baseado em blocos de 8x8 pel e/ou macro-blocos de 16x16 pel- com estimação e compensação de movimento. Codificação de textura em I, P e B-VOP's usando a DCT, seguida da quantização MPEG-1/2 ou H.261/3. Eficiente predição de DC- e AC-coeficientes da DCT em frames Intra codificados (VOP's). Pedaços de macroblocos adaptativos, marcas de movimento e tratamento de bits para ressincronização em ambientes propensos a erros.
DVD O que é DVD O caminho do CD ao DVD Novas Tecnologias (Divx)
CARACTERÍSTICAS DO DVD Primeiro meio de distribuição projetado para vídeo digital 17 bilhões de bytes (9 horas de filme) Mesmo diâmetro e espessura de um CD DVD players capazes de reproduzir CD’s Assim como o CD, durável e tolerante à pó, sujeira e impressões digitais Utiliza padrão de codificação MPEG-2
CAMINHO DO CD AO DVD Há 14 anos foi lançado o Compact Disk, que tem desfrutado de muito sucesso Música, aplicações em computação( CD-ROM), imagens(Photo CD) e vídeo games. Desde sua introdução, vemos significativos avanços na tecnologia que suporta o CD. Estes avanços tormaram-se brincadeira quando anunciada a próxima geração de meios óticos. Este foi o início do DVD.
O QUE É NOVO E DIFERENTE? O DVD suporta 4,7 Gbytes por camada Permite dupla camada em um único lado Comparação do tamanho das cavidades do CD versus DVD:
Comparação do tamanho das cavidades do CD versus DVD:
VANTAGENS DO DVD-ROM Maior capacidade Compatibilidade reversa Transferência de dados mais rápida Capacidade futura de regravação Custo acessível
DESVANTAGENS DO DVD Preocupação nas grandes empresas, no sentido de frear a falsificação e também para controlar o momento do lançamento dos filmes em cada mercado. Zonas definidas: 1) América do Norte 2) Japão, Europa, Oriente Médio e África do Sul 3) Ásia Sul 4) Austrália, Nova Zelândia, América do Sul e América Central 5) Ásia Norte e África Norte 6) China
DIVX;-) Pode ser o novo Napster para filmes Combina a tecnologia MP3 e MPEG-4 É um CODEC (programa de compressão) Usado com outros utilitários, tornaria possível copiar um filme de um DVD e gerar um filme para ser gravado num CD-ROM ou facilitar a transmissão pela internet. Mesmo com uma conexão de 1,544Mbps são necessários 45 minutos para transmitir um filme de 2 horas em DivX;-)
Já há briga na justiça por causa do decodificador DeCSS A popularidade atingida pela codificação MPEG-4, que já “transitou” para o público é enorme. O MPEG-4 poderá revolucionar a breve prazo a multimídia no mundo informático e na internet.
Bibliografia - Mitchell, Joan L.; Pennebaker, W.; Fogg, C.; LeGall, D. MPEG Video Compression Standard. ITP. 1996. - www.img.lx.pt/~fp/artigo52/artigo52.htm - www.co.it.pt/seminarios/ondulas/compressao/index.html - amalia.img.lx.it.pt/~fp/artigo92/artigo92.htm - www.bsi.com.br/bsi/servicos/servdvd.html - www.hometheater.com.br/artigos