Compressão de Imagens em Movimento

Slides:



Advertisements
Apresentações semelhantes
Gerenciamento do Tempo do Projeto
Advertisements

A Imagem (Parte II) Prof. AMOUSSOU DOROTHÉE
Algoritmo para codificação em bitrate constante Vinicius Kursancew.
NFIS NFSEG Four Finger Plain Segmentation. NFSEG Os conjuntos físicos de dados são cartões de impressão dos 10 dedos rolados e os 4 dedos planos mais.
O Vídeo (Parte II) Prof. AMOUSSOU DOROTHÉE
Operações envolvendo imagens
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ANÁLISE DISCRIMINANTE
INSTALAÇÕES ELÉTRICAS I
Introdução à Programação usando Processing Programação Gráfica 2D Animações Exercício Animações 14/10/09 Bruno C. de Paula 2º Semestre 2009 > PUCPR >
14/10/09 Uma animação possui: Início; Passo; Fim; 1.
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA.
Listas Encadeadas CONTEÚDO (1) Motivação (2) Definição (3) Operações
10º CAPÍTULO Segmentação de imagem.
Conceitos fundamentais
FEUPDEECRedes de Computadores, 4º Ano de EEC, ramo de ACI TCP (Transmission Control Protocol) Abril, 98Isidro Vila Verde 1 Aspectos Gerais.
1 Camada de redes: Interoperabilidade com IP. 2 Enlaces entre duas máquinas.
William Stallings Arquitetura e Organização de Computadores 8a Edição
Gerenciamento de tempo do projeto
Circuitos Lógicos Sequenciais
Conversão Analógica/Digital PCM
1 M P 3 Paulo Centoducatte Guido Araújo Rodolfo Azevedo Rafael Espíndula Valdiney Pimenta Blablabla.... Daniel Feber.
Estatística 8 - Distribuições Amostrais
Endereçamento de hardware e identificação de quadros
6. Estruturas p/ Sistemas Discretos
Equipamentos 3/25/2017 Equipamentos Computação Gráfica - Gattass.
Estrutura e movimento a partir de imagens
INTRODUÇÃO À PROGRAMAÇÃO
Trabalho Final da Cadeira de Sistemas Embarcados
Camos – Terminologia Ponto diretor Ângulo de pressão Circunferência
Projeto de Sistemas Operacionais
Capítulo 7 Multimídia 7.1 Introdução à multimídia
Formato de arquivo de Vídeo
ESCOLA DE CIÊNCIA DA INFORMAÇÃO CURSO DE BIBLIOTECONOMIA
1 Universidade Federal de Minas Gerais JPEG Alessandra e Aline.
Sistemas de Tempo Real: Abordagens de Escalonamento
1 Aula 7 ImplementandoSubprogramas Universidade do Vale do Rio dos Sinos
Fundamentação Teórica
Lista Encadeada Circular Lista Duplamente Encadeada
Stream-Oriented Communication
Listas Encadeadas.
Contagem de Pessoas por Vídeo Usando Câmeras em Posição Zenital
Davyd Bandeira de Melo Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM Junho 2011.
Compressão de Imagens em Movimento
© 2011 Pearson Prentice Hall. Todos os direitos reservados.slide 1 © 2011 Pearson Prentice Hall. Todos os direitos reservados.slide 1 © 2011 Pearson Prentice.
Televisão: a tecnologia por detrás do écran
Defesa de Mestrado Bruno Zatt Sergio Bampi Orientador
Processamento Digital de Imagens
Compressão de Textos Juliano Palmieri Lage.
Sistemas Operacionais
Lista Encadeada Circular Lista Duplamente Encadeada
Sistemas Operacionais
Redes de Computadores Prof Rafael Silva.
Sistema de Segurança Baseado em Análise de Imagens
Compressão de áudio Márcio Dahia e Geber Ramalho
Projeto de Banco de Dados
Computação Gráfica Aula 3 Transformações Geométricas
Ambiente de trabalho Barra de ferramentas padrão Barras de rolamentos
Agenda Modos de Endereçamento.
Agenda - Aula 03 Introdução (Computador Digital) Memória
1.
Prof. Remy Eskinazi - Microcontroladores
Eletromagnetismo I Prof. Paulo Rosa – INFI/UFMS
CMP 167– Programação com Objetos Distribuídos Prof. Cláudio Geyer
Sistemas Operacionais Entrada e Saída – Aula II Prof. Galvez.
Aluno: Rómulo Marlon Ramos Avalos Gil Santos, Edmundo Hoyle.
Guido Stolfi - EPUSP 1 / 65 Compressão de Imagens em Movimento Padrão H.264 PTC2547 Princípios de Televisão Digital Guido Stolfi – 10/2014.
Parte 2. Operações Topológicas
TV DIGITAL Paulo Ernesto Moreira 18/04/2017.
Proposta de trabalho: Rastreamento da movimentação de uma câmera.
Transcrição da apresentação:

Compressão de Imagens em Movimento Padrão Dirac / BBC Princípios de Televisão Digital Guido Stolfi – 9/2008

Codificador Dirac Codificador “Livre”, “Open Source”, sem royalties Compensação de Movimento + Compressão por “Wavelets” + Codificação Exp-Golomb ou Aritmética Desenvolvido pela BBC (British Broadcasting Corporation), proposto como SMPTE VC-2 Implementação versátil com conjunto reduzido de ferramentas Dirac Pro: Codificação Intra (sem pred. movimento)

Codificador Dirac Sem restrições nos parâmetros da imagem; suporta UHDV, 4:2:0, 4:2:2 e 4:4:4 Suporte para vídeo entrelaçado Modo de baixo atraso (menos que 1 quadro) Vários filtros para transformação por Wavelets Imagens numeradas e estruturadas como lista duplamente ligada (suporta FFW e REW)

Diagrama de Blocos do Codificador Dirac Compensação de Movimento Transformada “Wavelet” e Quantização Transformada Inversa + Estimação de Movimento Codificação Exp-Golomb / Aritmética Preditor Video Saída Vídeo Processado Meta-dados

Compensação de Movimento Compensação Global em toda a imagem : Pan, Tilt (vetores x e y) Zoom, Rotação, Cisalhamento (matriz 2 x 2) Perspectiva (transformação não-linear) Compensação por Blocos : Blocos de mesmo tamanho em toda a imagem (Y ≠ U,V) Superblocos ( 4 x 4 blocos) Pesos para cada imagem de referência (suporta fade) Blocos podem se superpor Vetores de movimento com precisão de 1 a 1/8 de pixel

Blocos superpostos

Transformada “Wavelet” unidimensional

Transformada “Wavelet” em várias camadas

Transformada “Wavelet” bidimensional

Transformada “Wavelet” bidimensional

Subdivisão em Blocos de Codificação Cada bloco de codificação, em cada camada, pode ter fator de quantização diferente

Sintaxe do Fluxo de Dados Sequencia Cabeçalho de Classificação Unidade de Dados Cabeçalho de Classificação Unidade de Dados Cabeçalho de Sequencia Imagem Dados Auxiliares Enchimento

Cabeçalhos de Classificação (Parse Info Header) Tamanho Valor Prefixo de Classificação 4 bytes ‘BBCD’ (ASCII) 0x42424344 (Hexa) Código de Classificação 1 Byte Distância até o próximo cabeçalho Inteiro 32 bits Distância para cabeçalho anterior

Códigos de Classificação (Parse_Code) LSB MSB D6 D5 D4 D3 D2 D1 1= Low Delay 0= Normal 1= Sem codificação aritmética 0= Com 00= Imagem ou Início de Sequencia 01= Fim de Sequencia 10= Dados Auxiliares 11= Enchimento 1= Imagem 0= Outros 1= Referencia 0= Normal 00= Imagem Intra 01, 10= Número de imagens de referência usadas por esta imagem (1 ou 2)

Cabeçalho de Sequencia Identifica sequencia de vídeo com parâmetros constantes: Versão, Perfil, Nível Formato básico (Custom, ou QSIF até UHDV) Parâmetros de Vídeo (Tamanho, esrutura YUV, entrelaçamento, taxa de frames, relação de aspecto, bits por pixel, etc.) Modo de Codificação (Campo / Quadro)

Perfis “Low Delay” : sem predição de movimento, com particionamento da imagem em slices horizontais “Simple” : sem predição de movimento, sem Codificação Aritmética “Main” : sem predição de movimento, com Codificação Aritmética “Main Long GOP” : com predição de movimento, com Codificação Aritmética

Níveis Nível 1 : parâmetros de vídeo padronizados ( Perfis “Low Delay”, “Simple” e “Main”) Nível 128 : parâmetros de vídeo padronizados ou customizados, amostras de 8 bits (Perfil “Main Long GOP”) Outros níveis a serem definidos