Capítulo IV – Processamento de Imagem e Vídeo

Slides:



Advertisements
Apresentações semelhantes
Representação da Informação como padrões de bits
Advertisements

Tecnologias da Informação e Comunicação
Fundamentos da Representação de Informações em Computadores
Algoritmo para codificação em bitrate constante Vinicius Kursancew.
O Vídeo (Parte II) Prof. AMOUSSOU DOROTHÉE
Computação Gráfica Processamento de Imagem
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA EM DESENVOLVIMENTO.
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA.
10º CAPÍTULO Segmentação de imagem.
Trabalhos de laboratório
Programação Orientada aos Objectos Paulo Marques Departamento de Eng. Informática Universidade de Coimbra Out/2005 Core C++: Uma abordagem.
Compressão de Dados ORI Ednaldo Pizzolato.
Wesley Barbosa Thereza
Formação da imagem digital
The Cyclops Project German-Brazilian Cooperation Programme on IT CNPq GMD DLR Visão Computacional Prof. Dr. rer.nat. Aldo von Wangenheim.
Compressão de Dados.
Iana Alexandra Alves Rufino
O vídeo.
Capítulo 7 Multimídia 7.1 Introdução à multimídia
Formato de arquivo de Vídeo
1 Universidade Federal de Minas Gerais JPEG Alessandra e Aline.
Visão Computacional – 2010 Aula 0: Introdução
Paulo Sérgio Rodrigues PEL205
Computação Gráfica Interativa - Gattass
Crescimento de Funções
Introdução ao Processamento Digital de Imagens
I – Informação Digital Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações Tecnologias de.
Sistemas Multimídia Vídeo
O RITO DA PRIMAVERA VISÕES DA NATUREZA NA ARTE MODERNISTA.
Unidade de Vídeo Escola Secundária Diogo de Macedo Curso Tecnológico de Informática Aplicações Informáticas A Prof.: Henrique Ribeiro Paulo Cruz 11ºD nº2.
Unidade I Noções básicas de Tecnologias da Informação e Comunicação.
Televisão: a tecnologia por detrás do écran
Processamento Digital de Imagens
Compressão de Textos Juliano Palmieri Lage.
Jornadas de Aplicações da Matemática, ISEL, Out. 98
Apresentação 2 Ilusões Ópticas.
Algorítmos e estrutura de dados III
DISCIPLINA: SR, Geoprocessamento I e II e Cartografia A tecnologia do Geoprocessamento – Aplicações e Potencialidades 12/3/ Aula 5.
Busca com informação e exploração
Fábio de Oliveira Borges
Multimédia Imagem digital
Guilherme Defreitas Juraszek
Linguagem de Programação JAVA
Teresa C. S. Azevedo, João Manuel R. S. Tavares, Mário A. P. Vaz
Imagem Digital.
Introdução ao Processamento Digital de Imagens Clayton de Medeiros Vasconcelos Centro Brasileiro de Pesquisas Físicas CAT- Out
Capítulo II – Imagem Digital
Capítulo V – Reconhecimento de Padrões
Carlos Alves 12ºB Maio/2013. O mundo da geração e captura de imagens divide as imagens em dois grandes grupos: As imagens baseadas num mapa de bits e.
PROCESSAMENTO DIGITAL DE SINAIS
Introdução a Sistemas de Informação
Revisão Geral Técnicas de Realce Histogramas
CMP 167– Programação com Objetos Distribuídos Prof. Cláudio Geyer
Capítulo III – Processamento de Imagem
Formato: JPEG Extensão: JPG
Graphics Interchange Format formato para intercâmbio de gráficos
SIM 14/15 – T6 Processamento de Sinal e Imagem Médica Mestrado em Informática Médica Miguel Tavares Coimbra.
Introdução ao Processamento Digital de Imagens
Proc. Imagem: Metas até o final do curso
JPEG, GIF e Manipulação de Imagens
Sistemas Multimídia por Wandreson Luiz Brandino wandreson.com
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE – UFCG Av Aprígio Veloso, S/N – Bodocongó – CEP: – Campina.
Técnicas de Compressão de Dados
PSI2653: Meios Eletrônicos Interativos I I – Informação Digital Escola Politécnica da USP Engenharia de Sistemas Eletrônicos Meios Eletrônicos Interativos.
1  Integração de Pontos  Aspectos técnicos  Discriminação baseada na entidade em movimento  Fonte de iluminação  Sensor  Objeto imageado  Uso sobretudo.
SIM 15/16 – T7 Processamento de Sinal e Imagem Médica Miguel Tavares Coimbra.
Conceitos Básicos Prof. Arimateia Junior Faculdade Lourenço Filho Curso de Bacharelado em sistema de informação Sistemas Multimídia.
T4.1 – Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra.
T4.1 – Processamento de Imagem
Transcrição da apresentação:

Capítulo IV – Processamento de Imagem e Vídeo Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra

Resumo Introdução à segmentação Segmentação baseada em regiões Morfologia matemática Processamento vídeo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

1. Introdução à segmentação Segmentação baseada em regiões Morfologia matemática Processamento vídeo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Nada trivial! É o ‘santo graal’ de uma imensidão de problemas! Definição Consiste na separação da imagem em áreas diferentes. Extracção de objectos. Extracção de áreas com características próprias. Nada trivial! É o ‘santo graal’ de uma imensidão de problemas! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

A subjectividade da segmentação O resultado de uma segmentação apenas é ‘correcto’ dado um determinado contexto. Subjectividade! Difícil implementação computacional. Dificuldades na avaliação do desempenho. Qual a segmentação correcta? Rosto Pessoa Mala MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Thresholding Threshold adequado! Consiste em dividir uma imagem em duas zonas: 1, se f(x,y)>K 0, se f(x,y)<=K Não é fácil de achar um numero mágico k ideal! Provavelmente a técnica mais popular de segmentação Simples Razoavelmente eficaz Threshold adequado! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Números mágicos O resultado é muito sensível às variações de k. Número mágico. Bom para uma situação. Mau para todas as outras. Sistema tem que ser robusto! Como escolher k? Histogramas. Outras técnicas. A combinação das distribuições de duas regiões pode tornar a segmentação simples (esquerda) ou muito difícil (direita). Adaptado de [1] MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Exemplo Correcta (k = 74) Errada! (k = 128) MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Pré-processamento Manipulação da imagem antes da aplicação do thresholding. Permite criar uma melhor separação das zonas no histograma. Mais comum: Filtragem de ruído. Filtro passa-baixo. Filtro de mediana. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Pós-Processamento Tenta corrigir os erros de segmentação. Conhecimento a-priori acercado resultado esperado. Filtros morfológicos. Muito populares para pós-processamento. Abertura. Fecho. Abertura Fecho MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

2. Segmentação baseada em regiões Introdução à segmentação Segmentação baseada em regiões Morfologia matemática Processamento vídeo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Motivação Segmentação Regiões homogéneas Fronteiras e thresholds nem sempre eficazes. Regiões homogéneas Region-based segmentation. Eficaz em imagens ruídosas. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Exemplos de algumas regiões da imagem Definições Baseia-se em conjuntos. A imagem R é um conjunto de regiões Ri. Todos os pontos pertencem a uma das regiões. Um ponto apenas pode pertencer a uma única região. R1 R3 R2 R4 R6 R5 R7 Exemplos de algumas regiões da imagem MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Region growing Consiste na união/divisão de um conjunto inicial de regiões. Homogeneidade: Cor Textura Outros Tipicamente iterativo Como começar? O que fazer em cada iteração? Quando parar? Divisão Inicial Iteração Condição Paragem Fim MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Region merging Algoritmo Divisão inicial da imagem em regiões. Definição do critério de união de 2 regiões adjacentes. Unir regiões. Repetir passo anterior até não haver mais uniões. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Region splitting Algoritmo Inicialmente usa a imagem completa. Definição do critério de divisão. Divisão iterativa em sub-regiões. Paragem quando falhar o critério de divisão. R1 R1 R2 R3 R4 R1 R2 R1 R2 R3 R3 R4 R5 R4 R5 R6 R7 R6 R7 MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Split and Merge Combinação dos dois algoritmos. Permite lidar com formas mais variadas. Basta aplicar consecutivamente os algoritmos anteriores. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

A transformada Watershed Inspiração geográfica. Lançar água sobre um terreno montanhoso. Cada lago corresponde a uma região. Características: Computacionalmente complexo. Grande flexibilidade na segmentação. Risco de sobre-segmentação. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

3. Morfologia matemática Introdução à segmentação Segmentação baseada em regiões Morfologia matemática Processamento vídeo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Morfologia matemática Desenvolvida para descrever quantitativamente estruturas geométricas Baseada em sets Grupos de pontos que definem áreas de uma imagem Para que servem? Manipulação de imagens binárias. ‘Limpar’ resultados de uma segmentação! Segmentação de um tumor usando filtros morfológicos MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Dilatação, Erosão Implicam dois conjuntos: Dilatação (D) Erosão (E) Imagem Kernel morfológico Dilatação (D) União do kernel com todo o conjunto da imagem Aumento da área resultante Erosão (E) Intersecção Diminuição da área resultante MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Abertura, Fecho Abertura Fecho Erosão, seguida de dilatação. Menos destrutivo do que uma erosão. ‘Adapta’ a forma da imagem à forma do kernel. Fecho Dilatação, seguida de erosão. Menos destrutivo do que uma dilatação. Tende a ‘fechar’ as irregularidades das formas. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Exemplos: Abertura Abertura Tresholding MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Exemplos: Fecho Fecho MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Análise de componentes ligados Definimos ‘ligação’ 4 vizinhos 8 vizinhos Etc. Pesquisamos toda a imagem Recursivamente obtemos todos os pontos ‘ligados’ ao nosso ponto inicial MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

4. Processamento vídeo Introdução à segmentação Segmentação baseada em regiões Morfologia matemática Processamento vídeo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Definições Imagem pode ser representada por uma matriz 2D. O vídeo pode ser representado por uma matriz 3D – Dimensão tempo. f(x,y,t) Passamos a ter um gradiente no espaço-tempo – Movimento Novas capacidades, novos problemas! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Criaram o conceito de ‘fluxo óptico’ Optical flow is “the distribution of apparent velocities of movement of brightness patterns in an image” – Horn and Schunck 1980 x y z Image Plane Motion The optical flow field approximates the true motion field which is a “purely geomectrical concept..., it is the [2D] projection into the image [plane] of [the sequence’s] 3D motion vectors” – Horn and Schunk 1993 Criaram o conceito de ‘fluxo óptico’ MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Tipos de métodos de fluxo óptico Differential Horn and Schunck [HS80], Lucas Kanade [LK81], Nagel [83]. Region-based matching Anandan [Anan87], Singh [Singh90], Digital video encoding standards. Energy-based Heeger [Heeg87] Phase-based Fleet and Jepson [FJ90] Problema ainda continua em estudo! As soluções conhecidas ainda não são satisfatórias! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Exemplo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Necessidade da compressão vídeo Problema: Vídeo digital ocupa demasiado espaço! VGA: 640x480, 3 bytes por pixel -> 920KB por imagem. Cada segundo de vídeo: 23 MB Cada hora de vídeo: 83 GB Solução: Compressão Vídeo Rácios de compressão superiores a 100:1! Resultado: Explosão da popularidade do vídeo digital. DVD, máquinas digitais, web-streaming, telemóveis 3G, etc. Incomportável! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Redundância de codificação Teoria da informação Os valores mais comuns devem ser codificados usando menos bits. Codificação de Huffman Menor número possível de símbolos de código por símbolos de fonte. Codificação sem perdas (Lossless). Codificação LZW Cria valores adicionais para sequências comuns de valores (ex: sequências de pixeis negros). GIF, TIFF, PDF. Explora a redundância espacial das imagens! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Redundância espacial elevada Redundância espacial reduzida Correlação entre pixeis vizinhos. Ex: Uma linha branca pode ser codificada com 2 números (nr.pixeis, cor). Formas matemáticas de a explorar: Lossless – Ex: LZW Lossy – Ex: DCT Redundância espacial elevada Redundância espacial reduzida MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Redundância temporal Imagens consecutivas de um vídeo variam pouco! Há áreas que não mudam (fundo). Há áreas que apenas mudam de local (objectos em movimento). Podemos explorar isto! Enviar diferenças de imagem. Usar vectores de movimento. Objecto Fundo MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Redundância psicovisual Sistema visual humano Sensibilidade diferente para informação diferente. Processamento humano Apenas vemos algumas partes da imagem. Cérebro completa o resto. A compressão pode ser lossy logo que a informação descartada seja pouco relevante para nós! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Modelo de um codificador / descodificador vídeo Descodificador MPEG-2 MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Algoritmos de compressão de imagem GIF, TIFF, PCX, JPEG 2000, … Mais popular: JPEG Espaço de cor: YCbCr Cor menos importante que luminosidade. Transformação DCT. Quantização. Zig-Zag Run-Length Huffman encoding DCT Zig-Zag RLE MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Algoritmos de compressão vídeo H.261, H.263, DivX, MPEG–1,… MPEG-2 Imagens comprimidas como JPEG. Previsão da imagem seguinte. Estimação de movimento DVDs, TV digital, … MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

Artefactos de compressão Podem afectar significativamente a qualidade das imagens! MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo

MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo Compressão reduzida

MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo Compressão média

MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo Compressão elevada

Resumo A segmentação é uma operação com um grau de dificuldade muito variável. Uma segmentação baseada em regiões apresenta claras vantagens em relação a thresholding. Pós-processamento através de filtros morfológicos. Movimento, fluxo óptico e compressão vídeo. MIM 13/14 - PSI - Capítulo IV – Processamento de Imagem e Vídeo