Ferramentas de Multimídia e Internet

Slides:



Advertisements
Apresentações semelhantes
Continuidade: sem interrupções
Advertisements

Representação da Informação como padrões de bits
A Imagem (Parte II) Prof. AMOUSSOU DOROTHÉE
João Luiz Fernandes e Aura Conci Universidade Federal Fluminense
Uso de Filtros Filtros Passa Baixa
BITS ++ E A CORREÇÃO GAMA
Operações envolvendo imagens
Reconhecimento de Padrões Métodos, Técnicas e Ferramentas para Aprendizado e Classificação de Dados Módulo II Introdução ao Processamento de Imagens.
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA EM DESENVOLVIMENTO.
Tecnologia Hipermídia e Multimídia Prof. Rudson Faculdade de Excelência Educacional do Rio Grande do Norte CURSO DE GRADUAÇÃO TECNOLÓGICA.
Tecnologia Hipermídia e Multimídia
Sinais e Sistemas – Capítulo 4
Filtros de Convolução (Processamento de Imagens)
Formação da imagem digital
The Cyclops Project German-Brazilian Cooperation Programme on IT CNPq GMD DLR Visão Computacional Prof. Dr. rer.nat. Aldo von Wangenheim.
Segmentação de imagens
Quantização e Dithering
1. SINAIS Contém informações sobre uma variedade de coisas e atividades em nosso mundo físico. PROCESSAMENTO DE SINAIS Ato de extrair as informações necessárias.
Iana Alexandra Alves Rufino
Tratamento de Imagens I Prof. Felipe Broering
Fundamentação Teórica
UNIVERSIDADE KIMPA VITA
Filtragem Espacial É baseado na aplicação de máscaras na imagem.
Filtros I: o domínio espacial. FILTROS I: o domínio espacial.
Filtro Linear-Máscaras
Capítulo IV – Processamento de Imagem e Vídeo
Revisão de Conceitos Básicos Hardware (Parte 2)
Teoria da Cor.
Formatos de Imagem - PNG
Processamento Digital de Imagens
Sistemas Operacionais
Fundamentos de Análise de Sinais
FUSÃO DE IMAGENS DIGITAIS Prof. Dr. Antônio Nuno de Castro Santa Rosa.
Multimédia Imagem digital
Processamento de Imagens
Introdução ao Processamento Digital de Imagens Clayton de Medeiros Vasconcelos Centro Brasileiro de Pesquisas Físicas CAT- Out
Capítulo II – Imagem Digital
Carlos Alves 12ºB Maio/2013. O mundo da geração e captura de imagens divide as imagens em dois grandes grupos: As imagens baseadas num mapa de bits e.
exemplos e aplicaçãoes da TRANSFORMADA EM ONDELETAS
bitmap e vetor Quais as diferenças?
Revisão Geral Técnicas de Realce Histogramas
Processamento Digital de Imagens
Capítulo III – Processamento de Imagem
IHC Aula 10.
Formato: JPEG Extensão: JPG
Aula 8. Classificação Não Supervisonada por Regiões
Graphics Interchange Format formato para intercâmbio de gráficos
Introdução ao Processamento Digital de Imagens
Classificação de Imagens de Sensoriamento Remoto
Navegação Poder ir para qualquer lugar e sempre voltar a home. Repetição e consistência dos elementos de navegação. Onde você está? Mais de uma maneira.
Proc. Imagem: Metas até o final do curso
JPEG, GIF e Manipulação de Imagens
Digital Image Processing, 2nd ed. © 2002 R. C. Gonzalez & R. E. Woods 3 Representação da Imagem Digital O espectro eletromagnético.
Introdução ao Processamento Digital de Imagens
Biometria Reconhecimento de Assinaturas
Sistemas Multimídia por Wandreson Luiz Brandino wandreson.com
Teoria da Cor Trabalho realizado por: Catarina Ferreira nº4 12ºB.
Trabalho de informática
Segmentação de imagens segmentação Pré-processamento descrição / análise Não existe uma única e definitiva abordagem ao problema da segmentação A descrição.
Processamento de Imagens e Computação Gráfica
Filtragem de Imagens CONCI, A. AZEVEDO, E. e LETA, F
Análise de Componentes Principais
Processamento de Imagens e Computação Gráfica
1  Integração de Pontos  Aspectos técnicos  Discriminação baseada na entidade em movimento  Fonte de iluminação  Sensor  Objeto imageado  Uso sobretudo.
Fundamentos de Redes de Computadores
Professor: Gerson Leiria Nunes.  Correlação de sinais  Correlação cruzada  Exemplo correlação  Autocorrelação  Propriedades da correlação  Exemplo.
Capítulo 14 Camada 6 A Camada de Apresentação. Sumário A Camada de Apresentação.
Questionário (Básico) Autor: Skyup Informática. Atividade - Questionário O módulo permite criar uma série de questões, que deverão ser respondida pelos.
Aline Oliveira Everton Godoy Gabriel Leoni Lenilton Rocha Nelson Deda.
Noções de cores Cor é como o olho dos seres vivos animais interpreta a reemissão da luz vinda de um objeto que foi emitida por uma fonte luminosa por meio.
Transcrição da apresentação:

Ferramentas de Multimídia e Internet Universidade Salgado de Oliveira - UNIVERSO Campus BH Curso de Análise de Sistemas (Sistemas de Informação) Ferramentas de Multimídia e Internet A Imagem (Parte II) Material adaptado da Prof.a Joseana Macêdo Fechine

Os sistemas de cor padrão O modelo matemático adequado para uma representação do espaço espectral de cor é um espaço vetorial de dimensão finita. O processo de reconstrução de cor utiliza uma base de cores primárias. Modelo tricromático de Young-Helmholtz - sistema de processamento de cor do olho humano é baseado na amostragem das faixas vermelha (red), verde (green) e azul (blue) do espectro visível, feita pelas moléculas fotossensíveis do olho -> Primeiro modelo padrão básico: CIE-RGB.

Os sistemas de cor padrão Monitor de computador: Três cores primárias emitidas por cada um dos tubos de raios catódicos (vermelho a 700 nm, verde a 546 nm e azul a 436 nm) - não correspondem às cores detectadas pelo olho humano. Necessidade de modificar as proporções de intensidade de cor aplicadas a cada uma das componentes primárias emitidas. Não é possível reproduzir todos os comprimentos de onda de luz visível. Existem, portanto, cores que não podem ser simplesmente reproduzidas em monitores a cores pela adição ponderada das cores vermelha, verde e azul.

Os sistemas de cor padrão Solução: em 1931 a CIE (Commission Internationale de l’Éclairage) resolveu adotar um novo modelo de representação padrão X, Y, Z. As cores primárias não correspondem a cores visíveis, mas suas componentes de cor são positivas sendo possível reproduzir no monitor todos os comprimentos de ondas de luz visível. As coordenadas de cromaticidade dessas cores primárias são conhecidas, sendo possível a realização de cálculos que permitem não só obtenção de valores de grandezas no sistema XYZ a partir de grandezas do sistema RGB, assim como mudanças de coordenadas entre outros sistemas de cor.

Sistemas de vídeo componente O olho tem menor sensibilidade para detectar cores do que variações de intensidade Utiliza-se uma banda maior para a luminância: Y = 0,299R + 0,587G + 0,116B Os componentes de crominância são representados como: R-Y e B-Y Sistemas baseados em Y, R-Y, B-Y são chamados de vídeo componente.

Sistemas de vídeo digital O padrão internacional para vídeo digital Y, Cr, Cb é dado pela seguinte transformação de Y, R-Y, B-Y: Y = 16 + 234Y Cr = 128 + 112 (0,5/(1-0,114) * (B-Y)) Cb = 128 + 112 (0,5/(1-0,299) * (R-Y)) Usado nos padrões JPEG e MPEG.

Sistemas de vídeo digital Imagem original, Componente Y - intensidade, Cb – Componente azul, Cr – Componente vermelha. (da esquerda para a direita)

Sistemas de vídeo composto São sistemas de cor para transmissão de vídeo (NTSC, PAL, etc.). Os componentes são combinados em um único sinal: O sinal de luminância pode ser utilizado em aparelhos preto e branco As crominâncias podem ser codificadas em apenas 5% da banda de passagem sem degradar o sinal de luminância. Sistema YUV U = 0,493 (B-Y) V = 0,877 (R-Y)

Sistemas de vídeo composto Sistema YIQ: IQ é obtido a partir de uma rotação das coordenadas UV I ocupa uma banda menor Criado para ser eficiente e compatível com TV preto e branco. Usado no NTSC (National Television Standards Committee) Y é a luminância (intensidade) – mesmo que CIE Y I e Q codificam cromaticidade

Uso de Cores Usos estéticos (passar uma sensação ao observador), destacar objetos, codificar quantidades (relevo, temperatura, dinâmica de fluídos). Nosso sistema visual é mais sensível à variação espacial (pequenos detalhes devem diferir do fundo da imagem não somente em cor mas em intensidade). Azul e preto, amarelo e branco são combinações ruins (não use azul para texto). Para daltônicos evite verdes e vermelhos com baixa saturação e intensidade.

Uso de Cores É difícil de se perceber cores quando usadas com pequenos objetos. Cor percebida de objeto é afetada por cor da área que o circula. Cores muito saturadas produzem imagens posteriores. Cores afetam tamanhos percebidos Objetos vermelhos aparentam ser maiores que objetos verdes. Cores refratam de modo diferente na nossa lente e aparentam distâncias diferentes.

Comparação entre o sistema visual humano e um sistema de visão artificial Fonte: MARQUES FILHO, O. e VEIRA NETO, H., Processamento Digital de Imagens, Editora Brasport, 1999.

Processamento de Imagem

Processamento da imagem Formatos de imagens: representação no espaço de imagens = representação matricial (“raster”); mapas de pixels = arranjos retangulares de pixels; mapas de bits = mapas de pixels com 1 bit/pixel. Características dos formatos de arquivos de imagens: número de cores suportadas; resoluções; popularidade; grau de compressão.

Processamento da imagem Exemplos de formatos de imagens - nível de pixels: Formato PCX: padrão de muitos aplicativos DOS. Formato GIF: padrão de intercâmbio de imagens. Formato BMP: padrão do Windows. Formato TGA: padrão das placas Targa.

Processamento da imagem Exemplos de formatos de imagens - nível de pixels: Formato TIFF: padrão independente de fabricante. PCD: usado em Photo-CD, com múltiplas resoluções. Formato JPG: imagem no padrão JPEG. Formato PNG: alternativa ao GIF para distribuição de imagens comprimidas sem perdas.

Processamento da imagem Tipos de operações de processamento digital da imagem: processamento no domínio espacial: operações feitas sobre os pixels separados; processamento no domínio da freqüência: requerem a análise de áreas contíguas de imagem.

Processamento da imagem Processamento no domínio espacial: armazenamento e recuperação de imagens; recorte, cópia e colagem de áreas de imagens; conversão de formatos de imagem; conversão de modelos de cor e separação de cores;

Processamento da imagem Processamento no domínio espacial: combinação de imagens (composição); retoque de imagens; pintura sobre imagens; redução de resolução e cores.

Processamento da imagem Processamento no domínio da freqüência: mudança de escala e rotação de imagens; transformação e distorção de imagens (ótica digital); filtragem, suavização e realce de imagens; compressão de imagens.

Processamento da imagem Modelo de um Sistema de Processamento Digital de Imagem Aquisição Pré-processamento Segmentação Extração de características Classificação, Interpretação

Uma hierarquia de tarefas de processamento de imagens Fonte: Introdução ao Processamento Digital de Imagens (José Eustáquio Rangel de Queiroz, Herman Martins Gomes), disponível em www.sibgrapi.ufam.edu.br/index.php?option=com_docman&task=doc_download&gid=7

Processamento da imagem Aplicações Defesa/Inteligência Biologia Automação de fábricas Processamento de Documentos

Processamento da imagem Aplicações Watermarking - proteção e identificação de copyright Segurança de Dados Comunicação secreta (Steganography) Imagem original Apoio à lei Imagem com informação "escondida"

Processamento da imagem Aplicações Médicas

Processamento da imagem Compressão de Imagens Existem, basicamente, dois tipos de imagens: Geradas por Computador (Gráficos). Armazenadas (e transmitidas) como um conjunto de instruções (formato de programa) que geram a imagem, ao invés de um formato de matriz de pixels Quando uma imagem é transmitida no formato de programa, algum esquema de compressão sem perdas tem que ser utilizado.

Processamento da imagem Compressão de Imagens Existem, basicamente, dois tipos de imagens: Imagens Digitalizadas (Fotos escaneadas, etc.). Armazenadas em formato matricial (pixels). Dois métodos de compressão (padronizados) básicos são utilizados: Combinação de codificação estatística e por repetição de série (run-length) - Compressão sem perdas de documentos digitalizados. Combinação de codificações por transformadas, diferenças e por repetição de série (run-length) - Caso genérico.

Processamento da imagem Compressão: Função realizada sobre dados antes da transmissão. Codificador da Origem (Source Coder) Decodificador do Destino (Destination Decoder) Usada para reduzir o volume de informação a ser transmitida ou reduzir a banda passante necessária para transmissão dos dados. Tipos: Compressão com perdas e sem perdas.

Processamento da imagem Compressão Com Perdas e Sem Perdas Compressão sem perdas: busca reduzir a quantidade de informação, no destino uma cópia exata dos dados originais é recuperada, a compressão é reversível. Transferência de texto, arquivos binários, etc. Compressão com perdas: busca permitir a recuperação de uma versão dos dados originais que são percebidos pelo usuário como sendo parecidos o suficiente com o original. Transferência de imagens digitais, áudio, vídeo, pois o olho e ouvido humanos não são capazes de perceber pequena perda de qualidade no sinal.

Processamento da imagem Compressão sem perdas: técnicas genéricas: ZIP, ARC, GZ; codificação entrópica: códigos de Huffman;

Processamento da imagem Codificação Estatística Modelos de codificação utilizam o mesmo número de bits por valor (exemplo: ASCII). Alguns símbolos aparecem com maior freqüência que outros. Símbolos que aparecem com maior freqüência podem usar menos bits que aqueles que aparecem com menor freqüência. Num texto a letra A aparece com maior freqüência (probabilidade) que a consoante ‘P’, que aparece com maior freqüência que ‘Z’… Utiliza-se uma codificação com número de bits variável, de modo que na média se necessita menos bits para codificar o mesmo conteúdo.

Processamento da imagem Codificação Estatística Propriedade do Prefixo. Um símbolo não pode ser prefixo de um outro símbolo mais longo. Codificação de Huffman A média mínima de bits necessários para transmitir uma determinada seqüência de dados é chamada Entropia.

Processamento da imagem A Entropia pode ser calculada pela fórmula de Shannon: n é o número de símbolos existentes, Pi é a probabilidade de um símbolo i aparecer. Eficiência de um codificador: razão da entropia do sinal e do número médio de bits por símbolo. O número médio de bits por símbolo é dado por:

Processamento da imagem Compressão sem perdas: codificação em "tiras": RLE; codificação adaptativa: aproveita a coerência entre linhas; LZW (Lempel-Ziv-Welch) - base do formato GIF.

Processamento da imagem Codificação Run-Length Usada quando o sinal a ser codificado contém uma longa seqüência de bits repetidos. Seqüência de bits substituída pelo bit e indicação de quantidade do mesmo. 000000011111111110000011 … →0,7,1,10,0,5,1,2… Assumindo que a seqüência inicia com zeros→7,10,5,2…

Processamento da imagem Formato GIF89a: transparência de um nível; entrelaçamento; animação.

Processamento da imagem Formato PNG: transparência de múltiplos de níveis: canal alfa; entrelaçamento avançado; correção do gama; MNG - extensão para animação.

Processamento da imagem Compressão com perdas: detalhes que a visão humana não percebe, ou percebe apenas com dificuldade; taxa de perda é um parâmetro da compressão: quanto maior a perda admitida, maior compressão se consegue.

Processamento da imagem Compressão com perdas - algoritmos: transformação da imagem para uma forma de espectro: quadro é dividido em blocos; para cada bloco, os valores dos pixels são traduzidos em matriz de distribuição de energia;

Processamento da imagem Compressão com perdas - algoritmos: coeficientes da matriz são truncados: natureza da transformada produz muitos coeficientes próximos de zero; em seguida, são codificados através de algoritmo de compressão de dados.

Processamento da imagem A compressão JPEG: Obtenção do espectro bidimensional da imagem: baseado na Transformada Discreta de Cossenos (DCT). Truncamento dos componentes do espectro. Codificação entrópica dos componentes.

Processamento da imagem Transformada Discreta de Cossenos - DCT Técnica matemática que transforma uma matriz de pixels em uma matriz equivalente de componentes de freqüências espaciais. Tal matriz é chamada matriz de coeficientes. A DCT não introduz perda, mas o descarte de componentes de freqüência mais altos introduzem perda irreversível de informação.

Processamento da imagem Transformada Discreta de Cossenos - DCT

Processamento da imagem Outras técnicas de compressão de imagens: “wavelets”; fractais.

Processamento da imagem Obs.: Não faz sentido falar em “uma imagem TIFF” e “uma imagem GIF”, como imagens diferentes.

Processamento da imagem GIF (Graphics Interchange Format) Permite codificação de imagens com 24 bits por pixel (8 para cada componente RGB), embora o formato selecione as 256 (do conjunto de 224) cores que melhor representam aquelas presentes na imagem. A lista de 256 cores resulta numa tabela de cores, cada entrada contendo um valor de 24 bits de cor.

Processamento da imagem GIF (Graphics Interchange Format)

Processamento da imagem GIF (Graphics Interchange Format) Cada pixel é então codificado com um elemento da tabela (8 bits) ao invés de 24, com uma compressão 3:1. A Tabela de Cores pode ser Global: é utilizada na imagem inteira. Local: é utilizada apenas em parte da imagem. O conteúdo da tabela é enviado pela rede (ou armazenado), juntamente com informação sobre as dimensões da imagem e os dados referentes aos pixels da imagem propriamente ditos.

Processamento da imagem GIF (Graphics Interchange Format) A codificação LZW pode ser utilizada para obter maior compressão. A tabela de valores vai sendo dinamicamente estendida à medida que strings de cores vão aparecendo. Usualmente a tabela começa com 512 posições, 256 das quais contém a tabela original. Quando a tabela está cheia, esta pode crescer em incrementos de 1 bit (210 cores, 211 cores, etc.).

Processamento da imagem TIFF (Tagged Image File Format) Suporta resolução de pixels de até 48 bits (16 bits para cada componente RGB). Desenvolvido tanto para envio de imagens como de documentos digitalizados. A imagem pode ser armazenada em 5 modos distintos, sendo o modo 1 completamente sem compressão e o modo 5 um modo comprimido através de codificação LZW. Os modos 2, 3 e 4 são utilizados para codificação de documentos digitalizados, com algoritmos similares àqueles utilizados por máquinas de facsimile.

Processamento da imagem TIFF (Tagged Image File Format) A codificação LZW utilizada é a mesma do padrão GIF, iniciando com um dicionário de 256 cores, que pode crescer até 4096 entradas.

Processamento da imagem JPEG (IS 10918) - Joint Photographic Experts Group Padrão para compressão e armazenamento de imagens desenvolvido por especialistas do ITU, ISO e IEC. Define vários modos de compressão, um para cada tipo de aplicação considerada. Compressão sem perdas Compressão com perdas Compressão Seqüencial com Perdas (lossy sequential mode também conhecido como baseline mode) - tipo de compressão mais adequada para multimídia, já que é o modo indicado para compressão de imagens digitalizadas, tanto coloridas como monocromáticas.

Processamento da imagem JPEG Baseada em: Transformada DCT Quantização Codificação RLE Codificação Entrópica (Huffman)

Processamento da imagem imagem original, f espectro |F(u,v)|

Processamento da imagem A Transformada Inversa de Fourier:

Processamento da imagem Codificador JPEG “Baseline” Dados Transfor-mada DCT Quantiza-dor Codifica-dor R.L.E. Codifica-dor Estatístico Tabela de quantização Fator de Compressão Tabela de Codificação Bloco 8x8 pixels

Processamento da imagem Decodificador JPEG Tabela de quantização Tabela de Codificação Bloco 8x8 pixels Dados Decodif. Estatístico Decodif. R.L.E. Des-quantiza-dor Transfor-mada DCT inversa

Processamento da imagem   Desempenho do Padrão JPEG bits/pixel qualidade da imagem reconstruída 0,083 imagem reconhecível 0,25 imagem usável 0,75 imagem excelente 2,25 indistinguível da original

Processamento da imagem Transformada Discreta de Cossenos (DCT)

Processamento da imagem Transformada Discreta de Cossenos (DCT) F(u,v) = 64 componentes de freqüências espaciais f(x,y) = 64 elementos de imagem (8x8 pixels)

Processamento da imagem Transformada Discreta de Cossenos (DCT) Cada coeficiente F(u,v) expressa a semelhança (correlação) entre o bloco de 8x8 pixels e uma determinada função primitiva correspondente:

Processamento da imagem Primitivas da DCT P0,0 P0,7 P7,0 P7,7 P1,0

Processamento da imagem Transformada DCT Inversa

Processamento da imagem Exemplo de Transformada DCT -4 -383 -784 524 76 -128 +127

Processamento da imagem Objetivos da DCT na Compressão JPEG Descorrelacionar os elementos da imagem Representar a imagem em termos de componentes de freqüência espacial para posterior processamento, de acordo com as características da visão humana Simplicidade de processamento (valores reais)

Processamento da imagem JPEG (IS 10918) - Joint Photographic Experts Group Embora JPEG seja relativamente complicado por conta do número de etapas envolvidas, níveis de compressão de mais de 20:1 são alcançados com boa qualidade de imagem. Tal nível de compressão, no entanto, se aplica a imagens relativamente simples (poucas transições de cor). Níveis de compressão da ordem de 10:1 são mais comuns para imagens típicas.

Processamento da imagem Exemplo de Codificação JPEG “Lena”, © Playboy 1972

Processamento da imagem Imagem Reconstruída por JPEG (~20:1)

Processamento da imagem Detalhes dos Efeitos da Compressão Imagem Original (40x40) Imagem Comprimida ~20:1

Processamento da imagem JPEG 2000

Processamento da imagem Imagem Original

Processamento da imagem JPEG 27:1

Processamento da imagem JPEG2000 27:1

Processamento da imagem JPEG (IS 10918) Como em GIFs, pode-se também codificar uma imagem JPEG em modo progressivo. envio de uma versão simplificada da imagem, seguida de níveis de detalhes, o que é útil para transmissões na Internet. Metodologias de transmissão progressiva incluem: Modo progressivo: primeiro são transmitidos os coeficientes DC e componentes de baixa freqüência dos blocos, seguidos dos coeficientes de maior freqüência. Modo hierárquico: A imagem é enviada inicialmente com uma resolução menor (ex. 320×240), seguida de maior resolução (ex. 640×480).

Processamento da imagem JPEG versus GIF Para alguns tipos de imagens, GIF é superior em qualidade ou em tamanho de arquivo, ou em ambos. De uma forma geral, JPEG é superior ao GIF para armazenar imagens em cores reais ou em tons de cinza que retratem cenas reais. Imagem com variação na cor, como aquelas que ocorrem em áreas brilhantes ou sombreadas, irão apresentar melhor qualidade e menor espaço quando representadas pelo formato JPEG.

Processamento da imagem JPEG versus GIF GIF - 19,298 Kb  JPEG - 7,578 Kb 

Processamento da imagem JPEG versus GIF Ícones que usam somente uma pequena quantidade de cores são melhor manipulados pelo GIF. O formato GIF apresenta melhores resultados em imagens com um pequeno número de cores distintas, como desenhos em linhas e cartões simples. Para estas imagens o GIF obtém uma compressão maior que o JPEG pode obter, além de conseguir isto sem perdas.

Processamento da imagem JPEG versus GIF GIF - 3,912 Kb  JPEG - 6,797 Kb 

Processamento da imagem JPEG versus GIF JPEG possui dificuldade em tratar imagens com bordas bem definidas. Estas bordas tendem a perder a definição ficando com um aspecto embaçado, a não ser que se utilize uma configuração de alta qualidade para a imagem. Não é recomendado: Escrever texto em imagem que será comprimida em formato JPEG. Que imagens em preto e branco sejam convertidas para JPEG. É necessário no mínimo 16 níveis de cinza para se obter uma compressão razoável com JPEG. GIF comprime sem perdas imagens em tons de cinza com até 256 níveis enquanto JPEG não.

Processamento da imagem JPEG versus GIF Grau de compactação - JPEG Para imagens em cores reais, os dados descomprimidos são normalmente constituídos de 24 bits/pixel. JPEG pode conseguir taxa de compressão de 10:1 a 20:1 sem perdas visíveis, trazendo o armazenamento para 1 a 2 bits/pixel. Uma compressão de 30:1 a 50:1 é conseguida com pequenos defeitos, enquanto que para uma imagem de qualidade muito baixa consegue-se até 100:1. Imagens com um grau de qualidade tão baixo (100:1) são bem adequadas para pré-visualizações de imagens maiores.

Processamento da imagem JPEG versus GIF Recursos oferecidos pelo GIF: Capacidade de utilizar fundo transparente. É possível, por exemplo, que um site publique uma imagem em GIF e esta terá como fundo a cor da página. O GIF permite que uma seqüência de imagens seja salva em um único arquivo, em que cada imagem surge no lugar da anterior após um tempo pré-determinado -> sensação de animação. Exemplo: O GIF utiliza um formato de compressão que não altera a qualidade da imagem a cada salvamento, como ocorre com o JPEG.

Processamento da imagem PNG versus GIF versus JPEG Formato GIF utiliza LZW (Lempel-Ziv-Welch) Cobrava royalties PNG - Concorrente do GIF Consegue trabalhar com esquema de 24 bits de cores (16,8 milhões de cores). Comparação com o JPEG: a compressão obtida é mais eficiente e não proporciona perda de qualidade a cada salvamento, o que permite maior fidelidade à imagem original.

Processamento da imagem PNG versus GIF versus JPEG As imagens em PNG não requerem muito espaço, podendo-se ter figuras de alta definição e tamanho em bytes pequeno. O JPEG costuma ter imagens de tamanho ainda menor em alguns casos. Também possui o recurso de transparência. Uma excelente alternativa ao GIF É possível ter imagens com fundo transparente, mas com o objeto utilizando um número muito maior de cores.

Processamento da imagem Lembre-se: A escolha de um tipo de imagem não deve ser arbitrária. Deve-se escolher qual o tipo mais apropriado para cada aplicação.

Principais Formatos de Imagem Formatos de imagem de varredura (raster) Características Vantagens Desvantagens BMP Bitmap Nº máximo de cores: Até 16 milhões de cores (24 bit) Compressão: Não tem. Perda de informação: Não aplicável. Transparência: Não. Não tem perda de informação. Os arquivos BMP são adequados ao papel de parede no Windows. Amplamente compatível com os programas do Windows já existentes, especialmente os programas mais antigos. Por não ter compressão os arquivos são muito grandes. Caso a imagem tenha 16 milhões de cores, cada pixel ocupa sempre 24 bit (3 Byte). Não há suporte dos navegadores da Web.

Principais Formatos de Imagem Formatos de imagem de varredura (raster) Características Vantagens Desvantagens TIFF (G3 ou LZW*) Tag Image File Format Nº máximo de cores: Até 16 milhões de cores (24 bit) Compressão: Tem. Perda de informação: Não Transparência: Não. Eleito pelos profissionais da área. Muito versátil.   (*) LZW quer dizer Lempel-Ziv-Welch, o nome dos investigadores israelitas Abraham Lempel e Jacob Zif que inventaram o formato inicial. O W de Welch refere-se  a Terry Welch que patenteou a técnica de compressão que hoje é conhecida por LZW.

Principais Formatos de Imagem Formatos de imagem de varrredura (raster) Características Vantagens Desvantagens JPG (ou JPEG) Joint Photographic Experts Group Nº de cores: Sempre 16 milhões de cores (mesmo que a imagem tenha menos cor) (24 bit) Compressão: Sim. Perda de informação: Sim Transparência: Não. Armazena sempre informação referente a 16 milhões de cores. Algoritmo de compressão muito eficaz. Indicado para fotografias e imagens foto-realistas. Como o algoritmo de compressão tem perda de informação, cada vez que o arquivo é armazenado volta a perder informação. Não indicado para esquemas e gráficos de barras (por exemplo) porque o algoritmo não está otimizado para transições abruptas de cor. Não é adequado para imagens mais simples que contenham poucas cores, amplas áreas de cores semelhantes ou grandes diferenças de brilho.

Principais Formatos de Imagem Formatos de imagem de varredura (raster) Características Vantagens Desvantagens GIF Graphics Interchange Format   Nº de cores: Até 256 cores (8 bit) Compressão: Sim. Perda de informação: Não Transparência: Sim. Tem compressão sem perda de informação. Indicado para esquemas, gráficos de barras, etc. Só permite um armazenamento máximo de 256 cores. Não indicado para fotografias, nem imagens foto-realistas (muitas cores). PNG Portable Network Graphics Nº de cores: Até 16 milhões de cores (24 bit) Compressão: Sim. Perda de informação: Não Transparência: Sim. Algoritmo otimizado. Um bom substituto para o GIF e para a maioria dos TIFF (principalmente os LZW), e, muito importante, para cópias de segurança de imagens fotográficas. Não é muito conhecido. Na Internet pode ser um bom substituto para GIF, mas não é para JPG. Por ser um formato de arquivo da Internet, não oferece suporte a vários arquivos animados ou de imagem, aos quais o formato GIF oferece suporte.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens DXF AutoCAD Drawing Interchange File Formato ASCII baseado em vetor usado pelo programa AutoCAD da Autodesk. O AutoCAD oferece esquemas altamente detalhados que são totalmente dimensionáveis. O AutoCAD permitem que você crie esquemas e desenhos altamente detalhados e precisos. Os arquivos do AutoCAD são conhecidos nos setores de arquitetura, design e estamparia. Suporte limitado no Office 2000, que oferece suporte a versões até R12 O AutoCAD tem uma curva de aprendizado longa; no entanto, outros programas gráficos também são capazes de exportar imagens DXF.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens CGM Computer Graphics Metafile O metarquivo CGM pode conter informações sobre o vetor e o bitmap. Trata-se de um formato de arquivo padronizado internacionalmente usado por muitas agências e organizações federais, inclusive o British Standards Institute (BSI), o American National Standards Institute (ANSI) e o Departamento de Defesa dos Estados Unidos. Formato padrão internacional.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens CDR – CorelDRAW O metarquivo CorelDRAW! pode conter informações sobre o vetor e o bitmap. Trata-se de um formato de arquivo amplamente usado em criações artísticas. Amplamente usado nos setores de criações artísticas e arquivos gráficos. Suporte limitado no Office 2000, que oferece suporte a versões 6 e anteriores WMF – Windows Metafile O Windows Metafile é um formato de metarquivo de 16 bits que pode conter informações sobre vetor e bitmap. Otimizado para o sistema operacional Windows. O formato padrão do Windows que funciona bem com o Office 2000.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens EPSF – Encapsulated PostScript Format O Encapsulated PostScript Format é um idioma de descrição da impressora, particular, que pode descrever as informações sobre o vetor e o bitmap. Representação precisa em uma impressora PostScript. Formato padrão do setor A representação na tela talvez não corresponda à representação impressa; a representação na tela talvez seja em baixa resolução, uma imagem diferente ou apenas uma imagem de espaço reservado. Os arquivos EPS foram projetados para serem impressos, e não necessariamente observados. Não é o formato mais adequado para exibir informações na tela.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens EMF – Enhanced Metafile É um formato de 32 bits que pode conter informações sobre vetor e bitmap. Trata-se de um aperfeiçoamento em relação ao formato Windows Metafile e contém recursos estendidos como, por exemplo: Informações internas sobre a colocação em escala. Descrições internas salvas com o arquivo. Aperfeiçoamentos nas paletas de cores e na independência do dispositivo. Formato de arquivo extensível. Recursos aperfeiçoados em comparação com WMF Extensibilidade resulta em vários tipos diferentes de imagens EMF. Nem todos os arquivos EMF são compatíveis com todos os programas que oferecem suporte ao padrão EMF.

Principais Formatos de Imagem Formatos de imagem vetorial Características Vantagens Desvantagens PICT – Macintosh Picture O arquivo PICT é um formato de metarquivo de 32 bits para Macintosh. Os arquivos PICT usam a compactação interna Run Length Encoded (RLE), o que funciona razoavelmente bem. Os arquivos PICT oferecem suporte à compactação JPEG caso o QuickTime esteja instalado (somente Macintosh). Melhor formato de arquivo para exibição na tela do Macintosh. Melhor formato de impressão de Macintosh para uma impressora que não seja PostScript. As fontes talvez sejam representadas incorretamente quando são movidas de uma plataforma para outra. O QuickTime deve ser instalado para exibir corretamente alguns arquivos PICT.

Principais Formatos de Imagem Exemplo: Para um arquivo com a dimensão 1943x1702 pixel com 9.9 MB e 16 milhões de cores (24 bit): Formato do arquivo Tamanho do arquivo Observações TIFF 9.9 MB Sem compressão. TIFF LZW 8.4 MB Com compressão LZW. PNG 6.5 MB Com compressão PNG. JPG 1.0 MB Muito pequeno. Ideal para colocar em páginas de Internet e enviar por e-mail. BMP Igual ao TIFF sem compressão. Fonte: http://www.prof2000.pt/users/lpitta/formatos.htm

Principais Formatos de Imagem Resolução e Intensidade da cor - Exibição na tela Número de cores Uso na Internet Não usada na Internet 1 (preto e branco) GIF em 72 pixels por polegada (ppi) 16 GIF em 72 ppi 256 (imagem simples)* 256 (imagem complexa)* JPG em 72 ppi Mais de 256 JPG ou PNG em 72 ppi JPG, PNG ou TIF em 72 ppi Fonte: http://support.microsoft.com

Principais Formatos de Imagem Observações: A Microsoft recomenda uma resolução de 72 pixels por polegada, já que a maioria dos monitores tem entre 60 e 80 pixels por polegada. Salvar em uma resolução maior não resulta em uma qualidade maior de exibição, já que o monitor não pode exibir mais pixels do que os existentes fisicamente no monitor. É necessário calcular os pontos por polegada de acordo com o tamanho final, e não do inicial. Por exemplo, se estivesse digitalizando um papel de carta de 8,5 por 2 polegadas a ser usado em uma página da Web com uma largura final de 2 polegadas, você digitalizaria a 72 ppi por 2 polegadas, ou seja, um total de 144 pixels. O arquivo resultante parece grande quando dimensionado a 2 polegadas e exibido em um monitor.

Principais Formatos de Imagem É importante lembrar (*): Em 256 cores, os arquivos JPG oferecem um nível de compactação maior do que os arquivos GIF. No entanto, a compactação JPG não compacta alguns arquivos simples, como faz a compactação GIF. Caso a imagem esteja em escala de cinza e exista grandes áreas de uma só cor sólida ou áreas de alto contraste (diferenças nítidas entre as áreas mais claras e escuras), escolha o formato GIF. Caso a imagem seja colorida e contenha várias cores diferentes (matizes) semelhantes em brilho ou escuridão (valor), escolha o formato JPG, já que esse formato oferece uma compactação muito melhor. A compactação JPG funciona de acordo com o matiz e funciona bem com matizes diferentes que tenham um valor semelhante. A compactação JPG não funciona com matizes semelhantes em valores diferentes.

Principais Formatos de Imagem Resultado impresso O fator principal na criação de um resultado de qualidade é o número de lines per inch (LPI) compatível com a impressora. Para imprimir em cores ou em escala de cinza, uma impressora deve ser capaz de imprimir em meio-tom. Meio-tom - um conjunto de pontos organizados em uma grade e que representam cada pixel da imagem como uma sombra de cinza. Cinza mais escuro - a maioria dos pontos na grade é preenchida; Cinza mais claro - apenas alguns pontos são preenchidos. O tamanho da grade é dado pela configuração de LPI da impressora. Quanto maior for a LPI, menor será a grade e menos serão as sombras de cinza que a impressora pode processar. Para imprimir em cores, a impressora deve imprimir linhas sobrepostas de pontos coloridos, cada um em um ângulo diferente, e deslocar um pouco para que eles não se cubram por completo - freqüência de tela.

Principais Formatos de Imagem Resultado impresso Tipo da impressora dpi de saída LPI de saída ppi de digitalização Impressora a laser 300 55-65 120 600 65-85 150 Impressora a jato de tinta 50-60 110 Uma boa regra é multiplicar a LPI da impressora por dois para calcular a resolução de digitalização de destino. Para descobrir a LPI, verifique a documentação da impressora.

Principais Formatos de Imagem Observações: Algumas impressoras oferecem suporte a resoluções muito altas. Caso você salve a imagem em mais de 300 dpi, as imagens maiores talvez ocupem muito espaço em disco e reduzam outras operações do computador. Várias imagens grandes em um documento poderiam fazer com que um programa ou o Windows parasse de responder. Caso você queira que a imagem esteja em escala de cinza ou tenha menos de 256 cores, use os formatos TIFF ou GIF. Caso a imagem tenha mais de 256 cores, salve-a no formato TIFF ou PNG. A Microsoft aconselha o formato PNG caso você precise de transparência, do contrário, use o formato TIFF.

Operações sobre Imagens Modificação Histogrâmica O histograma de uma imagem traduz a distribuição estatística dos seus níveis de cinza. O histograma de uma imagem representa, para cada nível de intensidade (cinza), o número de pixeis com aquele nível. O histograma indica se a imagem está distribuída adequadamente dentro dos possíveis níveis. Se a imagem não está utilizando todos os níveis disponíveis, podemos alterá-los, para melhor uso. Este tipo de filtragem chama-se manipulação de histograma.

Operações sobre Imagens Histograma Histogramas: (A) imagem com baixo contraste; (B) imagem usando toda a faixa de tons de cinza, com dois tons de cinza dominantes; e (C) imagem usando toda a faixa de tons de cinza, com componentes ocupando a faixa de modo mais eqüidistante. Fonte: Tutorial: Introdução ao Processamento Digital de Imagens (José Eustáquio Rangel de Queiroz, Herman Martins Gomes)

Operações sobre Imagens Histograma

Operações sobre Imagens Equalização do Histograma O processo de equalização de histograma visa o aumento da uniformidade da distribuição de níveis de cinza de uma imagem, sendo usualmente empregado para realçar diferenças de tonalidade na imagem e resultando, em diversas aplicações, em um aumento significativo no nível de detalhes perceptíveis.

Operações sobre Imagens Exemplo de equalização do histograma

Operações sobre Imagens Equalização do Histograma O processo de equalização pode levar a falsos contornos na imagem, pois o número de níveis de cinza pode ser reduzido. A equalização pode ter um efeito de realce notável da imagem, mas o contraste pode ser muito forte e, por isto a equalização de histograma deve ser usada com muito cuidado.

Operações sobre Imagens Inversão da Escala de Cinza Inversão de contraste: (A) representação gráfica do processo; e (B) exemplo.

Operações sobre Imagens Expansão de Contraste O propósito da expansão de contraste é redistribuir os tons de cinza dos pixels de uma imagem de modo a elevar o contraste na faixa de níveis possível.

Operações sobre Imagens Expansão de Contraste Exemplos de expansão de contraste linear por partes e não linear.

Operações sobre Imagens Filtragem Espacial As técnicas de filtragem de uma imagem implicam transformações pixel a pixel. A alteração efetuada em um pixel da imagem filtrada depende não apenas do nível de cinza do pixel correspondente na imagem original, mas também dos valores dos níveis de cinza dos pixels situados em sua vizinhança. A filtragem espacial se fundamenta em uma operação de convolução de uma máscara (mask, kernel ou template) e da imagem digital considerada.

Operações sobre Imagens Filtragem Espacial Filtros mais comuns: Filtro da média, Filtro da mediana e Filtro da moda, todos destinados à suavização da imagem. Esses filtros atenuam variações abruptas nos níveis de cinza da imagem, o que possibilita sua aplicação à redução de ruído de origens diversas.

Operações sobre Imagens Filtragem Espacial Filtro da média: utiliza uma máscara que consiste na média dos vizinhos do pixel central. É utilizado para a remoção de ruídos em imagens (ex: ruído Gaussiano). Efeito colateral: produz distorção, com borramento das arestas (gera falsos contornos, incluindo “fantasmas”).

Operações sobre Imagens Filtragem Espacial Filtro da média: (A) imagem original; (B) imagem ruidosa; (C) imagem filtrada com máscara 3x3; e (D) imagem filtrada com máscara 5x5.

Operações sobre Imagens Filtragem Espacial Filtro da mediana: substitui os tons de cinza da janela de tamanho W pela Mediana (ao invés da média). Preserva arestas melhor que o filtro da média, sendo eficiente para ruído não-correlacionado com o sinal. O desempenho deste método é considerado excelente para a remoção de ruído impulsivo (ex: ruído “salt-and-pepper”), mas não é bom quando existem muitos pixels contaminados (ex: ruído “Speckle”).

Operações sobre Imagens Filtragem Espacial Filtros da média e mediana: (A) imagem original; (B) imagem ruidosa; (C) média 3x3; e (D) mediana 3x3.

Operações sobre Imagens Filtragem Espacial Embora o filtro da mediana também tenda a produzir uma suavização proporcional ao tamanho da vizinhança considerada, a preservação da definição das bordas das regiões na imagem filtrada tende a ser superior do que no filtro da média.

Operações sobre Imagens Filtragem Espacial Os resultados do filtro da moda costumam ser similares aos do filtro da mediana. Enquanto os filtros da média, da moda e da mediana são empregados na suavização de imagens, outra categoria de filtros espaciais, tais como os operadores de gradiente, produzem a acentuação ou aguçamento de regiões de uma imagem nas quais ocorrem variações significativas de níveis de cinza.

Operações sobre Imagens Morfologia Matemática É uma modelagem destinada à descrição ou análise da forma de um objeto digital. O modelo morfológico para a análise de imagens fundamenta-se na extração de informações a partir de transformações morfológicas, nos conceitos da álgebra booleana e na teoria dos conjuntos e reticulados. Operações básicas da morfologia digital: Erosão - a partir da qual são removidos da imagem e pixels que não atendem a um dado padrão; e Dilatação - a partir da qual uma pequena área relacionada a um pixel é alterada para um dado padrão.

Operações sobre Imagens Morfologia Matemática Filtro morfológico de erosão: provoca efeitos de erosão das partes claras da imagem (altos níveis de cinza), gerando imagens mais escuras. Filtro morfológico de dilatação: provoca efeitos de dilatação das partes escuras da imagem (baixos níveis de cinza), gerando imagens mais claras.

Operações sobre Imagens Exemplos imagem original dilatação erosão

Operações sobre Imagens Segmentação Consiste na subdivisão da imagem em partes ou objetos constituintes. Algoritmos de segmentação possibilitam a identificação de diferenças entre dois ou mais objetos, assim como a discriminação das partes tanto entre si quanto entre si e o plano de fundo da imagem (background).

Operações sobre Imagens Segmentação Segmentação de imagens monocromáticas: os algoritmos fundamentam-se, em essência, na descontinuidade e na similaridade dos níveis de cinza. Fundamentação na descontinuidade: consiste no particionamento da imagem em zonas caracterizadas por mudanças bruscas dos níveis de cinza. O interesse recai usualmente na detecção de pontos isolados, de linhas e de bordas da imagem. Fundamentação na similaridade: consiste na limiarização e no crescimento de regiões.

Operações sobre Imagens Limiarização (Thresholding) É uma das mais importantes abordagens para a segmentação de imagens. Analisar a similaridade dos níveis de cinza da imagem extraindo os objetos de interesse através da seleção de um limiar T que separa os agrupamentos de níveis de cinza.

Operações sobre Imagens Imagem original Imagem obtida para T = 10. Imagem obtida para T = 30. Imagem obtida para T = 70.

Operações sobre Imagens Aplicação de Segmentação usando Limiarização na Área de Inspeção Industrial

Aplicação de Segmentação Usando Thresholding na Área Médica Operações sobre Imagens Aplicação de Segmentação Usando Thresholding na Área Médica

Operações sobre Imagens Filtragem no Domínio da Freqüência consiste na alteração da Transformada de Fourier da imagem. Observações: Fourier formulou no início do século XVIII a teoria de que qualquer função que se repete periodicamente pode ser representada como uma soma de senos e/ou cossenos de freqüências diferentes, cada um multiplicado por um coeficiente próprio (Séries de Fourier) Mesmo funções não periódicas podem ser representadas por integrais de senos e/ou cossenos, desde que a área sob a curva da função seja finita (Transformadas de Fourier)

Transformada de Fourier Sinais com complexidade arbitrária (desde que sua integral seja finita) podem ser representados com precisão arbitrária através da soma de senóides

Transformada de Fourier Contínua A Transformada de Fourier de uma função contínua de uma variável f(x) em R é definida por : Define-se a correspondente Transformada Inversa de Fourier como: A Transformada de Fourier de uma função contínua de duas variáveis f(x,y) em R2 é definida por : Define-se a a correspondente Transformada Inversa de Fourier como:

Transformada de Fourier Discreta Bidimensional As transformadas direta e inversa discreta em duas dimensões ficam: para u=0, 1, 2,...,M-1, v=0, 1, 2,...,N-1, e f(x,y) representa as amostras da função f(x0+xx,y0+yy) , para . x=0, 1, 2,...,M-1, e y=0, 1, 2,...,N-1. Aplica-se o mesmo a F(u,v). Os incrementos nas amostras em ambos os domínios estão relacionados por: e

Transformada de Fourier Discreta Bidimensional f(x,y) será, por exemplo, uma função real de dimensão 2, tipicamente uma imagem. F(u,v) é em geral uma função complexa. Espectro de Potência de f(x)

Transformada de Fourier imagem original f espectro |F(u,v)|

A transformada inversa de Fourier

Transformada de Fourier Transformada de Fourier em termos de características da imagem O coeficiente de F(0,0), por exemplo, denota a intensidade média da imagem. Coeficientes de baixos índices (freqüências) correspondem a componentes da imagem que variam pouco. Coeficientes de alta freqüência são associados com variações bruscas de intensidade

Transformada de Fourier Transformada de Fourier em termos de características da imagem Note como as bordas diagonais da imagem geram linhas diagonais na transformada de Fourier.

Operações sobre Imagens Exemplo de filtragem: imagem com ruído função H(u,v) imagem filtrada

Operações sobre Imagens Filtragem no Domínio da freqüência:

Operações sobre Imagens Exemplo de Detecção de Contorno: imagem de contornos imagem original função H(u,v)

Processamento Digital de Imagem Processamento Digital de Imagem é uma área multidisciplinar sub-áreas importantes (sub-problemas): aquisição codificação/compressão restauração reconstrução etc. arquiteturas específicas, linguagens