Universidade Federal de Campina Grande - UFCG

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
UNICAMP Universidade Estadual de Campinas Centro Superior de Educação Tecnológica Divisão de Telecomunicações Propagação de Ondas e Antenas Prof.Dr. Leonardo.
Inversor Trifásicos com Três Pernas
Transformação para o Espaço Latente
Palestras, oficinas e outras atividades
Operações envolvendo imagens
Material pedagógico Multiplicar x 5 Clica!
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
Capa Disciplina: Ajustamento de Observações
14/10/09 Uma animação possui: Início; Passo; Fim; 1.
Exercício do Tangram Tangram é um quebra-cabeças chinês no qual, usando 7 peças deve-se construir formas geométricas.
Pesquisa Bibliográfica Disciplina de Metodologia da Pesquisa Profª Tereza Yoshiko Kakehashi 1.
Nome : Resolve estas operações começando no centro de cada espiral. Nos rectângulos põe o resultado de cada operação. Comprova se no final.
1 INQUÉRITOS PEDAGÓGICOS 2º Semestre 2003/2004 ANÁLISE GERAL DOS RESULTADOS OBTIDOS 1.Nº de RESPOSTAS ao inquérito 2003/2004 = (42,8%) 2.Comparação.
Excel Profa. Cristina M. Nunes.
Curso de ADMINISTRAÇÃO
CUSTO DE PRODUÇÃO E METODOLOGIA DE FIXAÇÃO DE PREÇOS MÍNIMOS Audiência Pública Comissão de Agricultura, Pecuária, Abastecimento e Desenvovimento Rural.
Análise de regressão linear simples: abordagem matricial
EXPRESSÕES ARITMÉTICAS
1 Objetos Relacionados a um banco de dados. 2 Introdução Visual Basic dispõe de um conjunto de objetos, que através de suas propriedades e métodos, nos.
Dissertação de Mestrado Michel Alain Quintana Truyenque
FUNÇÃO MODULAR.
Linguagens de Programação
Questionário de Avaliação Institucional
Registro Eletrônico para Acompanhamento Médico de Pacientes em uma UTI Rafael Charnovscki (1), Jacques R. Nascimento Filho (2,3) Giancarlo Bianchin.
Técnica de Contagem.
Provas de Concursos Anteriores
Instituto de Geociências Universidade Federal de Minas Gerais
MECÂNICA - ESTÁTICA Vetores Forças Cap. 2.
MATEMÁTICA PARA NEGÓCIOS
APRESENTAÇÃO Está prevista a utilização de 6 aulas (6 blocos de 90 minutos) para o ensino do Subtema das Funções Quadráticas. Todas as aulas servirão.
ESTATÍSTICA.
Módulo Financeiro Centro de Custo.
MECÂNICA - DINÂMICA Cinemática de uma Partícula Cap. 12.
MECÂNICA - DINÂMICA Exercícios Cap. 13, 14 e 17. TC027 - Mecânica Geral III - Dinâmica © 2013 Curotto, C.L. - UFPR 2 Problema
Cinemática de uma Partícula Cap. 12
Inteligência Artificial
Aluno: Mário Monteiro Orientador: Sérgio Soares 1.
Dinâmica do Movimento Plano de um Corpo Rígido: Força e Aceleração
Cinemática Plana de um Corpo Rígido Cap. 16
MECÂNICA - ESTÁTICA Vetores Forças Cap. 2.
Anderson Berg Orientador: Prof. Fernando Buarque
1 António Arnaut Duarte. 2 Sumário: primeiros passos;primeiros passos formatar fundo;formatar fundo configurar apresentação;configurar apresentação animação.
II Workshop de Dissertação Pós-Graduação em Ciência da Computação Faculdade de Computação – FACOM Universidade Federal de Uberlândia – UFU Dezembro/2008.
Estruturas de Dados com Jogos
Estruturas de Dados com Jogos
Engenharia Elétrica ANTENAS E PROPAGAÇÃO Parte 2 Nono Semestre
Coordenação Geral de Ensino da Faculdade
Plataforma Brasil – Submissão de pesquisa
Momentos de Hu e Zernike para o Reconhecimento de Linguagem de Sinais
Análise Fatorial Factor analysis.
Projeto Marcas que Eu Gosto 1 PROJETO MARCAS QUE EU GOSTO Estudos Quantitativo de Consumidores Janeiro / 2005.
Modelagem Estatística
É u m e l e m e n t o f u n d a m e n t a l
Fotografia automática
1 2 Observa ilustração. Cria um texto. Observa ilustração.
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Computação Gráfica Aula 3 Transformações Geométricas
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo de Probabilidades. Regra de Laplace. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo Combinatório. Problemas de Contagem. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
BPM BUSINESS PROCESS MANAGEMENT Projecto em Informática e Gestão de Empresas Lisboa, 20 de Junho de 2006.
MATRICIAL CONSULTORIA LTDA. PREFEITURA MUNICIPAL DE GARIBALDI 23/10/ : ATENÇÃO Os locais descritos nas planilhas anexas não correspondem ao total.
Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos pela presença de edifícios Natália Cosse Batista Grupo 8.
Redes Neuronais/Neurais/ Conexionistas Introdução
Olhe fixamente para a Bruxa Nariguda
Reconhecimento e Verificação de Assinaturas
Dinâmica do Movimento Plano de um Corpo Rígido: Força e Aceleração
Apresentação do Artigo: Gradient Field Descriptor for Sketch Based Retrieval and Localization RUI HU, MARK BARNARD AND JOHN COLLOMOSSE CENTRE FOR VISION,
PROJETO DE AUTOMAÇÃO RESIDÊNCIAL
Transcrição da apresentação:

Universidade Federal de Campina Grande - UFCG Centro de Engenharia Elétrica e Informática - CEEI Coordenação de Pós-Graduação em Ciência da Computação - COPIN Investigação de Técnicas para Extração de Características e Classificação Aplicadas à Recuperação de Imagens por Conteúdo Saulo de Tarso Oliveira Rodrigues Mestrando Herman Martins Gomes Orientador

Roteiro Introdução Conceitos Fundamentais Trabalhos Relacionados Sistema Proposto Estudo Experimental Contribuições Trabalhos Futuros Referências

Introdução Grande número de organizações vêm coletando e armazenando imagens, como também as adicionando massivamente à World Wide Web. Difícil organização. Foram identificados dois principais problemas na recuperação de imagens. Anotações manuais. Extração de informações.

Introdução Criação da Recuperação de imagens por conteúdo (“Content-Based Image Retrieval”). Indexação e Recuperação de imagens utilizando as suas próprias características visuais. Mesmo com os avanços na área de recuperação por conteúdo. Existem algumas áreas com deficiências no contexto de busca por conteúdo [Datta, 2006]. Internet. Trocar a referência de Huang pela de [DJLW06] Datta

Conceitos Fundamentais Em particular, a maioria dos Sistemas de Recuperação de Imagens Baseada em Conteúdo (SRIBC) possuem as seguintes características em comum [Subrahmanian, 1998]: Extração de Características; Indexação; Reconhecimento. Extração - geralmente imagens são indexadas a partir de suas próprias características visuais, como cor, forma e textura.

Conceitos Fundamentais: Extração de Características - Cor Representação através de histogramas. Representação através de diferentes espaços de cor; RGB (Red, Green e Blue); HSV (Hue, Saturation e Value); YCbCr. Nesta dissertação: Histogramas em diferentes espaços de cor e quantizados. Freqüência Nível de Cinza

Conceitos Fundamentais: Extração de Características - Forma Característica diz respeito às formas dos objetos. Binarização e detectores de bordas. Após a identificação das formas dos objetos, geralmente é necessário descrevê-las com base nas propriedades invariantes a escala, rotação e translação. Nesta dissertação: Momentos Invariantes de Hu [Hu, 1962]. Nível de Cinza Binarização Borda Detectada Trocar [Huang, 1997] por [Hu62] M.K Hu.

Conceitos Fundamentais: Extração de Características - Textura São mudanças na intensidade da imagem que formam determinados padrões repetitivos [Tuceryan, 1993]. Nesta dissertação: Texturas representadas através de Local Binary Patterns (LBP) [Ojala, 2002] e Wavelets de Haar e Daubechies [Wang, 1998]. Exemplos de texturas

Conceitos Fundamentais: Estruturas de Indexação Após a extração das características é necessário representar essas informações de forma que seja possível uma recuperação. Vetores de características ou estruturas de dados multidimensionais. As técnicas de extração de características produzem vetores de grande dimensão. Utilização de novos métodos de indexação. Eficiente com dados multidimensionais Eficientes na busca

Conceitos Fundamentais: Estruturas de Indexação Entre os métodos existentes, pode-se destacar o GHSOM (Growing Hierarquical Self-Organizing Maps) [Rauber, 2002]. Treinamento não-supervisionado; Criação de estrutura de árvore para indexação; Criação de grupos dinâmicos; Capacidade de suporte a medidas de similaridades arbitrárias.

Conceitos Fundamentais: Combinação de Classificadores A combinação de classificadores é utilizada como um método para diminuir a probabilidade de erro na classificação. Segundo Kittler [Kittler, 1998], um combinador pode melhorar o desempenho do sistema, fazendo com que as deficiências de um classificador sejam suprimidas pelo bom desempenho de outros. Geralmente o conjunto de classificadores são organizados em uma arquitetura e uma regra de combinação.

Conceitos Fundamentais: Combinação de Classificadores Quanto a arquitetura são classificados como: Lineares Paralelos Hierárquicos Classificador Combinador

Trabalhos Relacionados: Sistemas Existentes Consulta Forma de Extração Medida de similaridade Indexação QBIC Imagem Exemplo, esboço e por padrões de cor e textura Histograma de Cor, Texturas segundo Tamura e Momentos invariantes Distância Euclidiana R*-tree NETRA Imagens Pré-definidas Histograma de cor quantizados, Wavelet de Gabor e Transformada rápida de Fourier SS-tree PicSOM Imagens Pré-definidas com refinamento interativo Histogramas de Cor, Momentos de Cor e Transformada de Fourier SOM VisualSEEk Esboço Histograma de cor quantizado R-tree WebSEEk Esboço e texto Distância entre histogramas Dados da Extração Sistema de French Imagem exemplo Histograma de cor (para as diferentes representações da imagem de consulta) Dados extraídos de cara representação Sistema de Barcellos Sistema de Presad Histograma de cor quantizado, Forma (Maior Eixo, Menor Eixo e Centro de gravidade) Diferença entre as regiões extraídas, utilizando um limiar Dado não informado Sistema de Edvarden Distância Euclidiana, Interseção de histograma e distância quadrática

Sistema Proposto: Arquitetura do Sistema A arquitetura macro do sistema proposto é formada por: Interface com usuário Robô de Busca Extração de Características Treinamento dos Classificadores Classificadores Combinação de Classificadores No sistema proposto existe dois modos de operação distintos: Modo de consulta Modo de busca

Sistema Proposto: Arquitetura do Sistema

Sistema Proposto: Módulo de Extração Extração de Características Métodos de extração: RGB, HSV e YCbCr, com diferentes números de bins (128, 64, 32 e 16). LBP e Wavelets. Momentos Invariantes de Hu.

Sistema Proposto: Módulo de Classificação

Sistema Proposto: Módulo de Classificação Treinamento dos Classificadores Treinamento das redes GHSOM (cada classificador utilizando apenas um tipo de característica). Classificadores Similaridade entre características submetidas e o classificador GHSOM específico. Neurônios vencedores.

Sistema Proposto: Módulo de Combinação Combinação de Classificadores Ordenação das imagens recuperadas de forma decrescente.

Sistema Proposto: Módulo de Combinação Para a combinação, foi utilizado um método em que cada imagem recuperada recebe um voto. Ordena as imagens através dos votos. O cálculo do voto de cada imagem é expresso por:

Sistema Proposto: Arquitetura do Sistema Robô de Busca Web Crawler: busca e indexação automática de imagens disponíveis na World Wide Web. Regras de download das imagens: Tamanho mínimo de 150 x 150 pixels. Razão entre altura e largura entre 3 e 1/3. Formato JPEG. Indexação das características extraídas e URLs das imagens.

Sistema Proposto: Interface com o Usuário

Estudo Experimental Experimento 1 – Busca pelos melhores parâmetros dos classificadores GHSOM. Melhores parâmetros de treinamento para cada classificador. Experimento 2 – Combinação de classificadores. Experimentos objetivos. Experimento 3 – Teste com a Interface Web e os usuários. Experimentos subjetivos.

Experimento 1 – Busca por Melhores Parâmetros Avaliação do parâmetro τ2 Valores avaliados: 0,5; 0,1; 0,05; 0,01; 0,005; 0,001; 0,0005; 0,00001; 0,000005; 0,000001 e 0,0000001. Banco rotulado com 800 imagens, distribuídas em 16 grupos. aviões, vegetação, aves, garrafas, camelos, carros, faces, flores, futebol, guitarras, casas, motocicletas, outono, planetas e pôr-do-sol.

Experimento 1 – Busca por Melhores Parâmetros Métricas de Avaliação de Classificadores Precisão = Cobertura = Medida-F =

Experimento 1 – Busca por Melhores Parâmetros Extratores τ2 Precisão Cobertura Medida-F LBP 0,05 0,191790091 0,280625 0,227855102 Wav 0,10 0,128562369 0,408125 0,195531029 HU_MOMENTS 0,093021798 0,4096875 0,151617916 HSV128 0,142346118 0,2415625 0,179133692 HSV64 0,50 0,145480311 0,3390625 0,203601898 HSV32 0,183727882 0,2365625 0,206824276 HSV16 0,199642902 0,23953125 0,21777563 RGB128 0,183070331 0,16859375 0,175534069 RGB64 0,110120024 0,241875 0,151338962 RGB32 0,172415855 0,24046875 0,20083396 RGB16 0,145861759 0,30953125 0,198284873 YCBCR128 0,176315762 0,21390625 0,193300441 YCBCR64 0,150864074 0,2621875 0,191524143 YCBCR32 0,186840728 0,26125 0,217867218 YCBCR16 0,135528171 0,2771875 0,182046467 Vermelho = Melhor Medida-F Verde = Melhor Cobertura Azul = Melhor Precisão

Experimento 2 – Combinação de Classificadores Comparação entre os classificadores simples e combinados. RGB com 32 bins, HSV com 16 bins, YCbCr com 32 bins, Wavelets, LBP e Momentos Invariantes de Hu. Redução da quantidade de imagens recuperadas: 400, 300, 200, 100, 90, 80, 70, 60, 50, 45, 40, 35, 30, 25, 20, 15, 10 e 5. Os classificadores foram combinados de forma dois a dois, três a três, quatro a quatro, cinco a cinco e seis a seis.

Experimento 2 – Combinação de Classificadores Com a redução da quantidade de imagens, a precisão das combinações foi superiores aos classificadores simples.

Experimento 2 – Combinação de Classificadores Durante todo o experimento a cobertura dos classificadores combinados foi superior aos classificadores simples.

Experimento 3 – Teste com a Interface Web e os Usuários Teste utilizando o sistema proposto. Banco de imagens com aproximadamente 64.000 URLs de imagens. Experimento 3 foi subdividido em três partes: Imagens aleatórias; Conjunto de imagens fixas; Única imagem.

Experimento 3 – Teste com a Interface Web e os Usuários HSV com 16 bins; HSV com 32 bins; HSV com 64 bins; RGB com 16 bins; RGB com 32 bins; RGB com 64 bins; YCbCr com 16 bins; YCbCr com 32 bins; YCbCr com 64 bins; LBP; Wavelets; Momentos Invariantes de Hu; Combinação de Cor; Combinação de Textura; Combinação de Cor e Textura; Combinação de Cor e Forma; Combinação de Textura e Forma; Combinação de Cor, Textura e Forma. Extratores τ2 LBP 0,0005000 WAV 0,0000010 HUMOMENTS 0,0000050 HSV64 0,0000100 HSV32 0,0000001 HSV16 RGB64 RGB32 RGB16 0,0000500 YCBCR64 0,0001000 YCBCR32 YCBCR16

Experimento com Usuários – Imagens Aleatórias Foram selecionados 25 usuários. Download da imagem para utilizar como consulta. Os melhores resultados foram: Combinação de Cor com 36,2%. Combinação de Forma e Textura com 35,0%. Problema para identificação dos usuários incomuns. Imagens diferentes para cada usuário.

Experimento com Usuários – Conjunto de Imagens Fixas Definição de nova metodologia de testes. Testes configurados automaticamente, transparência para o usuário. Tentativa de identificar possíveis usuários incomuns. Foram utilizados 35 usuários. Em adição aos classificadores utilizados, foi testada a Melhor Combinação. RGB com 32 bins, HSV com 16 bins, LBP e Wavelets.

Experimento com Usuários – Conjunto de Imagens Fixas Conjunto de imagens fixas utilizadas nos testes. HSV16 RGB32 HSV32 HSV64 RGB16 YCBCR32 RGB64 YCBCR16 YCBCR64 LBP Com. Text. Cor e Text. Wavelets HuMoments Com. Cor Cor & Forma Cor, Text. e Forma Melhor Comb. Text. e Forma

Experimento com Usuários – Conjunto de Imagens Fixas As melhores precisões foram obtidas para as combinações. Melhor Combinação (RGB32, HSV16 , LBP e Wavelets) obteve 48,0%. Combinação de Cor e Textura obteve 39,1%. Combinação de Cor obteve 38,9%. Alguns classificadores simples se destacaram. YCbCr com 16 bins obteve 35,7%. HSV com 16 bins obteve 32,0%.

Experimento com Usuários – Conjunto de Imagens Fixas Identificação de usuários incomuns Média geral das precisões 23,5%.

Experimento com Usuários – Conjunto de Imagens Fixas Precisões dos classificadores sem os usuários incomuns . Aumento na precisão dos melhores classificadores. Melhor Combinação, aumento de 48,0% para 48,8%. Redução na precisão dos piores classificadores. HSV com 64 bins, diminuiu de 5,1% para 3,2%. A retirada dos usuários incomuns contribui para destacar os melhores classificadores.

Experimento com Usuários – Única Imagem Uma única imagem selecionada foi utilizada para todos os testes. Os mesmo 35 usuários do experimento anterior. Os usuários incomuns também foram identificados.

Experimento com Usuários – Única Imagem Dos classificadores testados, os que obtiveram melhores resultados foram: Melhor Combinação obteve 27,7%. Combinação de Cor e Textura obteve 25,4%. YCbCr com 32 bins obteve 25,4%.

Experimento com Usuários – Única Imagem Média geral das precisões 18,5%.

Experimento com Usuários – Única Imagem Após a retirada dos usuários incomuns. Redução do número de usuários incomuns. Redução na precisão dos classificadores, mas os melhores classificadores obtiveram destaque. Os melhores classificadores foram: Combinação de Cor e Textura, YCbCr com 32 bins e Melhor Combinação. Possivelmente os resultados dos classificadores podem ter sido influenciados pela escolha da imagem de consulta.

Contribuições Foi desenvolvido um novo método de combinação de classificadores GHSOM. Avaliados através de testes objetivos e subjetivos. Foi desenvolvido um sistema de recuperação por conteúdo. Banco de dados dinâmico. Foram realizadas investigações sobre: Extração de características; Indexação; Publicações Workshop de Teses e Dissertações (SIBGRAPI 2007). Poster aceito para publicação no SIBGRAPI 2008. Escrita de artigo em andamento para submissão ao JBCS.

Trabalhos Futuros Estudar novos métodos de extração de características. Estudar novos métodos de indexação e classificação. Incorporar estratégias de processamento distribuído aos diferentes módulos do sistema. Desenvolver uma interface que permita feedback dos usuários. Automatizar a criação das redes GHSOM (a medida que a base de dados cresce) . Investigar método para eliminar URLs de imagens inválidas.

Referências Bibliográficas [Datta, 2006] R. Datta, D. Joshi, J. Li, and J. Z. Wang. Image retrieval: Ideas, influences, and trends of the new age. ACM Computing Surveys, pages 1–60, 2006. [Hu, 1962] M.K Hu. Visual pattern recognition by moment invariants. Information Theory, IEEE Transactions on, 8(2):179–187, 1962. [Huang, 1997] Y. Rui, T. S. Huang, and S. F. Chang. Image retrieval: Past, present, and future. In International Symposium on Multimedia Information Processing, pages 2–16, 1997. [Kittler, 1998] J. Kittler, M. Hatef, RPW Duin, and J. Matas. On combining classifiers. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 20(3):226–239, 1998.

Referências Bibliográficas [Ojala, 2002] T. Ojala, M. Pietikainen, and T. Maenpaa. Multiresolution grayscale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(7):971–987, 2002. [Rauber, 2002] A. Rauber, D. Merkl, and M. Dittenbach. The growing hierarchical selforganizing map: exploratory analysis of high-dimensional data. Neural Networks, IEEE Transactions on, 13(6):1331–1341, 2002. [Subrahmanian, 1998] V. S. Subrahmanian. Principles of multimedia database systems. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 1998. [Tuceryan, 1993] M. Tuceryan and A. K. Jain. Texture analysis. Handbook of Pattern Recognition and Computer Vision, pages 235–276, 1993. [Wang, 1998] J. Z. Wang, G.Wiederhold, O. Firschein, and S. XinWei. Content-based image indexing and searching using Daubechies’ wavelets. International Journal on Digital Libraries, 1(4):311–328, 1998.

Universidade Federal de Campina Grande - UFCG Centro de Engenharia Elétrica e Informática - CEEI Coordenação de Pós-Graduação em Ciência da Computação - COPIN Investigação de Técnicas para Extração de Características e Classificação Aplicadas à Recuperação de Imagens por Conteúdo Saulo de Tarso Oliveira Rodrigues Mestrando Herman Martins Gomes Orientador

Tempo de processamento do sistema Classificadores Tempo Extrator Tempo Classificador Tempo Combinador Tempo Total RGB16 0,109354 0,695717 X 0,805072 RGB32 0,109642 0,777791 0,887433 RGB64 0,103476 0,772575 0,876051 HSV16 0,119441 0,577365 0,696806 HSV32 0,113153 0,736847 0,850000 HSV64 0,110972 0,781814 0,892786 YCbCr16 0,114826 0,623778 0,738604 YCbCr32 0,107831 0,567676 0,675507 YCbCr64 0,104747 0,587171 0,691918 LBP 1,300055 0,662135 1,962190 Wavelets 1,580270 0,098529 1,678799 Momentos de Hu 0,139364 0,565734 0,705098 Combinação Cor 0,323098 0,780349 1,072461 2,175908 Combinação Textura 2,410962 0,556455 0,927330 3,894747 Combinação Cor e Textura 2,700370 1,274722 1,687175 5,662267 Combinação Cor e Forma 0,430542 1,280255 1,275038 2,985835 Combinação Forma e Textura 2,519608 0,847213 1,172503 4,539324 Combinação Cor, Forma e Textura 2,821672 1,596423 1,734224 6,152319 Melhor Combinação 2,592550 0,384204 0,563112 3,539866

Vídeo Demonstrativo