Visão Computacional – 2010 Aula 0: Introdução

Slides:



Advertisements
Apresentações semelhantes
Curso de Pós-graduação Lato-Sensu em Análise,
Advertisements

Paulo Sérgio Rodrigues PEL205
Processamento de Imagens Biométricas
Técnicas de Descrição Regional Baseadas em Texturas
Paulo Sérgio Rodrigues PEL205
Paulo Sérgio Rodrigues PEL205
Melhoramento de Imagens
Detecção de Bordas e Linhas I
Computer Vision Melhoramento de Imagens Paulo Sérgio Rodrigues PEL205.
INTELIGÊNGIA COMPUTACIONAL
Operações envolvendo imagens
Elementos Acadêmicos e Profissionais em Ciência e Tecnologia
Linguagem de Montagem Visão geral.
Prof. Alex Fernandes da Veiga Machado
Filtros de Convolução (Processamento de Imagens)
Segmentação de imagens
The Cyclops Project German-Brazilian Cooperation Programme on IT CNPq GMD DLR Visão Computacional Prof. Dr. rer.nat. Aldo von Wangenheim.
Utilização de Ferramentas Livres em um Curso de Visão Computacional
Sistema Automático para Medição e Classificação de Couro Bovino
Segmentação de imagens
O COEFICIENTE DE HURST E O COEFICIENTE DE VARIAÇÃO ESPACIAL NA SEGMENTAÇÃO DE TEXTURAS MULTIESPECTRAIS Dra Aura Conci Éldman Oliveira Nunes.
Programa de Educação Tutorial do Bacharelado em Ciência da Computação
Reconhecimento de Padrões Segmentação
Iana Alexandra Alves Rufino
Leonardo de Paula Batista Benevides
Dissertação de Mestrado Michel Alain Quintana Truyenque
Apresentação de uma metodologia de extração da estrutura de formulários de tipo Tabela. 1º módulo: Células detectadas pela transformada Watershed. 2º módulo:
Transformação de Imagens
Computer Vision Transformação de Imagens Paulo Sérgio Rodrigues PEL205.
Computer Vision Segmentação Paulo Sérgio Rodrigues PEL205.
Computer Vision Algumas Propriedades Importantes da Transformada de Fourier Paulo Sérgio Rodrigues PEL205.
Paulo Sérgio Rodrigues PEL205
Tracking I Paulo Sérgio Rodrigues PEL205. Tracking com Subtração de Fundo Tipos de Tracking (Rastreamento) Background Estático (Câmera parada) Background.
Paulo Sérgio Rodrigues PEL205
Agrupamento de padrões Métodos hierárquicos
Processamento de Imagens
Tópico Avançados em Sistemas de Computação (Pesquisa Operacional)
Introdução ao Processamento Digital de Imagens
Visão Filtragem
Fundamentação Teórica
Suellen Silva de Almeida Orientador: David Menotti
Visão Computacional Mestrado e Doutorado em Engenharia Elétrica
Nome: Rafael Baeta Orientador: Dr. David Menotti
Autores: Jean Suellen Silva de Almeida Victor Hugo Cunha de Melo
Processamento de Imagens: Conceitos Básicos
MF = (Nota_Provas*0,7+Nota_Tps*0,3)/2 Aulas a serem ministradas:
O Currículo e a Organização do Ensino de Matemática
DIÁRIO DE CLASSE E PLANEJAMENTO ANUAL NA WEB
Segmentação de Imagens
Fernando Carvalho, João Manuel R. S. Tavares
Processamento de Imagens
Introdução ao Processamento Digital de Imagens Clayton de Medeiros Vasconcelos Centro Brasileiro de Pesquisas Físicas CAT- Out
conhecimentos em resultados
1. Planejamento Conteúdo a ser abordado: Energia eletromagnética; Alguns sistemas sensores de imageamento; Fundamentos de PDI; Equalização de histograma;
INTRODUÇÃO À EDUCAÇÃO SUPERIOR (IES)
Revisão Geral Técnicas de Realce Histogramas
Capítulo III – Processamento de Imagem
Introdução ao Processamento Digital de Imagens
Algemiro Augusto Professor: Marcelo Gattass
Técnicas e Projeto de Sistemas
Biometria Reconhecimento de Assinaturas
Álgebra Vetorial e Linear para Computação Monitora: Aluna Jeane Mendes da Silva Santos Orientador: Professor Adriano Pedrosa CIn – UFPE.
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE – UFCG Av Aprígio Veloso, S/N – Bodocongó – CEP: – Campina.
1 Linguagens de Programação Pedro Lopes 2010/2011.
Atividades à distância
Segmentação de imagens segmentação Pré-processamento descrição / análise Não existe uma única e definitiva abordagem ao problema da segmentação A descrição.
Organização Normas e Qualidade
Luis Felipe de Araujo Zeni
PREVENÇÃO E RECUPERAÇÃO DE FALHAS
MATRIZES Profª Juliana Schivani
Transcrição da apresentação:

Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205

Administrivia Aulas: Quartas: 18:30 às 22:10 hs Professor: Paulo Sérgio Rodrigues www.fei.edu.br/~psergio psergio@fei.edu.br Pré-requisitos: Programação, Álgebra, Cálculo e Experiência na preparação de Documentos Acadêmicos Textbooks: “Digital Image Processing” by Rafael Gonzalez & Richard Woods “Vários artigos científicos”

Objetivos Introdução dos Principais problemas de Visão Computacional. Introduzir os principais problemas e técnicas volta às aplicações Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos.    Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância.

Por que estudar Visão Computacional? Imagens e vídeos existem em todo lugar A cada dia, novas aplicações práticas têm surgido: Construção de modelos virtuais de estruturas reais 3D. segurança (quem está fazendo o que?) Pós-processamento de vídeo Reconhecimento de faces, gestos, etc.. Vários problemas científicos desafiadores Como funciona um sistema de reconhecimento de objetos? Um entendimento melhor a respeito da visão humana.

Principais Tópicos tratados em Visão Computacional Detecção de Formas ou Movimento “Qual a forma 3D desse objeto?” Segmentação “O que pertence a que?” Tracking (Rastreamento) “A onde cada objeto vai?” Reconhecimento “O que é isso?”

Visão Visão Top Down x Visão Bottom Up

Visão Bottom Up

Desafio: Visão Baseada em Contexto

Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura

Visão Top Down The famous Muller-Lyer illusion; the point is that the horizontal bar has properties that come only from its membership in a group (it looks shorter in the lower picture, but is actually the same size) and that these properties can’t be discounted--- you can’t look at this figure and ignore the arrowheads and thereby make the two bars seem to be the same size.

Visão Top Down ou Bottom Up ? A driving force behind the gestalt movement is the observation that it isn’t enough to think about pictures in terms of separating figure and ground (e.g. foreground and background). This is (partially) because there are too many different possibilities in pictures like this one. Is a square with a hole in it the figure? or a white circle? or what?

Grandes Desafios Futuros Visão Computacional Grandes Desafios Futuros

Telemedicina

Gerenciamento de Grandes Bases de Dados

Análise de Imagens em Vídeo

Ambientes Virtuais Colaborativos

Ambientes Virtuais Colaborativos

TV-Digital

Sub-divisão da Disciplina Visão de Baixo Médio Alto-Nível

Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a: Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica Filtragem: Espacial e Freqüência Processamento baseado em Cor: Sistemas de Cores Processamento Baseado em Gradiente: Detectores de Direção Processamento Baseado em Textura: Matriz de Co-ocorrência Compressão de Imagens: Compressão JPEG Compressão de Vídeos: Detecção de Transição Registro de Imagens: Entropia: Tradicional e Não-Extensiva Morfologia Matemática

Visão de Médio Nível: Geralmente é abordado, mas não necessariamente restrito a: Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento Clusterização: K-Means, SOM, outros métodos, Crescimento De Região Entropia: Tradicional e Não-Extensiva Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo

Visão de Alto Nível: Geralmente é abordado, mas não necessariamente restrito a: Representação de Cenas: Código de Cadeia, Assinaturas de Imagens, Aproximação Poligonal, Squeletização Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos

Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a Restauração de Imagens: Melhoramento de Imagens: Espacial e Freqüência Filtragem: Espacial e Freqüência Processamento baseado em Cor Processamento Baseado em Gradiente Processamento Baseado em Textura

Curso de Visão 2010: PEL205 Regras: Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível Prova Final (PF): Todo o Conteúdo Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF Média < 5.0 = D (Reprovado) 5.0 <= Média < 7.5 = C 7.5 <= Média < 8.5 = B 8.5 <= Média = A

Trabalhos Teóricos-Práticos Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível; Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional. Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso. OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina.

TTP-I Assunto: Visão de Baixo Nível Equipe GW: Guilherme e Werner O artigo consta do tema de Análise de Vídeo explorando o tema Entropia Não-Extensiva para Detecção de Transições. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube. Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010

TTP-I Assunto: Visão de Baixo Nível Equipe CAP: Celso, André e Puff O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia Não-Extensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outras sugeridas. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: disponível com o Professor Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010