A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Visão Computacional – 2010 Aula 0: Introdução

Apresentações semelhantes


Apresentação em tema: "Visão Computacional – 2010 Aula 0: Introdução"— Transcrição da apresentação:

1 Visão Computacional – 2010 Aula 0: Introdução
Paulo Sérgio Rodrigues PEL205

2 Administrivia Aulas: Quartas: 18:30 às 22:10 hs
Professor: Paulo Sérgio Rodrigues Pré-requisitos: Programação, Álgebra, Cálculo e Experiência na preparação de Documentos Acadêmicos Textbooks: “Digital Image Processing” by Rafael Gonzalez & Richard Woods “Vários artigos científicos”

3 Objetivos Introdução dos Principais problemas de Visão Computacional.
Introduzir os principais problemas e técnicas volta às aplicações Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos.    Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância.

4 Por que estudar Visão Computacional?
Imagens e vídeos existem em todo lugar A cada dia, novas aplicações práticas têm surgido: Construção de modelos virtuais de estruturas reais 3D. segurança (quem está fazendo o que?) Pós-processamento de vídeo Reconhecimento de faces, gestos, etc.. Vários problemas científicos desafiadores Como funciona um sistema de reconhecimento de objetos? Um entendimento melhor a respeito da visão humana.

5 Principais Tópicos tratados em Visão Computacional
Detecção de Formas ou Movimento “Qual a forma 3D desse objeto?” Segmentação “O que pertence a que?” Tracking (Rastreamento) “A onde cada objeto vai?” Reconhecimento “O que é isso?”

6 Visão Visão Top Down x Visão Bottom Up

7 Visão Bottom Up

8 Desafio: Visão Baseada em Contexto

9 Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura

10 Visão Top Down The famous Muller-Lyer illusion; the point is that the horizontal bar has properties that come only from its membership in a group (it looks shorter in the lower picture, but is actually the same size) and that these properties can’t be discounted--- you can’t look at this figure and ignore the arrowheads and thereby make the two bars seem to be the same size.

11 Visão Top Down ou Bottom Up ?
A driving force behind the gestalt movement is the observation that it isn’t enough to think about pictures in terms of separating figure and ground (e.g. foreground and background). This is (partially) because there are too many different possibilities in pictures like this one. Is a square with a hole in it the figure? or a white circle? or what?

12 Grandes Desafios Futuros
Visão Computacional Grandes Desafios Futuros

13 Telemedicina

14 Gerenciamento de Grandes Bases de Dados

15 Análise de Imagens em Vídeo

16 Ambientes Virtuais Colaborativos

17 Ambientes Virtuais Colaborativos

18 TV-Digital

19 Sub-divisão da Disciplina
Visão de Baixo Médio Alto-Nível

20 Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a: Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica Filtragem: Espacial e Freqüência Processamento baseado em Cor: Sistemas de Cores Processamento Baseado em Gradiente: Detectores de Direção Processamento Baseado em Textura: Matriz de Co-ocorrência Compressão de Imagens: Compressão JPEG Compressão de Vídeos: Detecção de Transição Registro de Imagens: Entropia: Tradicional e Não-Extensiva Morfologia Matemática

21 Visão de Médio Nível: Geralmente é abordado, mas não necessariamente restrito a: Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento Clusterização: K-Means, SOM, outros métodos, Crescimento De Região Entropia: Tradicional e Não-Extensiva Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo

22 Visão de Alto Nível: Geralmente é abordado, mas não necessariamente restrito a: Representação de Cenas: Código de Cadeia, Assinaturas de Imagens, Aproximação Poligonal, Squeletização Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos

23 Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a Restauração de Imagens: Melhoramento de Imagens: Espacial e Freqüência Filtragem: Espacial e Freqüência Processamento baseado em Cor Processamento Baseado em Gradiente Processamento Baseado em Textura

24 Curso de Visão 2010: PEL205 Regras:
Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível Prova Final (PF): Todo o Conteúdo Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF Média < 5.0 = D (Reprovado) 5.0 <= Média < 7.5 = C 7.5 <= Média < 8.5 = B 8.5 <= Média = A

25 Trabalhos Teóricos-Práticos
Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível; Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional. Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso. OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina.

26 TTP-I Assunto: Visão de Baixo Nível Equipe GW: Guilherme e Werner
O artigo consta do tema de Análise de Vídeo explorando o tema Entropia Não-Extensiva para Detecção de Transições. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube. Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010

27 TTP-I Assunto: Visão de Baixo Nível Equipe CAP: Celso, André e Puff
O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia Não-Extensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outras sugeridas. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: disponível com o Professor Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010


Carregar ppt "Visão Computacional – 2010 Aula 0: Introdução"

Apresentações semelhantes


Anúncios Google