A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205.

Apresentações semelhantes


Apresentação em tema: "Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205."— Transcrição da apresentação:

1 Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205

2 Administrivia Aulas: Quartas: 18:30 às 22:10 hs Professor: Paulo Sérgio Rodrigues Pré-requisitos: Programação, Álgebra, Cálculo e Experiência na preparação de Documentos Acadêmicos Textbooks: Digital Image Processing by Rafael Gonzalez & Richard Woods Vários artigos científicos

3 Objetivos Introdução dos Principais problemas de Visão Computacional. Introduzir os principais problemas e técnicas volta às aplicações Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos. Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância.

4 Por que estudar Visão Computacional? Imagens e vídeos existem em todo lugar A cada dia, novas aplicações práticas têm surgido: –Construção de modelos virtuais de estruturas reais 3D. –segurança (quem está fazendo o que?) –Pós-processamento de vídeo –Reconhecimento de faces, gestos, etc.. Vários problemas científicos desafiadores –Como funciona um sistema de reconhecimento de objetos? Um entendimento melhor a respeito da visão humana.

5 Principais Tópicos tratados em Visão Computacional Detecção de Formas ou Movimento Qual a forma 3D desse objeto? Segmentação O que pertence a que? Tracking (Rastreamento) A onde cada objeto vai? Reconhecimento O que é isso?

6 Visão Visão Top Down x Visão Bottom Up

7

8 Desafio: Visão Baseada em Contexto

9 Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura

10 Visão Top Down

11 Visão Top Down ou Bottom Up ?

12 Visão Computacional Grandes Desafios Futuros

13 Telemedicina

14 Gerenciamento de Grandes Bases de Dados

15 Análise de Imagens em Vídeo

16 Ambientes Virtuais Colaborativos

17

18 TV-Digital

19 Sub-divisão da Disciplina Visão de Baixo Médio Alto-Nível

20 Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a: Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica Filtragem: Espacial e Freqüência Processamento baseado em Cor: Sistemas de Cores Processamento Baseado em Gradiente: Detectores de Direção Processamento Baseado em Textura: Matriz de Co-ocorrência Compressão de Imagens: Compressão JPEG Compressão de Vídeos: Detecção de Transição Registro de Imagens: Entropia: Tradicional e Não-Extensiva Morfologia Matemática

21 Visão de Médio Nível: Geralmente é abordado, mas não necessariamente restrito a: Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento Clusterização: K-Means, SOM, outros métodos, Crescimento De Região Entropia: Tradicional e Não-Extensiva Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo

22 Visão de Alto Nível: Geralmente é abordado, mas não necessariamente restrito a: Representação de Cenas: Código de Cadeia, Assinaturas de Imagens, Aproximação Poligonal, Squeletização Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos

23 Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a Restauração de Imagens: Melhoramento de Imagens: Espacial e Freqüência Filtragem: Espacial e Freqüência Processamento baseado em Cor Processamento Baseado em Gradiente Processamento Baseado em Textura

24 Curso de Visão 2010: PEL205 Regras: Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível Prova Final (PF): Todo o Conteúdo Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF Média < 5.0 = D (Reprovado) 5.0 <= Média < 7.5 = C 7.5 <= Média < 8.5 = B 8.5 <= Média = A

25 Trabalhos Teóricos-Práticos Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível; Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional. Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso. OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina.

26 TTP-I Assunto: Visão de Baixo Nível Equipe GW: Guilherme e Werner O artigo consta do tema de Análise de Vídeo explorando o tema Entropia Não-Extensiva para Detecção de Transições. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube. Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010

27 TTP-I Assunto: Visão de Baixo Nível Equipe CAP: Celso, André e Puff O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia Não- Extensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outras sugeridas. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: disponível com o Professor Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010


Carregar ppt "Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205."

Apresentações semelhantes


Anúncios Google