Visão Computacional Mestrado e Doutorado em Engenharia Elétrica Prof. Dr. Paulo Sérgio Rodrigues www.fei.edu.br/~psergio
O que é Visão Computacional? Estuda e desenvolve um conjunto de métodos e técnicas os quais podem tornar um sistema computacional capaz de interpretar imagens. O que é Visão Computacional?
Carro de exploração Lunar Visão Computacional Alto Nível Baixo Nível Médio Nível Segmentação Reconhecimento Carro de exploração Lunar
Nível Baixo Melhoria da qualidade da imagem: Remoção de ruídos da imagem Melhoria do contraste da imagem Remoção de borrões da câmera Remoção de manchas de movimentos Realce da estrutura Realce das cores Processamento de Imagem é utilizado para melhorar a aparência visual da imagem e/ou realçar as características desejadas Nível Baixo
Extração de Regiões que compõem partes de um objeto ou cena Também podem ser extração de primitivas como curvas, retas, polígonos, elipses, ... Geralmente, as regiões isoladas não fazem nenhum sentido pra quem observa. Nível Médio
Nível Alto Técnicas para interpretação de objetos ou cenas Regiões, em conjunto, passam a fazer sentido Raciocínio cognitivo Inferência de informações Nível Alto
Nível Alto Raciocínio cognitivo: Inferência do Contexto para interpretação de objetos ou cenas
Técnicas de Baixo nível Filtro Gaussiano (5x5) Filtro Mediana (5x5) Imagem original Filtro média (5x5) Filtro Mediana (5x5) Filtro média (5x5)
Técnicas típicas de Visão de Médio Nível: Detecção de Retas Transformada de Hough Imagem binária (bordas) Retas detectadas com a Transformada de Hough
Análise de Imagens com Base em informações de Cor, Forma ou Textura
Técnicas típicas de Visão de Alto Nível: Inferência Baseada em Contexto
Técnicas típicas de Visão de Alto Nível: Inferência Baseada em Contexto
Técnicas Típicas de Visão de Alto Nível: Inferência de Jogadores em Quadra Imagem: Janus z Konrad – Boston University Imagem: Boston University
Aplicações: Biometria Reconhecimento de digital Detecção de Faces Imagem: Sony ® e S. Seitz
Aplicações: leitor de placas imagem: S. Seitz
Aplicações: Inspeção de Fábrica
Aplicações: Veículo Autônomo
Sistema CAD (Computer Aided Diagnosis)
Extração da Lesão Saída do Ultra-som
Sistema CAD com entropia Não-extensiva Morfologia Segmentação Level Sets
Extração de Características Sistema CAD: Etapas Extração da lesão Área Circularidade Protuberâncias Sombra acústica Reforço acústico Homogeneidade RNA Fuzzy Bayes SVM Classificação Saída do Ultra-som Extração de Características Região da Lesão Maligno Benigno
TCCs na área de Visão Computacional desenvolvidos na FEI Reconhecimento Facial com o Número de Fibonacci (Primeiro Lugar na EXPOCOM 2007)
TCCs desenvolvidos na FEI EVIP” - EXPANSÃO VISUAL DE EXIBIÇÕES EM SUPERFÍCIES PLANAS ( 3 Prêmios EXPOCOM 2008: Melhor Criatividade e Melhor trabalho Científico e Melhor Trabalho Geral)
Análise e Visualização de Imagens Médicas: Reconstrução Craniofacial e Previsibilidade de Resultados LNCC • USP-SC • CENPRA • CHSC • INTO Objetivo: Reparar anomalias de crânio e face através da construção automática de próteses
Reconstrução Cranio-Facial: Metodologia
Caso de Perda de massa óssea frontal
Prototipagem: Responsável: USP de São Carlos
PRÓTESE CRANIANA MODELOS MÉDICOS 3D: paciente antes de depois da cirurgia
PRÓTESE CRANIANA MODELOS MÉDICOS 3D: Momento da Cirurgia de implante da prótese craniana b c d
Instantes da Prototipagem Rápida
RECONSTRUÇÃO FACIAL. Caso de Câncer de Mandíbula RECONSTRUÇÃO FACIAL. Caso de Câncer de Mandíbula. Paciente antes e depois. A foto do meio abaixo (o crânio com meia mandíbula) mostra a construção antes do implante. As duas fotos abaixo mostram a paciente hoje, e as duas acima, a paciente com defeito de frente e de perfil.
TCCs desenvolvidos na FEI MAART
Reconhecimento de Logomarcas em Jogos de Futebol Integrantes: Allan Martins de Paula Felipe Gomes Magarotto Lucas Martins Baia Rozivaldo Zacarias de Jesus Orientador: Paulo Sérgio Silva Rodrigues
Motivação Interesse das emissoras de TV; Software não existe comercialmente; Atualmente o processo é feito manualmente, demandando um total de 18 horas por jogo distribuídas em 5 dias.
Objetivo Automatizar um processo e assim, gerar um relatório informando quanto tempo as propagandas que estão ao redor do campo apareceram na transmissão.
Definição de tipos de Câmera Câmera Principal Não-Câmera Principal
Setores do Campo
Regiões durante a transmissão
Metodologia Definição de câmera Frame Principal
Definição de câmera-principal Detecção de Bordas Metodologia
Detecção de Bordas Detecção de Linhas Metodologia
Metodologia Detecção de Linhas Definição das Regiões de Interesse (ROI) Metodologia
Metodologia Definição da ROI Matching
Metodologia Tracking e ROL Arquivo Individual Contabiliza Tempo Próximo Frame
Grandes Desafios Futuros Visão Computacional Grandes Desafios Futuros
Telemedicina
Gerenciamento de Grandes Bases de Dados
Análise de Imagens em Vídeo
Ambientes Virtuais Colaborativos
Ambientes Virtuais Colaborativos
TV-Digital
Bibliotecas MATLAB e OPENCV (Intel)