Projetos Prof.: Alceu de Souza Britto Jr. Laboratório LUCI – PPGIA alceu@ppgia.pucpr.br
Área: Reconhecimento de Padrões Mestrado Reconhecimento de Textos Manuscritos Segmentação de Documentos Análise de Imagens Médicas Análise e Sumarização de vídeos Graduação Replaca: Localização e Reconhecimento da Placa do Veículo em Imagens Digitais GED: Gerenciamento Eletrônico de Documentos Segmentação de Caracteres Conectados Motivação: Contribuir para a pesquisa desta área que ainda está em aberto e chegar a uma solução própria para este problema que seja robusta o sufciente, visto que as solução atuais ou são caras demais ou não atendem ao resquisitos de performance necessários. Objetivo:Localizar em uma imagem digital de um veículo regiões que possam ser consideradas candidatas à placa.
Reconhecimento Textos Manuscritos Palavras Variações de estilos Variações de Tamanho Inclinações
Reconhecimento Textos Manuscritos Palavras Caracteres Fragmentados Variações de Contexto Léxico
Reconhecimento Textos Manuscritos Palavras 1º Estágio Léxico PP 34 primitivas ECT CS Ranking 1 After 2 after 3 AFTER . N All Pontos de Segmentação “after” 2º Estágio Ranking 1 after 2 AFTER 3 After . N All 47 primitivas ECTF R
Reconhecimento Textos Manuscritos Cadeias Numéricas Definição do Problema Reconhecimento de cadeias numéricas manuscritas. quantidade de dígitos desconhecida a priori variação de tamanho variação inclinação dígitos fragmentados dígitos sobrepostos dígitos conectados Fatores de complexidade Como já mencionado o foco de nosso trabalho está relacionado ao reconhecimento de cadeias numéricas manuscritas cujo tamanho, ou seja, quantidade de dígitos, desconhecimento a priori. Esta tarefa nada trivial tem como fatores de complexidade: a variação de tamanho entre as cadeias ou ainda dos dígitos dentro de uma mesma cadeia. A variação de inclinação vertical da cadeia numérica. Problemas que dificultam a modelagem de classes de dígitos uma vezx que aumentam a variabilidade da escrita. A fragmentação, a sobreposição e a presença de dígitos conectados, as quais tornam difícil a idéia básica de segmentar a cadeia em dígitos para então reconhece-los.
Reconhecimento Textos Manuscritos Cadeias Numéricas Estágio SCB (String-Contextual Based) Estágio de Verificação Pré-processamento hipóteses 489 - 0.420, 488 - 0.301, 408 - 0.230, …. hipóteses re-ordenadas 488 - 0.710, 489 - 0.201, 408 - 0.050, …. FFE SR FBFE Verificação - O método proposto consiste em dois estágios: - O estágio SCB (String-Contextual Based) - que significa baseado no contexto de cadeias numéricas. - integra segmentação e reconheicmento usando uma abordagem de segmentação implícita baseada em Modelos de Markov. - considera informação de contexto relacionada a variação de inclinação vertical e tamanho de cadeias numéricas durante o treinamento dos modelos de Markov - - tem como saída hipóteses de segmentação e reconhecimento para uma dada cadeia numérica. - o estágio de verificação verifica e re-ordena as hipóteses geradas no 1o. Estágio com base em um classificador de dígitos isolados baseado em Modelos Escondidos de Markov. integra segmentação e reconhecimento; baseia-se em abordagem de segmentação implícita usando MEM; considera informação de contexto gera hipóteses de segmentação/reconhecimento verifica e reordena as hipóteses geradas no 1o estágio; baseia-se em um classificador de dígitos isolados usando MEM;
Segmentação de Documentos Localização da Informação de Interesse A implementação do módulo de pré-processamento foi baseada em análises preliminares elaboradas a partir de cadeias numéricas extraídas da base NIST SD19. Inicialmente foram extraídas mais de 100.000 cadeias numéricas dos formularios da base NIST SD19. Para elaborar a análises preliminares a serem apresentadas utilizamos um subconjunto composto de 44.256 cadeias numéricas e 197.784 dígitos isolados. Esse subconjunto foi criado de tal forma que sabemos a cadeia numérica de origem de cada dígito isolado.
Segmentação de Documentos Localização do bloco-endereço em envelopes postais
Extração do Bloco-Endereço
Localização Linhas no Bloco-Endereço Extração do CEP
Reconhecimento do CEP Ruído 37430-000
Análise de Imagens Médicas Quantificação Muco Intestinal Mucina Biópsia Retal Mucosa Célula secretora
Quantificação Muco Intestinal Biópsia Mucina (MUC) Células secretoras (CSE) 29,0% MUC/Biopsia 42,2% MUC/CSE
Replaca Localização e Reconhecimento de Placas de Veículos Descrever brevemente as etapas do que seria um sistema completo para o reconhecimento da placa, e citar que o nosso projeto se restringe a etapa de número 3.
Questões ? Contato: alceu@ppgia.pucpr.br Obrigado !!!!