A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Reconhecimento de Padrões Dissimilaridade David Menotti, Ph.D. www.decom.ufop.br/menotti Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação.

Apresentações semelhantes


Apresentação em tema: "Reconhecimento de Padrões Dissimilaridade David Menotti, Ph.D. www.decom.ufop.br/menotti Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação."— Transcrição da apresentação:

1 Reconhecimento de Padrões Dissimilaridade David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência da Computação (PPGCC)

2 Introdução Reconhecimento de padrões em geral baseia-se na extração de características capazes de discriminar objetos de diferentes classes. Em alguns casos, porém, a extração de características se torna complicada –Desconhecimento do problema –Dificuldade em definir características

3 Introdução Nesses casos, medidas de dissimilaridade se tornam bastante interessantes. Dissimilaridade –Valor que expressa a diferença entre dois objetos –Zero quando os objetos são idênticos. Dissimilarity-based Pattern Recognition

4 Dissimilaridade para Representação A percepção humana nos permite reconhecer características comuns em uma coleção de objetos. Em alguns casos pode ser difícil formalizar esse conhecimento. Considere as figuras abaixo

5 Dissimilaridade para Representação Várias medidas podem ser usadas –Em geral depende do problema

6 Motivação Objetos similares podem ser agrupados –Pertencem a mesma classe. A comparação sempre se dá com base em um objeto de referência. –Um ponto de vista particular –Características básicas. –Em outras palavras, levando em consideração o contexto. –Por exemplo, dois irmãos podem não ser parecidos, porém quando comparados na presença de seus pais, pode-se constatar que são parecidos.

7 Matriz de Dissimilaridade A representação por dissimilaridade é baseada na comparação entre todos os objetos envolvidos. Isso nos leva a uma matriz D, na qual cada elemento da matriz representa o valor de dissimilaridade entre dois objetos. Considere por exemplo, os seguintes objetos de duas classes:

8 Matriz de Dissimilaridade A matriz de dissimilaridade ficaria assim

9 Classificando por Dissimilaridade Vizinho mais próximo –Classificar um objeto X desconhecido na classe com menor dissimilaridade. –Não usa a matriz de dissimilaridade Class( X ) = label(argmin( d i ))

10 Classificando por Dissimilaridade Espaço de dissimilaridade –Utiliza cada coluna da matriz de dissimilaridade como um vetor de características. –Qualquer algoritmo de classificação pode ser utilizado. –Seleção dos vetores pode ser benéfica.

11 Classificando por Dissimilaridade Considere por exemplo –3 classes Classe 1: 4 objetos Classe 2: 3 objetos Classe 3: 3 objetos Matriz de Dissimilaridade Hipotética Note que os vetores de características, (colunas) são similares para objetos da mesma classe. Como classificar um exemplo novo X? -Comparar com a base de referência. -Gerar o vetor de dissimilaridades.

12 Classificador Universal A idéia de dissimilaridade pode ser estendida, permitindo assim a construção de um classificador universal. Bastante interessante quando o número de classes é bastante grande –Verificação de Assinaturas –Identificação de Autoria –Recuperação de Imagens Converter um problema de N classes para duas classes: Similar ou Não Similar.

13 Classificador Universal Para tornar isso possível, é necessário contar com um conjunto de referência. Diferentemente da classificação baseada em dissimilaridade, nesse caso a dissimilaridade é calculada para o vetor de característica. Se dois objetos pertencem a mesma classe, os componentes do vetor de dissimilaridade terão valores próximo de zero, caso contrário, terão valores longe de zero. –V = |A – B|

14 Estudo de Caso Identificação de Autoria –Suponha que você precise construir um sistema que diga se o documento foi escrito por uma determinada pessoa. –Para treinar seu sistema, estão disponíveis 20 autores, sendo que cada autor contribui com 10 amostras de documentos. –Opção 1: Criar um classificador com 20 classes O que acontece se novos autores forem adicionados? –Opção 2: Dissimilaridade

15 Exemplos de Textos Autor 2 Autor 1

16 (A) (B) (C) (D) |A-B| |C-D| |A-C| Base de Treinamento Vetor Próximo de Zero Vetor Próximo de Zero Vetor Longe de Zero Calculando Dissimilaridades

17 Treinamento Gerar os vetores de dissimilaridade para duas classes –Genuíno Vetores resultantes das comparações entre os exemplos de mesmos autores Vetores próximo de zero –Falsificação Vetores resultantes da comparações entre os exemplos de diferentes autores Vetores longe de zero

18 Teste Dado um exemplo questionado de um certo autor X –Comparar esse exemplo com as referências do autor X. –Se o exemplo questionado for realmente do autor X, a tendência é que essa comparação gere vetores próximos de zero. Logo, pertencente a classe de genuíno.

19 Teste Como geralmente existe mais de um exemplo de referência, algum método de tomada de decisão deve ser utilizado –Voto –Max

20 Vantagem Adição de novos objetos sem a necessidade de re-treinar o classificador. Redução de um problema de N classes para 2 classes.


Carregar ppt "Reconhecimento de Padrões Dissimilaridade David Menotti, Ph.D. www.decom.ufop.br/menotti Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação."

Apresentações semelhantes


Anúncios Google