A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Seleção de Características. Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de.

Apresentações semelhantes


Apresentação em tema: "1 Seleção de Características. Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de."— Transcrição da apresentação:

1 1 Seleção de Características

2 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II2 Seleção de Características Objetivo: Dado um conjunto de medidas no espaço p- dimensional, selecionar entre as componentes deste vetor, t-dimensões que sejam as mais importantes para resolver o problema da classificação. Seleção de características x(1,2,3,...,100)y=x(2,7,23,54) p=100-D t=4-D Ex.: IDM (Interclass Distance Measurement)

3 3 Extração de Características

4 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II4 Extração de Características Objetivo: Dado um conjunto de medidas no espaço p- dimensional, extrair destes dados informações que sejam realmente úteis para a classificação reduzindo para um vetor de t-dimensões. Seleção de características x(1,2,3,...,100)y(1,2,3,4) p=100-D t=4-D Ex.: Técnicas de Processamento de Imagens/Voz Análise espectral PCA

5 5 PCA

6 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II6 Análise de Componentes Principais Pearson (1901): Procurava linhas e planos que melhor se adequavam a um conjunto de pontos em um espaço p-dimensional. Criou a Componente Principal (PC) Hotelling (1933): Procurava encontrar um pequeno conjunto de variáveis fundamentais que expressa p variáveis. Hotelling procurou maximizar suas componentes no senso da variância das variáveis originais. Chamou de Componentes Principais.

7 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II7 Ambos, Pearson e Hotelling, esbarraram no problema dos autovetores (difícil de calcular para ordem > 4). Como o PCA é mais eficiente para conjuntos de dados de alta ordem, não se viu muita aplicação. O tema ficou em banho-maria até os anos 60, quando então surgiram os primeiros computadores capazes de resolver o problema dos autovetores de maneira rápida. Karhunen e Loève aplicam PCA para codificação de sinais (KLT).

8 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II8 Desenvolvimento Matemático do PCA A principal idéia por atrás do PCA é que: um número, p, de variáveis dependentes podem ser expressas como um número, t, de variáveis independentes, t<


9 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II9 Sem perda de informação, x pode ser expresso como: Se somente t dimensões são usadas, então teremos alguma perda de informação, e podemos estimar

10 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II10 Objetivo: Encontrar e j de modo que o erro da estimação seja minimizado. Juntamente com a minimização da Eq.3, precisamos garantir que o conjunto e j seja ortonormal

11 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II11 Substituindo Eq.1 e 2 na Eq. 3 Aplicando a condição de ortonormalidade de e j

12 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II12 Multiplicando ambos os lados da Eq. 1 por e j T Substituindo na Eq. 7

13 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II13 Invertendo a ordem do somatório e operador Expectativa, e sabendo que e j é determinístico: Notando que a matriz entre colchetes é a Matriz de Autocorrelação do conjunto de vetores x Podemos, sem perda de generalidade, usar a Matriz de AutoCovariância

14 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II14 Logo a expressão que devemos minimizar é: de modo a encontrar a base ótima e j Isso é feito derivando-se e igualando a zero. No entanto a derivada deve ser feita de modo que a condição da Eq. 4 (ortonormalidade), permaneça sendo cumprida

15 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II15 Este problema é resolvido através da definição de uma função de restrição g(e j ), e usando a técnica dos Multiplicadores de Lagrange: Derivando a Eq. 13 e igualando a zero, temos: onde, I é matriz identidade

16 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II16 Problema dos Autovalores A Eq. 15 é chamada de Problema dos Autovalores, usada em várias áreas. j é o j-ésimo autovalor associado ao autovetor e j Desde que a Eq. 15 corresponde a um sistema homogêneo de equações lineares e que possui uma solução não-trivial, o determinante da matriz de coeficientes deve ser ZERO.

17 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II17 Desenvolvendo a Eq. 16 o polinômio característico é obtido, as raízes deste polinômio são os autovalores j da matriz C x. Como encontrar algebricamente as raízes de um polinômio de grau maior que 4 é complicado, usa-se métodos numéricos (HP).

18 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II18 Matriz de Covariância A matriz R xx é conhecida como a matriz de Autocorrelação do conjunto de vetores x. Geralmente se retira o valor médio do conjunto de dados, de modo a definirmos a Matriz Covariância: o j-ésimo autovalor da matriz de covariância é igual à variância do j-ésimo autovetor.

19 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II19 Assim, caso o número N de vetores seja menor que o número de dimensões p: O numero de autovalores não-nulos é igual ao número de vetores x do conjunto, se a matriz de correlação é calculado a partir desse conjunto. Dado um conjunto de N vetores x, existem apenas N-1 vetores linearmente independentes, caso seja usado a matriz de covariância.

20 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II20 O Mapeamento Resolvendo-se o problema dos autovalores, determina-se os autovetores que minimizam o erro de representação. Definindo-se a matriz de transformação A como: onde os p autovetores são as colunas da matriz A.

21 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II21 Podemos mapear cada vetor no espaço p-dimensional para um vetor no espaço t-dimensional, através do truncamento das colunas da matriz A utilizando apenas t autovetores (geralmente considera-se os autovetores associados aos maiores autovalores) Extração de Características: Espaço de Características t-dimensional

22 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II22 Utilização do PCA Objetivo: reduzir a dimensionalidade do espaço de entrada p-D, mantendo tanta informação quanto possível, em um novo espaço t-D. Adquirir os dados: Número de vetores... Calcular a Matriz de Covariância Calcular os Autovalores e Autovetores Escolher os autovetores: Critério da informação... Mapear os dados para o novo espaço

23 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II23 Exemplo: Reconhecimento de Face EigenFaces

24 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II24 Exemplo: Reconhecimento Posturas Manuais Imagens 100x100 Imagens 32x32

25 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II25

26 Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de Sinais II26 Eigenletters s/Sumner/final/report.html s/Sumner/final/report.html Eigeneyes Eigenvoice Eigenqualquercoisa


Carregar ppt "1 Seleção de Características. Universidade Federal do Paraná Setor de Tecnologia Departamento de Engenharia Elétrica TE073 – Processamento Digital de."

Apresentações semelhantes


Anúncios Google