A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Detector de barba em fotografias Redes Neurais/Inteligência Artificial Gean Paulo Barros Kláudio Henrique M. Medeiros Laura Dutra de Menezes.

Apresentações semelhantes


Apresentação em tema: "Detector de barba em fotografias Redes Neurais/Inteligência Artificial Gean Paulo Barros Kláudio Henrique M. Medeiros Laura Dutra de Menezes."— Transcrição da apresentação:

1 Detector de barba em fotografias Redes Neurais/Inteligência Artificial Gean Paulo Barros Kláudio Henrique M. Medeiros Laura Dutra de Menezes

2 Definição do problema Em bancos de dados com muitas imagens, é importante nos apoiarmos em algumas características para separar os dados. Se a quantidade de dados for muito grande, fica inviável para um humano separar manualmente.

3 Descrição do projeto O projeto consiste na construção e treinamento de uma rede neural que classifique as pessoas em imagens passadas para ela como barbadas ou não.

4 Estratégias para resolução Para resolver o problema, usamos técnicas de Visão Computacional, Inteligência Artificial e Redes Neurais. Visão Computacional: detecção de faces, segmentação de imagens e extração de características. Redes Neurais: uso da abordagem Multi-Layer Perceptron, backpropagation.

5 Estratégias para resolução Durante este projeto, duas estratégias foram utilizadas. 1.Usamos um limiar para binarização da imagem, uma máscara de pesos e treinamos a rede. Uma pessoa seria classificada como barbada se a taxa de pixels pretos após a binarização fosse alto o suficiente. 2.Usamos a técnica de Local Binary Patterns (LBP) para calcular o valor de nível de cinza de um pixel em função de seus vizinhos, construímos um histograma de nível de cinza e treinamos a rede. Uma pessoa seria considerada barbada se houvesse uma quantidade suficiente de descontinuidades nas cores.

6 Estratégia da binarização

7 Elementos de Visão Computacional Binarização da imagem, segmentação da barba, cálculo de pontos pretos em cada segmento da imagem.

8 Elementos de Redes Neurais A rede neural Multi-Layer Perceptron usa backpropagation e minimização de erro no treinamento. A quantidade de épocas é critério de parada do treinamento (foi usado 3000). Usamos fotos de pessoas barbadas e não-barbadas para treinamento e fotos de pessoas barbadas, não-barbadas e fotos confusas no teste.

9 Elementos de Redes Neurais Rede neural usada para classificação.

10 Resultados obtidos Épocas = 2000 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Taxa de acerto = 32/38 (84%)

11 Resultados obtidos Épocas = Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: E-6 Expected: 1.0 Output: Expected: Output: Expected: 1.0 Output: Expected: 1.0 Output: E-5 Expected: 1.0 Output: Expected: 1.0 Output: E-9 Expected: 1.0 Output: E-5 Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: E-4 Expected: 1.0 Output: Expected: 1.0 Output: E-4 Expected: 0.0 Output: Expected: 0.0 Output: E-7 Expected: 0.0 Output: E-6 Expected: 0.0 Output: E-5 Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: E-6 Expected: 0.0 Output: E-5 Expected: 0.0 Output: E-6 Expected: 0.0 Output: E-4 Expected: 0.0 Output: E-5 Expected: 0.0 Output: Expected: 0.0 Output: E-6 Expected: 0.0 Output: E-6 Expected: 0.0 Output: E-5 Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Taxa de acerto = 29/38 (76%)

12 Casos positivos (binarização) Ótimo para classificar pessoas com barba escura. Bom para classificar pessoas com barba densa.

13 Casos negativos (binarização) Péssimo para classificar pessoas com pele escura ou barba clara. Não muito bom para pessoas de barba rala. Não muito bom com pessoas que usam roupas escuras (podem eventualmente aparecer na segmentação).

14 Estratégia do LBP

15 Local Binary Patterns LBP é uma técnica usada em reconhecimento de faces e detecção de texturas. O valor de um pixel será substituído pelo código gerado.

16 Local Binary Patterns

17 Na implementação mais usual de LBP, são feitas comparações na forma: if (valor do pixel < centro) then ligue o bit correspondente no código Conseguimos um resultado melhor adaptando estes trechos para: if (Math.abs(valor do pixel – centro) > 20) then ligue o bit correspondente no código

18 Histograma de Local Binary Pattern Feito este processo, foi construído um histograma com 256 entradas. Para cada entrada, foi calculado a porcentagem de pixels na imagem naquela classe.

19 Elementos de Redes Neurais A rede neural Multi-Layer Perceptron usa backpropagation e minimização de erro no treinamento. A quantidade de épocas é critério de parada do treinamento (foi usado ). A quantidade de entradas na rede agora é 256 (uma para cada nível de cinza após o LBP), portanto foi necessário uma quantidade (bem) maior de épocas.

20 Resultados obtidos Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: E-4 Expected: 1.0 Output: Expected: 1.0 Output: Expected: 1.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Output: Expected: 0.0 Taxa de acerto: 30/38 (78%)

21 Casos positivos (LBP) Muito bom para detectar barba rala ou curta. Bom com pessoas de barba mais clara (pois o LBP irá tratar barbas claras e escuras da mesma forma).

22 Casos negativos (LBP) Mau quando a barba é densa a ponto de não haver textura. Se a pele for porosa ou os pelos de barba forem muito curtos, a rede pode confundir com textura de barba.

23 Binarização vs LBP Binarização funciona bem em alguns casos, mas é uma implementação que funciona mal com barbas claras (não serão barbadas) e pessoas negras (serão barbadas). Local Binary Patterns trata textura e não cor, e possui resultados mais coerentes em uma diversidade maior de situações. Porém é bastante sensível a barbas curtas demais (o indivíduo será barbado mesmo que tenha pouca barba). Concluímos então que LBP é a técnica mais apropriada para esta situação.

24 Demonstração prática


Carregar ppt "Detector de barba em fotografias Redes Neurais/Inteligência Artificial Gean Paulo Barros Kláudio Henrique M. Medeiros Laura Dutra de Menezes."

Apresentações semelhantes


Anúncios Google