Rafael Lima(ragpl) Recife, 29 de Junho de 2010
Descrição do problema Redes Neurais Artificiais Preparação dos dados O experimento Resultados Conclusões Bibliografia
Deseja fritas para acompanhar!? Direcionamento de Produtos 35% das vendas do Amazom
Baseadas nas redes neurais biológicas Neurônio de McCulloch & Pitts Caracteristicas desejadas ◦ Aprendizagem através de exemplos ◦ Adaptabilidade ◦ Capacidade de generalização ◦ Tolerância a ruídos Dendritos Axônio
Rede feed forward com mais de uma camada de neurônios Aproximador universal de funções Uma única camada é suficiente para aproximar qualquer superficie contida num hipercubo
Base de dados PAKDD: ◦ 40700amostras Processamento para procura de inconsistências: ◦ 23 instancias repetidas removidas PAKDD: ◦ amostras de C1 ◦ 700 amostras de C
Divisão dos dados ◦ amostras de C1 ◦ 700 amostras de C
Divisão dos dados ◦ amostras de C1 ◦ 700 amostras de C2 Treinamento com validação cruzada ◦ 50% treinamento ◦ 25% validação ◦ 25% teste Conjuntos de dados são normalizados ◦ Replicar dados do conjunto menor ◦ Selecionar dados do conjunto maior Randomização C2C1
Primeira fase ParâmetroValores testados Número máximo de iterações de treinamento (épocas) 50, 250 e 1250 Quantidade máxima de erros na validação 20 Algoritmo de aprendizagem Back Propagation e Levenberg-Marquardt Algoritmo de treinamento ‘learngdm’ Função de ativação das camadas intermediária e de saída Sigmóide Logística e Tangente Hiperbólica Taxa de aprendizagem 0.01, e Quantidade de neurônios na camada escondida 1, 6 e 36
Primeira fase (REPLICADA) ◦ 90 redes testadas ◦ Script MATLAB calculou, gerou gráficos de desempenho e curvas ROC automaticamente. ◦ Dados guardados em arquivos txt e bmp ◦ Configurações comparadas com auxílio do excel
Segunda fase (REDUZIDA) ◦ As 5 redes com menor MSE de teste da primeira fase Terceira fase (REPETIÇÃO) ◦ Selecionadas duas redes: Menor MSE de teste Maior AUC da curva ROC
Resultados primeira fase: ◦ 32 configurações com MSE teste < 0.22 Resultados segunda fase: ◦ Das 5 configurações apenas uma apresentou MSE de teste maior do que na primeira fase Resultados terceira fase: ◦ BTA x BNME = Rede instável ◦ Aleatorização inicial dos pesos com alta influência
Primeira Fase Configuração Número de iterações de treinamento 50 Taxa de aprensizagem0.001 Nós da camada intermediaria6 Função de ativaçãoSigmóide Logística Algoritmo de aprendizagemGradient descent backpropagation Resultados MSE Treinamento MSE Validação MSE Teste Taxa de erro % (TESTE) Área sob a curva0.495 Matriz de Confusão Resposta desejada Resposta da rede C1C2 C C
Segunda fase: Configuração Número de iterações de treinamento 50 Taxa de aprensizagem0.001 Nós da camada intermediaria6 Função de ativaçãoSigmóide Logística Algoritmo de aprendizagemGradient descent backpropagation Resultados MSE Treinamento MSE Validação MSE Teste Taxa de erro % (TESTE) Área sob a curva0.522 Matriz de Confusão Resposta desejada Resposta da rede C1C2 C C
Tegunda fase: Taxa de Erro(%)MSE de TesteÁrea sob a Curva ROC Media Desvio Padrão Máximo Mínimo
Primeira fase: Configuração Número de iterações de treinamento 1250 Taxa de aprensizagem0.001 Nós da camada intermediaria6 Função de ativaçãoSigmóide Logística Algoritmo de aprendizagemLevenberg- Marquardt Resultados MSE Treinamento MSE Validação MSE Teste Taxa de erro % (TESTE) Área sob a curva0.696 Matriz de Confusão Resposta desejada Resposta da rede C1C2 C C
Segunda fase Resultados MSE Treinamento MSE Validação MSE Teste Taxa de erro % (TESTE) Área sob a curva0.657 Matriz de Confusão Resposta desejada Resposta da rede C1C2 C C Configuração Número de iterações de treinamento 1250 Taxa de aprensizagem0.001 Nós da camada intermediaria6 Função de ativaçãoSigmóide Logística Algoritmo de aprendizagemLevenberg- Marquardt
Terceira fase Taxa de Erro(%)MSE de TesteÁrea sob a Curva ROC Media Desvio Padrão Máximo Mínimo