A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1.

Apresentações semelhantes


Apresentação em tema: "MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1."— Transcrição da apresentação:

1 MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia

2 ROTEIRO DA APRESENTAÇÃO Introdução Mineração de Dados Algoritmos Genéticos O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 2

3 INTRODUÇÃO 3 Fases do Processo de KDD (PAPPA, 2002 apud LIU; MOTODA, 1998) Utilização prática de bases de dados Fases do Processo de KDD Aplicação de algoritmos para extração de conhecimento a partir de bases de dados

4 Utilização de algoritmos genéticos no processo de KDD Motivação para utilização desta técnica 4 INTRODUÇÃO

5 MINERAÇÃO DE DADOS - ROTEIRO Introdução Mineração de Dados o Técnicas de Mineração de Dados o Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 5

6 TÉCNICAS PARA MINERAÇÃO DE DADOS - REGRAS DE CLASSIFICAÇÃO 6 Exemplo de Classificação (CARVALHO, 2005)

7 7 TÉCNICAS PARA MINERAÇÃO DE DADOS - CLUSTERIZAÇÃO Exemplo de dados organizados em clusters (CARVALHO, 2005)

8 8 TÉCNICAS PARA MINERAÇÃO DE DADOS – REGRAS DE ASSOCIAÇÃO

9 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos o Aspectos de um Algoritmo Genético O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 9

10 A SPECTOS DE UM A LGORITMO G ENÉTICO Método baseado nos princípios da seleção natural e evolução das espécies; Heurística de otimização global; Baseado na técnica de geração e teste; 10

11 A SPECTOS DE UM A LGORITMO G ENÉTICO 11 Esquema de um algoritmo genético (LINDEN, 2006)

12 A SPECTOS DE UM A LGORITMO G ENÉTICO Representação Cromossomial Diversas maneiras de representação: Binária: ( ) Números Reais: ( ) Lista de Regras: (R1 R2 R3... Rn) Nichos Biológicos Elitismo Função de Avaliação (Função de Fitness) Determina a qualidade de um indivíduo como solução do problema em questão (LINDEN, 2006) Um Algoritmo Genético é uma busca dirigida controlada pela função de avaliação 12

13 OPERADORES GENÉTICOS - SELEÇÃO Torneio Roleta É criada uma roleta, onde cada cromossomo recebe uma parte proporcional ao seu fitness em relação à soma total dos fitness de todos os cromossomos da população. 13 Grupo de indivíduos e seus respectivos fitness e parcela na roleta (LINDEN, 2006) Indivíd uo Fitn ess Pedaço da Roleta (%) Pedaço da roleta (°) Total Roleta Viciada para a população exemplo da tabela 3.1 (LINDEN, 2006)

14 OPERADORES GENÉTICOS - RECOMBINAÇÃO OU CRUZAMENTO (CROSSOVER) 14 Tipos de cruzamento (crossover) (CARVALHO, 2005)

15 OPERADORES GENÉTICOS - MUTAÇÃO

16 OPERADORES GENÉTICOS - MUTAÇÃO

17 OPERADORES GENÉTICOS - MUTAÇÃO

18 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Operadores Genéticos O Explorer Patterns Tools Aspectos da Implementação Experimentos e Resultados Conclusão e Trabalhos Futuros 18

19 A LGORITMO D ESENVOLVIDO Inicialização da População Operador de Seeding Elitismo Seleção de Pais Criação de nichos utilizando o operador sufrágio universal (universal suffrage) Cruzamento Cruzamento Uniforme (universal crossover) Mutação Probabilidade de mutação utilizada: 1/(tam. cadeia cromossômica) Função de Avaliação (Cálculo do Fitness do Indivíduo) 19

20 INICIALIZAÇÃO DA POPULAÇÃO Seja e um exemplo pertencente ao conjunto de treinamento E Gere uma cadeia aleatória de bits definindo um indivíduo K Transforme em 1 o menor número de bits em K para que K cubra e Retorne (K) 20

21 E LITISMO Nelit = 1 (o cromossomo de maior fitness é integralmente copiado para a próxima população) 21

22 B(t) = Selecione aleatoriamente, com reposição g * M exemplos de E Para cada exemplo K selecionado faça Para cada individuo I da população faça Se existe um indivíduo que cobre o K então armazene este indivíduo como um candidato Senão crie um novo indivíduo que cubra este exemplo e adicione a B(t) Fim Utilize o método da roleta para escolher apenas um indivíduo que receberá o voto deste exemplo e o adicione a B(t) Fim SELEÇÃO DE PAIS Sufrágio Universal (Universal Suffrage) 22

23 Verdadeiros Positivos (VP) Falsos Positivos (FP) Falsos Negativos (FN) Verdadeiros Negativos (VN) Acurácia 23 Figura Matriz de Confusão para uma Regra de Classificação (FREITAS, 2001). FUNÇÃO DE AVALIAÇÃO

24 Função de Fitness onde, e 24

25 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Aspectos de um Algoritmo Genético; O Explorer Patterns Tools Aspectos da Implementação; Experimentos e Resultados Bases de Dados Utilizadas Aspectos dos Experimentos Resultados Conclusão e Trabalhos Futuros 25

26 B ASES DE D ADOS U TILIZADAS 26 Informações sobre os conjuntos de dados (SOUZA, 2008) Conjuntos de DadosDomínioClasses Atributos de entrada Qtde. de instâncias SPAMBASEComercial Segment-challengeComercial Segment-testComercial IrisBiológico34150

27 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Operadores Genéticos O Explorer Patterns Tools Aspectos da Implementação Experimentos e Resultados Bases de Dados Utilizadas Aspectos dos Experimentos Resultados Conclusão e Trabalhos Futuros 27

28 DESCRIÇÃO DOS EXPERIMENTOS Experimento 1 – Comparação entre as acurácias do algoritmo implementado e das árvores clássicas/fuzzy 300 execuções do algoritmo; 60% da base de dados utilizada para treinar o algoritmo utilizando o método de divisão por porcentagem; 10 folds quando utilizada a validação cruzada; Experimento 2 – Estudo do aumento de gerações X taxas de acurácia Validação cruzada com 10 folds; 28

29 R ESULTADOS – E XPERIMENTO 1 Resultados Obtidos para o Algoritmo Genético Implementado – Média Aritmética dos Resultados Obtidos Conjuntos de DadosPrecisão das Regras Taxa de VP Acurácia SPAMBASE0,6290,2600,520 Segment-challenge0,3690,3970,820 Segment-test0,3830,4080,830 Iris0,6110,5960,726 29

30 R ESULTADOS – E XPERIMENTO 2

31 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Aspectos de um Algoritmo Genético; O Explorer Patterns Tools Aspectos da Implementação; Experimentos e Resultados Bases de Dados; Aspectos dos Experimentos; Conclusão e Trabalhos Futuros 31

32 CONCLUSÃO 32 Visão Geral O algoritmo implementado Resultados Obtidos

33 T RABALHOS F UTUROS 33 A implementação de um outro algoritmo genético que utilize operadores diferentes dos utilizados pelo algoritmo desenvolvido neste trabalho; A Implementação de métodos de seleção de atributos para diminuir o tempo de execução dos algoritmos implementados; Utilização de outras técnicas de mineração de dados diferentes da classificação.

34 MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Salvador – Bahia


Carregar ppt "MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1."

Apresentações semelhantes


Anúncios Google