A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1.

Apresentações semelhantes


Apresentação em tema: "MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1."— Transcrição da apresentação:

1 MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1

2 ROTEIRO DA APRESENTAÇÃO Introdução Mineração de Dados Algoritmos Genéticos O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 2

3 INTRODUÇÃO 3 Fases do Processo de KDD (PAPPA, 2002 apud LIU; MOTODA, 1998) Utilização prática de bases de dados Fases do Processo de KDD Aplicação de algoritmos para extração de conhecimento a partir de bases de dados

4 Utilização de algoritmos genéticos no processo de KDD Motivação para utilização desta técnica 4 INTRODUÇÃO

5 MINERAÇÃO DE DADOS - ROTEIRO Introdução Mineração de Dados o Técnicas de Mineração de Dados o Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 5

6 TÉCNICAS PARA MINERAÇÃO DE DADOS - REGRAS DE CLASSIFICAÇÃO 6 Exemplo de Classificação (CARVALHO, 2005)

7 7 TÉCNICAS PARA MINERAÇÃO DE DADOS - CLUSTERIZAÇÃO Exemplo de dados organizados em clusters (CARVALHO, 2005)

8 8 TÉCNICAS PARA MINERAÇÃO DE DADOS – REGRAS DE ASSOCIAÇÃO

9 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos o Aspectos de um Algoritmo Genético O Explorer Patterns Tools Experimentos e Resultados Conclusão e Trabalhos Futuros 9

10 A SPECTOS DE UM A LGORITMO G ENÉTICO Método baseado nos princípios da seleção natural e evolução das espécies; Heurística de otimização global; Baseado na técnica de geração e teste; 10

11 A SPECTOS DE UM A LGORITMO G ENÉTICO 11 Esquema de um algoritmo genético (LINDEN, 2006)

12 A SPECTOS DE UM A LGORITMO G ENÉTICO Representação Cromossomial Diversas maneiras de representação: Binária: (1 0 1 0 0 1 0) Números Reais: (4.6 5.9 2.0 8.6) Lista de Regras: (R1 R2 R3... Rn) Nichos Biológicos Elitismo Função de Avaliação (Função de Fitness) Determina a qualidade de um indivíduo como solução do problema em questão (LINDEN, 2006) Um Algoritmo Genético é uma busca dirigida controlada pela função de avaliação 12

13 OPERADORES GENÉTICOS - SELEÇÃO Torneio Roleta É criada uma roleta, onde cada cromossomo recebe uma parte proporcional ao seu fitness em relação à soma total dos fitness de todos os cromossomos da população. 13 Grupo de indivíduos e seus respectivos fitness e parcela na roleta (LINDEN, 2006) Indivíd uo Fitn ess Pedaço da Roleta (%) Pedaço da roleta (°) 000111.615.8 0011914.5152.2 01001625.8192.9 01103658.07209.1 Total62100360.0 Roleta Viciada para a população exemplo da tabela 3.1 (LINDEN, 2006)

14 OPERADORES GENÉTICOS - RECOMBINAÇÃO OU CRUZAMENTO (CROSSOVER) 14 Tipos de cruzamento (crossover) (CARVALHO, 2005)

15 1 0 0 1 1 0 1 1 15 OPERADORES GENÉTICOS - MUTAÇÃO

16 1 0 0 1 1 0 1 1 16 OPERADORES GENÉTICOS - MUTAÇÃO

17 1 0 0 0 1 0 1 1 17 OPERADORES GENÉTICOS - MUTAÇÃO

18 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Operadores Genéticos O Explorer Patterns Tools Aspectos da Implementação Experimentos e Resultados Conclusão e Trabalhos Futuros 18

19 A LGORITMO D ESENVOLVIDO Inicialização da População Operador de Seeding Elitismo Seleção de Pais Criação de nichos utilizando o operador sufrágio universal (universal suffrage) Cruzamento Cruzamento Uniforme (universal crossover) Mutação Probabilidade de mutação utilizada: 1/(tam. cadeia cromossômica) Função de Avaliação (Cálculo do Fitness do Indivíduo) 19

20 INICIALIZAÇÃO DA POPULAÇÃO Seja e um exemplo pertencente ao conjunto de treinamento E Gere uma cadeia aleatória de bits definindo um indivíduo K Transforme em 1 o menor número de bits em K para que K cubra e Retorne (K) 20

21 E LITISMO Nelit = 1 (o cromossomo de maior fitness é integralmente copiado para a próxima população) 21

22 B(t) = Selecione aleatoriamente, com reposição g * M exemplos de E Para cada exemplo K selecionado faça Para cada individuo I da população faça Se existe um indivíduo que cobre o K então armazene este indivíduo como um candidato Senão crie um novo indivíduo que cubra este exemplo e adicione a B(t) Fim Utilize o método da roleta para escolher apenas um indivíduo que receberá o voto deste exemplo e o adicione a B(t) Fim SELEÇÃO DE PAIS Sufrágio Universal (Universal Suffrage) 22

23 Verdadeiros Positivos (VP) Falsos Positivos (FP) Falsos Negativos (FN) Verdadeiros Negativos (VN) Acurácia 23 Figura 4.1 - Matriz de Confusão para uma Regra de Classificação (FREITAS, 2001). FUNÇÃO DE AVALIAÇÃO

24 Função de Fitness onde, e 24

25 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Aspectos de um Algoritmo Genético; O Explorer Patterns Tools Aspectos da Implementação; Experimentos e Resultados Bases de Dados Utilizadas Aspectos dos Experimentos Resultados Conclusão e Trabalhos Futuros 25

26 B ASES DE D ADOS U TILIZADAS 26 Informações sobre os conjuntos de dados (SOUZA, 2008) Conjuntos de DadosDomínioClasses Atributos de entrada Qtde. de instâncias SPAMBASEComercial2574601 Segment-challengeComercial7191500 Segment-testComercial719810 IrisBiológico34150

27 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Operadores Genéticos O Explorer Patterns Tools Aspectos da Implementação Experimentos e Resultados Bases de Dados Utilizadas Aspectos dos Experimentos Resultados Conclusão e Trabalhos Futuros 27

28 DESCRIÇÃO DOS EXPERIMENTOS Experimento 1 – Comparação entre as acurácias do algoritmo implementado e das árvores clássicas/fuzzy 300 execuções do algoritmo; 60% da base de dados utilizada para treinar o algoritmo utilizando o método de divisão por porcentagem; 10 folds quando utilizada a validação cruzada; Experimento 2 – Estudo do aumento de gerações X taxas de acurácia Validação cruzada com 10 folds; 28

29 R ESULTADOS – E XPERIMENTO 1 Resultados Obtidos para o Algoritmo Genético Implementado – Média Aritmética dos Resultados Obtidos Conjuntos de DadosPrecisão das Regras Taxa de VP Acurácia SPAMBASE0,6290,2600,520 Segment-challenge0,3690,3970,820 Segment-test0,3830,4080,830 Iris0,6110,5960,726 29

30 R ESULTADOS – E XPERIMENTO 2

31 A LGORITMOS G ENÉTICOS - R OTEIRO Introdução Mineração de Dados Técnicas de Mineração de Dados Utilização de Algoritmos Genéticos no processo de KDD Algoritmos Genéticos Aspectos de um Algoritmo Genético; O Explorer Patterns Tools Aspectos da Implementação; Experimentos e Resultados Bases de Dados; Aspectos dos Experimentos; Conclusão e Trabalhos Futuros 31

32 CONCLUSÃO 32 Visão Geral O algoritmo implementado Resultados Obtidos

33 T RABALHOS F UTUROS 33 A implementação de um outro algoritmo genético que utilize operadores diferentes dos utilizados pelo algoritmo desenvolvido neste trabalho; A Implementação de métodos de seleção de atributos para diminuir o tempo de execução dos algoritmos implementados; Utilização de outras técnicas de mineração de dados diferentes da classificação.

34 MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos E-mail: joilma@dcc.ufba.br Salvador – Bahia 2008 34


Carregar ppt "MINERAÇÃO DE DADOS UTILIZANDO ALGORITMOS GENÉTICOS Joilma Souza Santos Orientadora: Profª. Daniela Barreiro Claro Salvador – Bahia 2008 1."

Apresentações semelhantes


Anúncios Google