A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

WEKA Sistemas Inteligentes jan/2003. Roteiro * Introdução * Instalando e executando o Weka * Construção de classificadores Algoritmos de aprendizagem.

Apresentações semelhantes


Apresentação em tema: "WEKA Sistemas Inteligentes jan/2003. Roteiro * Introdução * Instalando e executando o Weka * Construção de classificadores Algoritmos de aprendizagem."— Transcrição da apresentação:

1 WEKA Sistemas Inteligentes jan/2003

2 Roteiro * Introdução * Instalando e executando o Weka * Construção de classificadores Algoritmos de aprendizagem suportados Formato dos dados Avaliação dos classificadores * Estudo de Caso * Considerações finais

3 Introdução * Waikato Environment for Knowledge Analysis * Universidade de Waikato - Nova Zelândia * Coleção de algoritmos para Mineração de Dados. * Implementado em Java * Open Source Software * Link:

4 Instalando o software 1. Crie um diretório ´weka´ dentro de ‘c:\temp’ c:\temp\weka 2.Copiando os arquivos: weka.jar weka.bat 3.Certifique-se de que os dados foram salvos no formato correto.

5 Executando o software * Inicialize o ambiente jdk 1.3 menu: programs\Linguagens\Java\JDK1.3 * Entre no diretório ´weka’ que você criou c:\temp\weka * Execute o script Weka.bat * Escolha a opção: Explorer

6 Construção dos classificadores * Carregar arquivo contendo o conjunto de treinamento; * Selecionar algoritmo de aprendizagem; * Solicitar o Weka para construir o classificador e avaliar o Classificador.

7 Formato dos arquivos de entrada * Arquivos no formato.arff Local ou URL * Tabelas de Banco de Dados via JDBC

8 Carregando dados de um arquivo.arff * Formato Cabeçalho + Dados (uma instância por linha sendo o valor dos atributos separados por vírgula) * Exemplo: weather % Nome da temperature real % Atributo e outlook {sunny, overcast, humidity windy {TRUE, play {yes, Início dos dados 88,sunny,85,FALSE,no 83,overcast,86,FALSE,yes

9 Selecionando algoritmo de aprendizagem * Na guia Classify escolha o classificador (classifier) e set os respectivos parâmetros de treinamento. * Classificadores que podem ser criados: decision tree inducers rule learners naive Bayes decision tables locally weighted regression support vector machines...

10 Selecionando algoritmo de aprendizagem * Selecione a maneira de avaliar o classificador gerado (Test options). Arquivo de treinamento; Arquivo fornecido contendo o conjunto de teste; Cross-validation sobre o arquivo contendo o conjunto de treinamento; Porcentagem do arquivo contendo o conjunto de treinamento. * Pressione Start para construir e avaliar.

11 * Dados do tempo: ‘weather.nominal.arff’ * Algoritmo Id3: weka.classifiers.Id3 normal high Id outlook = sunny | humidity = high: no | humidity = normal: yes outlook = overcast: yes outlook = rainy | windy = TRUE: no | windy = FALSE: yes Indução de árvores de decisão

12 * Medidas de desempenho do classificador gerado.  Id3: avaliação por Stratified cross-validation === Summary === Correctly Classified Instances % Incorrectly Classified Instances % === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class yes no === Confusion Matrix === a b <-- classified as 8 1 | a = yes 2 3 | b = no Indução de árvores de decisão

13 * Dados do tempo: ‘weather. arff’ * Algoritmo C4.5: weka.classifiers.j48.J48 <=75 >75 J48 pruned tree outlook = sunny | humidity <= 75: yes (2.0) | humidity > 75: no (3.0) outlook = overcast: yes (4.0) outlook = rainy | windy = TRUE: no (2.0) | windy = FALSE: yes (3.0) Number of Leaves : 5 Size of the tree : 8 Indução de árvores de decisão

14 * Medidas de desempenho do classificador gerado.  C4.5: avaliação por Stratified cross-validation === Summary === Correctly Classified Instances % Incorrectly Classified Instances % === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class yes no === Confusion Matrix === a b <-- classified as 7 2 | a = yes 4 1 | b = no Indução de árvores de decisão

15 * Dados do tempo: ‘weather. arff’ * Algoritmo weka.classifiers.NaiveBayesSimple Classificador Naive Bayes Class yes: P(C) = Attribute outlook sunnyovercastrainy Attribute temperature Mean: 73 Std: Attribute humidity Mean: Std: Attribute windy TRUEFALSE Class no: P(C) = Attribute outlook sunnyovercastrainy Attribute temperature Mean: 74.6Std: Attribute humidity Mean: 86.2Std: Attribute windy TRUEFALSE

16 * Medidas de desempenho do classificador gerado.  NB: avaliação por Stratified cross-validation === Summary === Correctly Classified Instances % Incorrectly Classified Instances % === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class yes no === Confusion Matrix === a b <-- classified as 7 2 | a = yes 4 1 | b = no Classificador Naive Bayes

17 * Representação dos documentos: vetor de freqüência de ocorrência de termos dentro de cada documento(r). vetor binário(b) ou nominal(n) indicando a ausência ou presença de cada termo no documento. * Classes: páginas web contendo ou não citações de publicações técnicas e científicas. * Arquivo de treinamento: ‘MarianaDatatrn*200.arff’ * Arquivo de teste: ‘MarianaDatatst*200.arff’ Monte uma tabela Representação x Erro de Classificação obtido por cada classificador (ID3, C4.5 ou NaiveBayes). Qual dos três classificadores melhor desempenha esta tarefa? Qual a melhor representação dos documentos? Estudo de Caso: Categorização de Documentos

18 * O classificador Id3 só pode ser usado sobre arquivos de dados com atributos nominais. * Se o classificador NaiveBayesSimple não funcionar, tente o classificador NaiveBayes (mais robusto). * Para acessar os algoritmos implementados no Weka dentro um programa java veja a sessão 8.4 do ‘tutorial.pdf’. * Para informações mais precisas sobre os algoritmos implementados veja ‘Package Documentation.html’ (documentação javadoc do Weka). Considerações Finais


Carregar ppt "WEKA Sistemas Inteligentes jan/2003. Roteiro * Introdução * Instalando e executando o Weka * Construção de classificadores Algoritmos de aprendizagem."

Apresentações semelhantes


Anúncios Google