Software Weka Waikato 2004, Witten & Frank 2000.

Slides:



Advertisements
Apresentações semelhantes
Power Point Continuação....
Advertisements

Indução de Árvores de Decisão
Programação em Java Prof. Maurício Braga
Mineração de Dados Avaliação de Classificadores
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
Formato dos Dados % 1. Title: Database for fitting contact lenses
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
A PPLYING D ATA M INING T ECHNIQUES TO S EMI -A UTOMATICALLY D ISCOVER G UIDELINES FOR M ETAMODELS {andreza, franklin, patricia,
Laboratório 3 Aprendizado Baseado em Instâncias e Naive Bayes
Dicas para a realização do Trabalho1
Capítulo 2 Data Preparation for Data Mining
Weka Universidade de Waikato - Nova Zelândia
Weka Coleção de algoritmos de aprendizado de máquina implementado em Java Tanto é API como aplicativo!!! Open source software Framework para o desenvolvimento.
Data Mining com a Ferramenta Weka
Login na Rede ********* Nome do Usuário Senha
Processo de passagem de pontos de um BD para outro BD.
Introdução a Linguagem JAVA
Data Mining: Ferramenta JAVA
Para fazer nova camada com traços ou áreas Escolha line para linha.
INF 1771 – Inteligência Artificial
Mineração de Dados: Conceitos, Aplicações e Experimentos com Weka
Sistemas Inteligentes
INF 1771 – Inteligência Artificial Aula 19 – Bibliotecas e Ferramentas para Aprendizado de Máquina Edirlei Soares de Lima.
Aula Prática Classificação
Aprendizado de Árvores de Decisão
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Mineração da Dados.
Framework gpnet.
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
WEKA. Roteiro Introdução Conceitos Exemplos práticos Chamada ao aplicativo.
Introdução ao Aprendizado de Máquina
WINDOWS Professor: Leandro Crescencio
Treinamento do Microsoft® Word 2010
Treinamento do Microsoft® Access® 2010
Prof. Alaine Guimarães/UEPG Prof. Aurora Pozo/UFPR.
Sistemas Inteligentes
Preparação dos Dados Marcilio Souto DIMAp/UFRN. Preparação dos Dados ● Compreensão dos dados ● Limpeza – Metadado – Valores Perdidos – Formato de data.
Introdução ao Aprendizado de Máquina
IA - Prof. Paulemir Campos
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Marcelo Ladeira, Ph.D Departamento de Ciência da Computação
CONPROVE INDÚSTRIA & COMÉRCIO SIMULADOR IEC - GOOSE GOOSE Simulator.
Botão para Upload – Produto Aluguel Após a transmissão da proposta, clique no botão ‘Incluir documento’:
1 Naïve Bayesian Learning Marcílo Souto DIMAp/UFRN.
1 Árvores de Decisão Marcílio Souto DIMAp/UFRN. 2 Árvores de Decisão – ADs (1/4) zForma mais simples: yLista de perguntas  respostas “sim” ou “não” yHierarquicamente.
Geração e envio do arquivo xml ao SNGPC
Análise e Projeto de Sistemas Monitor: Márcia Seabra Cabral QSSrequireit.
WEKA Jacques Robin João Batista Marcelino Pereira junho/2001.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Tipologia dos dados de entrada da mineração de dados Jacques Robin CIn-UFPE.
Backup DE DADOS DO USUÁRIO. Cópia de segurança dos dados no computador, alguns fáceis e outros trabalhosos, de acordo com a quantidade de dados. Utilizado.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Prof. Alexandre Monteiro Recife
Laboratório 4 SVM e RN. Bases glass.arff glass-RINa.arff: construida por você somente com as instâncias das classes 'build wind float' e 'headlamps';
Laboratório 5 Regras. Bases Utilize a base que se encontra no diretório de dados do weka: wheather.nominal.arff Gere regras usando diferentes classificadores.
Regras. Regras Rudimentarias 1R: aprende uma regra por atributo  atribuí a classe mais freqüente  taxa de erro: proporção de instâncias que não pertence.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Aprendizado Baseado em Instancias. Introdução Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG CEAPE-PB Centro de Apoio aos Pequenos EMPREENDIMENTOS – CEAPE-PB, com sede na Cidade de Campina Grande.
Universidade Federal do Paraná Mineração de Dados e Aprendizado de Máquinas. Aurora Trinidad Ramírez Pozo.
Exemplo de LSMW com Batch-Input
Tecnologias e Sistemas de Informação
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Department of Computer Science, University of Waikato, New Zealand Eibe Frank WEKA: Ferramenta para Aprendizado de Máquina O Explorer Classificação e Regressão.
Aula Pratica Aprendizagem WEKA Prof. Ivan Gesteira Costa Filho Centro de Informática Universidade Federal de Pernambuco.
EndNote X4 Prof. Luis Fernando Ferreira Mestrando em ciências da Reabilitação.
DSI – Desenvolvimento de Sistemas Inteligentes
Naïve Bayesian Learning
Transcrição da apresentação:

Software Weka Waikato 2004, Witten & Frank 2000

Ferramenta algoritmos de /public/soft/linux/weka-3-4/ preparação de dados aprendizagem de máquina (mineração) validação de resultados /public/soft/linux/weka-3-4/ Java –jar weka.jar Selecione Explorer copie os arquivos no dir /public/soft/linux/weka-3-4/data$ para sua area

Interface e Funcionalidades

(A) Open File, Open URL, Open DB (B) No botão filter é possível efetuar sucessivas filtragens de atributos e instâncias na base de dados previamente carregada Seleção Discretização Normalização Amostragem

Formato arff (header) % 1. Title: Iris Plants Database % % 2. Sources: % (a) Creator: R.A. Fisher % (b) Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov) % (c) Date: July, 1988 @RELATION iris @ATTRIBUTE sepallength NUMERIC @ATTRIBUTE sepalwidth NUMERIC @ATTRIBUTE petallength NUMERIC @ATTRIBUTE petalwidth NUMERIC @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}

Laboratório 1 Abra o arquivo weather.nominal.arff

Perguntas Números de instancias, exemplos, registros?? Atributos ??? Quais os valores que o atributo temperatura pode ter ?? Repita o processo para outra base.

Editando bases Abra a base weather.nominal.arff Clique em Editar Responda Qual é o valor da classe para a instância 8? Algum atributo possui valor não ? Abra a base iris e responda Quantos atributos nominais e numericos a base possui ??

Aplicar filtros Weka possui vários filtros Remover atributos Escolha Choose... Remove ... Save..Name Abra o arquivo weather.nominal.arff Remova todos as instâncias com valor de atributo humidity high Volte aos dados originais

Painel de Visualização Abra a base iris.arff (medidas de flores) Utilize o menu Visualize para selecionar algumas instâncias e remover outras.

Classificação Observe a saida dos diferentes tipos de classificadores. === Classifier model (full training set) === J48 pruned tree ------------------ outlook = sunny | humidity = high: no (3.0) | humidity = normal: yes (2.0) outlook = overcast: yes (4.0) outlook = rainy | windy = TRUE: no (2.0) | windy = FALSE: yes (3.0) Number of Leaves

Responda Utilizando a base weather Como seria classificada a seguinte instância ??? outlook = sunny, temperature = cool, humidity = high, windy = TRUE

Modo de Testar Use training set: Usa toda a base para teste Cross-validation: Divide a base em folds (disjuntos) Percentage split: Divide a base uma percentagem para treinamento e outra para teste.

Criando bases de teste Escreva uma base de teste e teste com ela Como são classificadas as instâncias ?? Como fica a matriz de confusão ??

Visualize as instâncias Visualize cada instâncias e responda quais foram classificadas erroneamente ???