A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula Prática Classificação. EXERCÍCIO 1 Entre no Weka e carregue o arquivo golf.arff (preprocess/open file) Examine os dados escolha a aba de Classificação.

Apresentações semelhantes


Apresentação em tema: "Aula Prática Classificação. EXERCÍCIO 1 Entre no Weka e carregue o arquivo golf.arff (preprocess/open file) Examine os dados escolha a aba de Classificação."— Transcrição da apresentação:

1 Aula Prática Classificação

2 EXERCÍCIO 1 Entre no Weka e carregue o arquivo golf.arff (preprocess/open file) Examine os dados escolha a aba de Classificação (Classify) e selecione o classificador J48 (Choose/Trees/J48) e execute com os parâmetros default (start) Compreenda a saída fornecida Visualize a árvore gerada (clicando com o botão direito na lista de resultados e escolhendo visualize tree)

3 Outros classificadores no Weka Nome de alguns classificadores vistos em aula, no Weka: – C 4.5: Choose/trees/J48 – ID3: Choose/trees/Id3 – naïve bayes: Choose/bayes/NaiveBayes – k-NN: Choose/lazy/IBk – SVM: Choose/functions/SMO – Rede neural backpropagation: Choose/functions/MultilayerPerceptron

4 Exercício 2 Carregue o arquivo iris.arff (150 registros) Execute o classificador J48 com os parâmetros default. Se familiarize com o formato da saída fornecida, incluindo a matriz de confusão Visualize a árvore gerada Visualize os erros de classificação. No gráfico, como se diferenciam as instancias corretamente das incorretamente classificadas? Como pode-se ver informações detalhadas de uma instância (registro)? Execute outras formas de avaliação e verifique o efeito: – Use training set (usa para teste o mesmo arquivo do treinamento) – Percentage split (divide o arquivo em uma parte para o treinamento e outra para o teste) Use outros algoritmos de classificação e anote o seu nome e o resultado (acurácia)

5 EXERCÍCIO 3 Carregue o arquivo credit-g.arff (arquivo com dados para decisão sobre crédito bancário, com 1000 registros) Use percentage split como método de avaliação (o número de registros é razoavelmente grande). Para este problema, considere que um falso positivo (prever que a classe é good quando na verdade é bad) tem um custo 5 vezes maior que o de um falso negativo. Encontre o menor custo com o J48 (usando a matriz de confusão ), considerando os custos: VP=-1; VN=-1; FP=5; FN=1. Utilizando os valores default dos parâmetros, teste com outros classificadores e anote o resultado em uma tabela com: classificador, acurácia, custo, tempo de execução

6 EXERCÍCIO 4 Abra o arquivo hepatitis.arff Execute o J48 com os parâmetros default. Salve o resultado. Execute outros classificadores e anote o resultado. Qual o melhor? Compare as matrizes de confusão geradas pelos diversos classificadores

7 Exercício 5 Abra o arquivo mushroom.arff. Utilize alguns algoritmos de classificação. Faça uma tabela com o classificador e acurácia obtida. Qual o melhor resultado, com que classificador?

8 Salvar e utilizar o modelo de classificação Salvar: 1.executar o algoritmo de classificação (por exemplo, o J48) para realizar o treinamento (geração do modelo) 2.Clique o botão direito sobre o modelo que deve ser salvo, na Results list 3.Selecione Save model e salve o modelo. Carregar (o modelo salvo anteriormente) 1.Carregue os dados de teste usando a opção Supplied test set 2.Clique o botão direito na Results list, selecione Load model e escolha o modelo salvo para carregar 3.Selecione Re-evaluate model on current test set OBS: - o arquivo usado para teste deve conter os mesmos nomes de atributos e os mesmos tipos que o arquivo usado para gerar o modelo. - Quando se carrega um arquivo CSV, o primeiro registro é usado para nomear os atributos.


Carregar ppt "Aula Prática Classificação. EXERCÍCIO 1 Entre no Weka e carregue o arquivo golf.arff (preprocess/open file) Examine os dados escolha a aba de Classificação."

Apresentações semelhantes


Anúncios Google