Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e.

Slides:



Advertisements
Apresentações semelhantes
Construção de listas de decisão Os tópicos anteriores tratam de indução de conceitos que podem ser descritos usando uma única região de decisão Neste tópico.
Advertisements

Indução de Árvores de Decisão
Árvores de Decisão Tabelas de Decisão Aplicações Informáticas
Formato dos Dados % 1. Title: Database for fitting contact lenses
Inteligência Artificial I
2. O Processo de Mineração de Dados
Jacques Robin, Francisco Carvalho, Flávia Barros
APRENDIZAGEM COM CONHECIMENTO A PRIORI
Recursividade Conceitos e Aplicações.
FACENS – Engenharia da Computação Inteligência Artificial
FACENS – Engenharia da Computação Inteligência Artificial
Fast Effective Rule Induction (Willian W. Cohen)
RIPPER Fast Effective Rule Induction
Análise Sintática Ascendente
Descoberta de Padrões usando Conhecimento Prévio
Construção de Compiladores
SIMULAÇÃO EM COMPUTADOR: O PENSAMENTO COMO PROCESSAMENTO DE INFORMÇÕES
Programação Dinámica Análise de algoritmos UNISUL
Introdução ao Data Mining
INF 1771 – Inteligência Artificial
Aprendizado de Máquina
Sistemas Inteligentes
II. M o d e l o s d e C o n h e c i m e n t o
3. Árvore de Decisão.
T ÓPICOS DE I.A. Métodos de Busca Busca em Espaços de Estado Prof. Mário Dantas.
Aprendizado de Máquina Aula 8
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Departamento de Informática – Marcos Henrique Fonseca Ribeiro – Slide 1 Construindo Árvores de Decisão NoTrueHighMildRainy YesFalseNormalHotOvercast YesTrueHighMildOvercast.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
Aprendizado de Árvores de Decisão
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
Prof. Alaine Guimarães/UEPG Prof. Aurora Pozo/UFPR.
Cássio Cristo Dawyson Guerra Matheu Santos
Sistemas Inteligentes
Indução de Árvore de Decisão
Learning Sets of Rules Tom Mitchel (cap. 10)
Metodologias e Processos para Projeto Conceitual de Banco de Dados
Redes Bayesianas – Inferência
Estrutura de Decisão e Repetição
Sistemas Inteligentes
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Ademir Rafael Marques Guedes
Marcus Sampaio DSC/UFCG Mineração de Dados Marcus Sampaio Pós-Graduação em Informática da UFCG
Sistemas Baseados em Aprendizado (Aprendizado de Máquina)
2. Visão Geral de MD Alguns slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
1 Árvores de Decisão Marcílio Souto DIMAp/UFRN. 2 Árvores de Decisão – ADs (1/4) zForma mais simples: yLista de perguntas  respostas “sim” ou “não” yHierarquicamente.
Compiladores.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
7. Mineração de Texto ("Text Mining")
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Programação Dinâmica.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Prof. Alexandre Monteiro Recife
Aprendizagem de regras proposicionais de classificação e associação TAIAS 2 Ivan Teixeira João Batista.
Indução de Árvores e Regras Proposicionais de Decisão
Regras. Regras Rudimentarias 1R: aprende uma regra por atributo  atribuí a classe mais freqüente  taxa de erro: proporção de instâncias que não pertence.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação.
Descoberta em múltiplos níveis conceituais
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto-treinamento, e procurar.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação.
Tecnologias e Sistemas de Informação
Aprendizagem Simbólica
DECOM – ICEB – UFOP Prof. Álvaro Guarda Aprendizado de Máquina - 0 Aprendizado Indutivo de Conceitos Conceito Conjunto de objetos com características comuns.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Mineração de Dados (Data Mining)
Transcrição da apresentação:

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e procurar as regras  condições ou o antecedente  que 'cobrem' ("cover") as instâncias da classe, por sucessivos refinamentos –Se ? então classe X Note que o objetivo pode não ser cobrir todas as instâncias de uma classe, ou pode não ser obter regras puras –Acurácia de treinamento de 100% pode não ser a meta Regras do tipo –Se então ( = )

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG Regras para a classe a –Primeiro refinamento se x > 1.2 então classe = a –Segundo refinamento se x > 1.2 e y > 2.6 então classe = a –Terceiro refinamento (ainda existe a não coberto)...

Marcus Sampaio DSC/UFCG Regras para a classe b –Primeiro refinamento se x  1.2 então classe = b –Segundo refinamento se x  1.2 então classe = b se x > 1.2 e y  2.6 então classe = b –Terceiro refinamento (a segunda regra é impura)...

Marcus Sampaio DSC/UFCG Árvore de decisão –Conjunto de regras –Cada regra é um ‘galho’ da árvore Um algoritmo "covering" produz regras diferentes daquelas obtidas de árvores de decisão, para o mesmo conjunto-treinamento Dado um conjunto-treinamento, quem é melhor –Árvore de Decisão? –Regras de Classificação stricto sensu? Regras de Classificação versus Árvores de Decisão

Marcus Sampaio DSC/UFCG A diferença essencial entre algoritmos de árvore de decisão e algoritmos “covering” reside no tipo de abordagem –Árvore de decisão: top down Primeiro, o antecedente; depois, a classe –“Covering”: bottom up Primeiro, a classe; depois, o antecedente

Marcus Sampaio DSC/UFCG O Algoritmo “Covering” Prism youngmyopenoreducednone youngmyopenonormalsoft youngmyopeyesreducednone youngmyopeyesnormalhard younghypermetropenoreducednone younghypermetropenonormalsoft age spectacle prescriptiom astigmatism tear production rate recommended lens

Marcus Sampaio DSC/UFCG younghypermetropeyesreducednone younghypermetropeyesnormalhard pre-presbyopicmyopenoreducednone pre-presbyopicmyopenonormalsoft pre-presbyopicmyopeyesreducednone pre-presbyopicmyopeyesnormalhard

Marcus Sampaio DSC/UFCG pre-presbyopichypermetropenoreducednone pre-presbyopichypermetropenonormalsoft pre-presbyopichypermetropeyesreducednone pre-presbyopichypermetropeyesnormalnone presbyopicmyopenoreducednone presbyopicmyopenonormalnone

Marcus Sampaio DSC/UFCG presbyopicmyopeyesreducednone presbyopicmyopeyesnormalhard presbyopichypermetropenoreducednone presbyopichypermetropenonormalsoft presbyopichypermetropeyesreducednone presbyopichypermetropeyesnormalnone

Marcus Sampaio DSC/UFCG If ? then Recommended = hard Age = young2/8 Age = pre-presbyopic 1/8 Age = presbyopic 1/8 Spectacle prescription = myope 3/12 Spectacle prescription = hypermetrope 1/12 Astigmatism = no 0/12 Astigmatism = yes 4/12 Tear production rate = reduced 0/12 Tear production rate = normal 4/12 If Astigmatism = yes then Recommended = hard Acurácia

Marcus Sampaio DSC/UFCG youngmyopeyesreducednone youngmyopeyesnormalhard younghypermetropeyesreducednone younghypermetropeyesnormalhard pre-presbyopicmyopeyesreducednone pre-presbyopicmyopeyesnormalhard

Marcus Sampaio DSC/UFCG pre-presbyopichypermetropeyesreducednone pre-presbyopichypermetropeyesnormalnone presbyopicmyopeyesreducednone presbyopicmyopeyesnormalhard presbyopichypermetropeyesreducednone presbyopichypermetropeyesnormalnone

Marcus Sampaio DSC/UFCG If Astigmatism = yes and ? then Recommended = hard Age = young2/4 Age = pre-presbyopic1/4 Age = presbyopic1/4 Spectacle prescription = myope3/6 Spectacle prescription = hypermetrope1/6 Tear production rate = reduced0/6 Tear production rate = normal4/6 If Astigmatism = yes and Tear production rate = normal then Recommended = hard

Marcus Sampaio DSC/UFCG Buscar regras exatas (ou perfeitas, ou puras) youngmyopeyesnormalhard younghypermetropeyesnormalhard pre-presbyopicmyopeyesnormalhard pre-presbyopichypermetropeyesnormalnone presbyopicmyopeyesnormalhard presbyopichypermetropeyesnormalnone

Marcus Sampaio DSC/UFCG If Astigmatism = yes and Tear production rate = normal and ? then Recommended = hard Age = young2/2 Age = pre-presbyopic1/2 Age = presbyopic1/2 Spectacle prescription = myope3/3 Spectacle prescription = hypermetrope1/3 If Astigmatism = yes and Tear production rate = normal and Spectacle prescription = myope then Recommended = hard

Marcus Sampaio DSC/UFCG A regra só cobre 3 das 4 instâncias ‘hard’ O algoritmo remove então as 3 instâncias já cobertas, e começa de novo, para o conjunto- treinamento sem as 3 instâncias (24 – 3 = 21 instâncias)

Marcus Sampaio DSC/UFCG If ? then Recommended = hard... If Age = young and Astigmatism = yes and Tear production rate = normal then Recommended = hard Note que, quanto mais complexa (= mais cláusulas conjuntivas) a regra, maior a probabilidade de “overfitting” A regra acima só cobre uma instância

Marcus Sampaio DSC/UFCG Suponha que todas as instâncias classificadas como 'hard' foram cobertas O algoritmo prossegue com as instâncias classificadas como 'soft', e assim por diante

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG Note que uma regra exata não é necessariamente boa  “overfitting” , se –Cobrir poucas instâncias (baixa qualidade estatística) –Muito complexa (cláusula conjuntiva muito grande) –As duas coisas Uma versão mais sofisticada do Prism –Analisa a qualidade das regras exatas –Pode gerar regras não exatas, porém com maior valor estatístico Mecanismos específicos de poda –A meta é uma boa acurácia de previsão

Marcus Sampaio DSC/UFCG Prism Processado com WEKA

Marcus Sampaio DSC/UFCG