A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

LABIC 1 MCM Árvores de Decisão: supervisionado, simbólico, não incremental (?)

Apresentações semelhantes


Apresentação em tema: "LABIC 1 MCM Árvores de Decisão: supervisionado, simbólico, não incremental (?)"— Transcrição da apresentação:

1 LABIC 1 MCM Árvores de Decisão: supervisionado, simbólico, não incremental (?)

2 LABIC 2 MCM Árvores de Decisão 1.um nó folha - ou nó resposta - que contém um nome de classe, ou 2.um nó não folha - ou nó de decisão - que contém um teste de atributo que, para cada um dos possíveis valores de atributo, tem um ramo para uma outra árvore de decisão Pode-se definir formalmente uma árvore de decisão como sendo:

3 LABIC 3 MCM Representação da AD 1 Y 2 X X falso verdadeiro

4 LABIC 4 MCM Árvores de Decisão (Cont) n Padrões no conjunto de amostras são identificados. Conjunto de exemplos experimentais observados TemperaturaRegiãoTempo Barometro Predição Acima 0°COesteNublado Baixando Chuva Abaixo 0°CNublado Fixo Neve Acima 0°CLesteNublado Aumentando Sol Acima 0°CParcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°CSulLimpo Baixando Chuva 0°CNorteParcial Nubl. Fixo Neve 0°CNorteParcial Nubl. Fixo Neve TemperaturaRegiãoTempo Barometro Predição Acima 0°COesteNublado Baixando Chuva Abaixo 0°CNublado Fixo Neve Acima 0°CLesteNublado Aumentando Sol Acima 0°CParcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°CSulLimpo Baixando Chuva 0°CNorteParcial Nubl. Fixo Neve 0°CNorteParcial Nubl. Fixo Neve

5 LABIC 5 MCM Árvores de Decisão (Cont) BarômetroBarômetro Aumentando Fixo Baixando TempoTempo Nublado Parcial Nubl. Limpo TempTemp Acima 0°C 0°C Abaixo 0°C SolNeve Sol ChuvaSolSem dados Neve Escolhe atributo mais relevante primeiro Exclui Fatores Irrelevantes (Região) Nenhuma solução descoberta: (Mais exemplos requeridos) TemperaturaRegiãoTempo Barometro Predição Acima 0°COesteNublado Baixando Chuva Abaixo 0°CNublado Fixo Neve Acima 0°CLesteNublado Aumentando Sol Acima 0°CParcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°CSulLimpo Baixando Chuva 0°CNorteParcial Nubl. Fixo Neve 0°CNorteParcial Nubl. Fixo Neve TemperaturaRegiãoTempo Barometro Predição Acima 0°COesteNublado Baixando Chuva Abaixo 0°CNublado Fixo Neve Acima 0°CLesteNublado Aumentando Sol Acima 0°CParcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°CSulLimpo Baixando Chuva 0°CNorteParcial Nubl. Fixo Neve 0°CNorteParcial Nubl. Fixo Neve

6 LABIC 6 MCM Regras de Decisão Se Barômetro = Aumentando então Sol. Se Barômetro = Fixo e Tempo = Nublado então Neve. Se Barômetro = Fixo e Tempo = Parcialmente Nublado e Temperatura = 0  C então Neve.

7 LABIC 7 MCM Algoritmos da Família TDIDT TDIDT Top Down Induction of Decision Trees Esta família agrupa os algoritmos e sistemas mais representativos que utilizam como algoritmo básico de aprendizado o ID3. Algoritmos: ID3, ID3’, C4, C4.5, ID4, ID5, etc.

8 LABIC 8 MCM Estágios do Processo de Aprendizado da Família TDIDT 1.construção da árvore de decisão para classificar corretamente todos os exemplos 2.poda da árvore de decisão para eliminar subárvores não confiáveis 3.processamento da árvore podada para melhorar a sua legibilidade - construção de regras a partir da árvore

9 LABIC 9 MCM sexocirurgiaTSHTFITT4TIclasse f f m f m... f f v f f f v f f f... neg neg hipo_prim hipo_comp neg... Árvores de Decisão

10 LABIC 10 MCM TSH neg FTI hipo_prim TI neg cirurgia neg TT4 hipo_comp neg <6.05 >6.05 <64.5 >64.5 v f v f <150.5 >150.5 Árvores de Decisão (Cont)

11 LABIC 11 MCM 1.Se então 2.See então... 6.See e e e então TSH<6.05 neg neg hipo_prim TSH>6.05 TSH>6.05 FTI<64.5 FTI>64.5 TI=f cirurgia=f TT4>150.5 Regras de Decisão

12 LABIC 12 MCM Características Gerais dos Sistemas TDIDT n Sistemas de propósito geral com o objetivo de classificar objetos: Eles produzem regras ou descrições de um determinado número de classes de objetos. Quando novos objetos são observados, estas regras devem predizer a qual classe cada um deles pertence. n Representação do Conhecimento na forma de árvores de decisão. Em geral, realizam aprendizado não incremental. n Constroem a árvore de decisão em forma top-down. n Os exemplos, a partir dos quais são geradas as regras de classificação, são conhecidos somente através dos valores de um conjunto de atributos. Por sua vez, as árvores de decisão são construídas em função destes mesmos atributos.

13 LABIC 13 MCM Esquema Geral dos Algoritmos de Aprendizado por Exemplos 1. pré-processamento dos exemplos de aprendizado no qual deve ser considerado o tratamento de:  atributos numéricos;  atributos com valores desconhecidos;  valores irrelevantes;  valores sem significado. O processo de aprendizado e classificação é dividido em: 2. construção de regras de classificação envolve:  escolha do critério de seleção do melhor atributo na construção da árvore de decisão  tratamento de domínios com ruído ou domínios incompletos  poda na árvore de decisão Existente para todos os paradigmas Específico para Simbólico

14 LABIC 14 MCM Vantagens n Podem adquirir e representar facilmente conceitos disjuntos n Podem manusear dados com ruído (dados com erros ou incertezas) n Executam pouca busca n A simplicidade do formato de representação é contrabalanceada por sua eficiência n Têm obtido muito sucesso em diversas áreas de aplicação - vários deles estão disponíveis comercialmente

15 LABIC 15 MCM Desvantagens n Um mesmo conceito pode ser representado por várias árvores de decisão n É difícil entender um conceito representado como uma árvore de decisão grande n Limitados a uma linguagem descritiva baseada em atributos-valores


Carregar ppt "LABIC 1 MCM Árvores de Decisão: supervisionado, simbólico, não incremental (?)"

Apresentações semelhantes


Anúncios Google