A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Árvores de Decisão: supervisionado, simbólico, não incremental (?)

Apresentações semelhantes


Apresentação em tema: "Árvores de Decisão: supervisionado, simbólico, não incremental (?)"— Transcrição da apresentação:

1 Árvores de Decisão: supervisionado, simbólico, não incremental (?)

2 Árvores de Decisão Pode-se definir formalmente uma árvore de decisão como sendo: 1.um nó folha - ou nó resposta - que contém um nome de classe, ou 2.um nó não folha - ou nó de decisão - que contém um teste de atributo que, para cada um dos possíveis valores de atributo, tem um ramo para uma outra árvore de decisão

3 Representação da AD 1 falso verdadeiro X 2 verdadeiro falso Y X

4 Árvores de Decisão (Cont)
Temperatura Região Tempo Barometro Predição Acima 0°C Oeste Nublado Baixando Chuva Abaixo 0°C Nublado Fixo Neve Acima 0°C Leste Nublado Aumentando Sol Acima 0°C Parcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°C Sul Limpo Baixando Chuva 0°C Norte Parcial Nubl. Fixo Neve Conjunto de exemplos experimentais observados Padrões no conjunto de amostras são identificados.

5 Árvores de Decisão (Cont)
Temperatura Região Tempo Barometro Predição Acima 0°C Oeste Nublado Baixando Chuva Abaixo 0°C Nublado Fixo Neve Acima 0°C Leste Nublado Aumentando Sol Acima 0°C Parcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°C Sul Limpo Baixando Chuva 0°C Norte Parcial Nubl. Fixo Neve Barômetro Aumentando Fixo Baixando Tempo Nublado Parcial Nubl. Limpo Temp Acima 0°C 0°C Abaixo 0°C Sol Neve Chuva Sem dados Exclui Fatores Irrelevantes (Região) Nenhuma solução descoberta: (Mais exemplos requeridos) Escolhe atributo mais relevante primeiro

6 Regras de Decisão Se Barômetro = Aumentando então Sol.
Se Barômetro = Fixo e Tempo = Nublado então Neve. Tempo = Parcialmente Nublado e Temperatura = 0C

7 Algoritmos da Família TDIDT
TDIDT Top Down Induction of Decision Trees Esta família agrupa os algoritmos e sistemas mais representativos que utilizam como algoritmo básico de aprendizado o ID3. Algoritmos: ID3, ID3’, C4, C4.5, ID4, ID5, etc.

8 Estágios do Processo de Aprendizado da Família TDIDT
1.construção da árvore de decisão para classificar corretamente todos os exemplos 2.poda da árvore de decisão para eliminar subárvores não confiáveis 3.processamento da árvore podada para melhorar a sua legibilidade - construção de regras a partir da árvore

9 Árvores de Decisão s e x o c i r u r g i a T S H T F I T T 4 T I c l a
n e g f f 5 . 8 6 6 . 2 1 5 6 . 2 f f f 7 . 3 7 . 2 1 5 2 . 9 n e g v m v 8 . 8 6 . 2 1 4 8 . 4 f h i p o _ p r i m h i p o _ c o m p f f 6 . 9 6 5 . 4 1 3 2 . 7 f m f 5 . 4 6 5 . 2 1 5 . 9 n e g f . . . . . . . . . . . . . . . . . . . . .

10 Árvores de Decisão (Cont)
H < 6 . 5 > 6 . 5 n e g F T I < 6 4 . 5 > 6 4 . 5 h i p o _ p r i m T I v f n e g c i r u r g i a v f n e g T T 4 < 1 5 . 5 > 1 5 . 5 h i p o _ c o m p n e g

11 Regras de Decisão 1 . S e T S H < 6 . 5 e n t ã o n e g 2 . S e T S
5 e n t ã o n e g 2 . S e T S H > 6 . 5 e F T I < 6 4 . 5 e n t ã o h i p o _ p r i m . . . 6 . S e T S H > 6 . 5 e F T I > 6 4 . 5 e e T I = f c i r u r g i a = f e T T 4 > 1 5 . 5 e n t ã o n e g

12 Características Gerais dos Sistemas TDIDT
Sistemas de propósito geral com o objetivo de classificar objetos: Eles produzem regras ou descrições de um determinado número de classes de objetos. Quando novos objetos são observados, estas regras devem predizer a qual classe cada um deles pertence. Representação do Conhecimento na forma de árvores de decisão. Em geral, realizam aprendizado não incremental. Constroem a árvore de decisão em forma top-down. Os exemplos, a partir dos quais são geradas as regras de classificação, são conhecidos somente através dos valores de um conjunto de atributos. Por sua vez, as árvores de decisão são construídas em função destes mesmos atributos.

13 Esquema Geral dos Algoritmos de Aprendizado por Exemplos
O processo de aprendizado e classificação é dividido em: 1. pré-processamento dos exemplos de aprendizado no qual deve ser considerado o tratamento de: atributos numéricos; atributos com valores desconhecidos; valores irrelevantes; valores sem significado. Existente para todos os paradigmas 2. construção de regras de classificação envolve: escolha do critério de seleção do melhor atributo na construção da árvore de decisão tratamento de domínios com ruído ou domínios incompletos poda na árvore de decisão Específico para Simbólico

14 Vantagens Podem adquirir e representar facilmente conceitos disjuntos
Podem manusear dados com ruído (dados com erros ou incertezas) Executam pouca busca A simplicidade do formato de representação é contrabalanceada por sua eficiência Têm obtido muito sucesso em diversas áreas de aplicação - vários deles estão disponíveis comercialmente

15 Desvantagens Um mesmo conceito pode ser representado por várias árvores de decisão É difícil entender um conceito representado como uma árvore de decisão grande Limitados a uma linguagem descritiva baseada em atributos-valores


Carregar ppt "Árvores de Decisão: supervisionado, simbólico, não incremental (?)"

Apresentações semelhantes


Anúncios Google