A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e.

Apresentações semelhantes


Apresentação em tema: "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e."— Transcrição da apresentação:

1 Marcus Sampaio DSC/UFCG

2 Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e procurar as regras  condições ou o antecedente  que 'cobrem' ("cover") as instâncias da classe, por sucessivos refinamentos –Se ? então classe X Note que o objetivo pode não ser cobrir todas as instâncias de uma classe, ou pode não ser obter regras puras –Acurácia de treinamento de 100% pode não ser a meta Regras do tipo –Se então ( = )

3 Marcus Sampaio DSC/UFCG

4 Marcus Sampaio DSC/UFCG Regras para a classe a –Primeiro refinamento se x > 1.2 então classe = a –Segundo refinamento se x > 1.2 e y > 2.6 então classe = a –Terceiro refinamento (ainda existe a não coberto)...

5 Marcus Sampaio DSC/UFCG Regras para a classe b –Primeiro refinamento se x  1.2 então classe = b –Segundo refinamento se x  1.2 então classe = b se x > 1.2 e y  2.6 então classe = b –Terceiro refinamento (a segunda regra é impura)...

6 Marcus Sampaio DSC/UFCG Árvore de decisão –Conjunto de regras –Cada regra é um ‘galho’ da árvore Um algoritmo "covering" produz regras diferentes daquelas obtidas de árvores de decisão, para o mesmo conjunto-treinamento Dado um conjunto-treinamento, quem é melhor –Árvore de Decisão? –Regras de Classificação stricto sensu? Regras de Classificação versus Árvores de Decisão

7 Marcus Sampaio DSC/UFCG A diferença essencial entre algoritmos de árvore de decisão e algoritmos “covering” reside no tipo de abordagem –Árvore de decisão: top down Primeiro, o antecedente; depois, a classe –“Covering”: bottom up Primeiro, a classe; depois, o antecedente

8 Marcus Sampaio DSC/UFCG O Algoritmo “Covering” Prism youngmyopenoreducednone youngmyopenonormalsoft youngmyopeyesreducednone youngmyopeyesnormalhard younghypermetropenoreducednone younghypermetropenonormalsoft age spectacle prescriptiom astigmatism tear production rate recommended lens

9 Marcus Sampaio DSC/UFCG younghypermetropeyesreducednone younghypermetropeyesnormalhard pre-presbyopicmyopenoreducednone pre-presbyopicmyopenonormalsoft pre-presbyopicmyopeyesreducednone pre-presbyopicmyopeyesnormalhard

10 Marcus Sampaio DSC/UFCG pre-presbyopichypermetropenoreducednone pre-presbyopichypermetropenonormalsoft pre-presbyopichypermetropeyesreducednone pre-presbyopichypermetropeyesnormalnone presbyopicmyopenoreducednone presbyopicmyopenonormalnone

11 Marcus Sampaio DSC/UFCG presbyopicmyopeyesreducednone presbyopicmyopeyesnormalhard presbyopichypermetropenoreducednone presbyopichypermetropenonormalsoft presbyopichypermetropeyesreducednone presbyopichypermetropeyesnormalnone

12 Marcus Sampaio DSC/UFCG If ? then Recommended = hard Age = young2/8 Age = pre-presbyopic 1/8 Age = presbyopic 1/8 Spectacle prescription = myope 3/12 Spectacle prescription = hypermetrope 1/12 Astigmatism = no 0/12 Astigmatism = yes 4/12 Tear production rate = reduced 0/12 Tear production rate = normal 4/12 If Astigmatism = yes then Recommended = hard Acurácia

13 Marcus Sampaio DSC/UFCG youngmyopeyesreducednone youngmyopeyesnormalhard younghypermetropeyesreducednone younghypermetropeyesnormalhard pre-presbyopicmyopeyesreducednone pre-presbyopicmyopeyesnormalhard

14 Marcus Sampaio DSC/UFCG pre-presbyopichypermetropeyesreducednone pre-presbyopichypermetropeyesnormalnone presbyopicmyopeyesreducednone presbyopicmyopeyesnormalhard presbyopichypermetropeyesreducednone presbyopichypermetropeyesnormalnone

15 Marcus Sampaio DSC/UFCG If Astigmatism = yes and ? then Recommended = hard Age = young2/4 Age = pre-presbyopic1/4 Age = presbyopic1/4 Spectacle prescription = myope3/6 Spectacle prescription = hypermetrope1/6 Tear production rate = reduced0/6 Tear production rate = normal4/6 If Astigmatism = yes and Tear production rate = normal then Recommended = hard

16 Marcus Sampaio DSC/UFCG Buscar regras exatas (ou perfeitas, ou puras) youngmyopeyesnormalhard younghypermetropeyesnormalhard pre-presbyopicmyopeyesnormalhard pre-presbyopichypermetropeyesnormalnone presbyopicmyopeyesnormalhard presbyopichypermetropeyesnormalnone

17 Marcus Sampaio DSC/UFCG If Astigmatism = yes and Tear production rate = normal and ? then Recommended = hard Age = young2/2 Age = pre-presbyopic1/2 Age = presbyopic1/2 Spectacle prescription = myope3/3 Spectacle prescription = hypermetrope1/3 If Astigmatism = yes and Tear production rate = normal and Spectacle prescription = myope then Recommended = hard

18 Marcus Sampaio DSC/UFCG A regra só cobre 3 das 4 instâncias ‘hard’ O algoritmo remove então as 3 instâncias já cobertas, e começa de novo, para o conjunto- treinamento sem as 3 instâncias (24 – 3 = 21 instâncias)

19 Marcus Sampaio DSC/UFCG If ? then Recommended = hard... If Age = young and Astigmatism = yes and Tear production rate = normal then Recommended = hard Note que, quanto mais complexa (= mais cláusulas conjuntivas) a regra, maior a probabilidade de “overfitting” A regra acima só cobre uma instância

20 Marcus Sampaio DSC/UFCG Suponha que todas as instâncias classificadas como 'hard' foram cobertas O algoritmo prossegue com as instâncias classificadas como 'soft', e assim por diante

21 Marcus Sampaio DSC/UFCG

22 Marcus Sampaio DSC/UFCG Note que uma regra exata não é necessariamente boa  “overfitting” , se –Cobrir poucas instâncias (baixa qualidade estatística) –Muito complexa (cláusula conjuntiva muito grande) –As duas coisas Uma versão mais sofisticada do Prism –Analisa a qualidade das regras exatas –Pode gerar regras não exatas, porém com maior valor estatístico Mecanismos específicos de poda –A meta é uma boa acurácia de previsão

23 Marcus Sampaio DSC/UFCG Prism Processado com WEKA

24 Marcus Sampaio DSC/UFCG


Carregar ppt "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e."

Apresentações semelhantes


Anúncios Google