A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Exercícios sobre classificação Mineração de dados.

Apresentações semelhantes


Apresentação em tema: "Exercícios sobre classificação Mineração de dados."— Transcrição da apresentação:

1 Exercícios sobre classificação Mineração de dados

2 l O que deveria ser feito, na fase de preparação de dados, para aplicar o método ID3 para classificação com os dados abaixo? coralturaformalocalClasse preto32,5largoRua Canindé, 123A marrom22,3Rua Borges, 456/304C marrom15,7estreitoRua Chaves, 132B amarelo31,4estreitoRua Napoleão, 45/101C ……………

3 l O que deveria ser feito, na fase de preparação de dados, para aplicar o método k-NN para classificação com os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89C marrom1,571956,50223,55B amarelo3,143490,00342,50C ……………

4 l O que deveria ser feito, na fase de preparação de dados, considerando uma rede neural backpropagation para classificação usando os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A ……………

5 l O que deveria ser feito, na fase de preparação de dados, considerando o uso do algoritmo naïve bayes e os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A ……………

6 Considere o seguinte conjunto de treino, em que cada exemplo é definido por três atributos (A,B,C) e a classe X. Sabendo que: –Entropia (S) = - (p + log 2 p + + p - log 2 p - ) –Ganho (S, A) = Entropia (S) - ((|Sv| / |S|) * Entropia (Sv)), onde Sv = subconjunto de S para um valor do atributo At |Sv| = número de elementos de Sv |S| = número de elementos de S a) Qual a incerteza (entropia) associada ao conjunto de treino inicial? b) Qual o Ganho de Informação para cada um dos atributos? (log 2 1=0, log 2 0,5=-1, log 2 0,25=-2, log 2 0,75=-0,415, log 2 0,333=-1,585, log 2 0,667=-0,585) c) Face a este resultado, qual seria a árvore de decisão obtida para este conjunto de treino, construída de acordo com o critério de maximização do ganho de informação?

7 Dada a árvore de decisão abaixo, que regras seriam geradas pelo algoritmo C4.5?

8 Considerando os dados de treino abaixo e o algoritmo C4.5, quais seriam os intervalos de decisão considerados para o atributo Peso? PesoIdadeSexoClasse 70jovemMasc2 80adultoMasc2 60adultoFem1 75jovemMasc2 35criançaFem1 85adultoMasc2 50criançaMasc1 PesoClasse Peso 65 Qual a árvore de decisão gerada?

9 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo naive Bayes, considerando os dados de treino abaixo e sabendo que P( E 1 |H ).P( E 2 | H)....P(E n | H).P(H ) P( E 1 ).P( E 2 )....P(E n ) P(H|E)=

10 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo e k=1.

11 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo, k=3, e a seguinte tabela de distâncias para o atributo Z1: ABC A0 B10 C20,50

12 lágrimasastigma- tismo pressãoprescriçãoLENTES normalsimnormalhipermetr. NÃO normalnãonormalmiopia GELAT. normalsimnormalmiopia DURA reduzidasimaltamiopia NÃO reduzidanãonormalhipermetr. NÃO normalnãoaltahipermetr. NÃO normalnãoaltamiopia GELAT. normalsimnormalmiopia DURA normalsimaltahipermetr. NÃO normalsimaltamiopia GELAT. normalsimnormalmiopia. DURA lágrimas normal reduzida astigmat. simnão prescrição miopiahipermetr. 1.Complete a árvore de decisão colocando no lugar dos números das folhas, a classe, de forma a minimizar os erros de classificação. 2.Faça a matriz de confusão correspondente.


Carregar ppt "Exercícios sobre classificação Mineração de dados."

Apresentações semelhantes


Anúncios Google