A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Exercícios sobre classificação Mineração de dados.

Apresentações semelhantes


Apresentação em tema: "Exercícios sobre classificação Mineração de dados."— Transcrição da apresentação:

1 Exercícios sobre classificação Mineração de dados

2 l O que deveria ser feito, na fase de preparação de dados, para aplicar o método ID3 para classificação com os dados abaixo? coralturaformalocalClasse preto32,5largoRua Canindé, 123A marrom22,3Rua Borges, 456/304C marrom15,7estreitoRua Chaves, 132B amarelo31,4estreitoRua Napoleão, 45/101C ……………

3 l O que deveria ser feito, na fase de preparação de dados, para aplicar o método k-NN para classificação com os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89C marrom1,571956,50223,55B amarelo3,143490,00342,50C ……………

4 l O que deveria ser feito, na fase de preparação de dados, considerando uma rede neural backpropagation para classificação usando os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A ……………

5 l O que deveria ser feito, na fase de preparação de dados, considerando o uso do algoritmo naïve bayes e os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A ……………

6 Considere o seguinte conjunto de treino, em que cada exemplo é definido por três atributos (A,B,C) e a classe X. Sabendo que: –Entropia (S) = - (p + log 2 p + + p - log 2 p - ) –Ganho (S, A) = Entropia (S) - ((|Sv| / |S|) * Entropia (Sv)), onde Sv = subconjunto de S para um valor do atributo At |Sv| = número de elementos de Sv |S| = número de elementos de S a) Qual a incerteza (entropia) associada ao conjunto de treino inicial? b) Qual o Ganho de Informação para cada um dos atributos? (log 2 1=0, log 2 0,5=-1, log 2 0,25=-2, log 2 0,75=-0,415, log 2 0,333=-1,585, log 2 0,667=-0,585) c) Face a este resultado, qual seria a árvore de decisão obtida para este conjunto de treino, construída de acordo com o critério de maximização do ganho de informação?

7 Dada a árvore de decisão abaixo, que regras seriam geradas pelo algoritmo C4.5?

8 Considerando os dados de treino abaixo e o algoritmo C4.5, quais seriam os intervalos de decisão considerados para o atributo Peso? PesoIdadeSexoClasse 70jovemMasc2 80adultoMasc2 60adultoFem1 75jovemMasc2 35criançaFem1 85adultoMasc2 50criançaMasc1 PesoClasse 351 501 601 702 752 802 852 Peso 65 Qual a árvore de decisão gerada?

9 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo naive Bayes, considerando os dados de treino abaixo e sabendo que P( E 1 |H ).P( E 2 | H)....P(E n | H).P(H ) P( E 1 ).P( E 2 )....P(E n ) P(H|E)=

10 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo e k=1.

11 Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo, k=3, e a seguinte tabela de distâncias para o atributo Z1: ABC A0 B10 C20,50

12 lágrimasastigma- tismo pressãoprescriçãoLENTES normalsimnormalhipermetr. NÃO normalnãonormalmiopia GELAT. normalsimnormalmiopia DURA reduzidasimaltamiopia NÃO reduzidanãonormalhipermetr. NÃO normalnãoaltahipermetr. NÃO normalnãoaltamiopia GELAT. normalsimnormalmiopia DURA normalsimaltahipermetr. NÃO normalsimaltamiopia GELAT. normalsimnormalmiopia. DURA lágrimas 3 4 2 1 normal reduzida astigmat. simnão prescrição miopiahipermetr. 1.Complete a árvore de decisão colocando no lugar dos números das folhas, a classe, de forma a minimizar os erros de classificação. 2.Faça a matriz de confusão correspondente.


Carregar ppt "Exercícios sobre classificação Mineração de dados."

Apresentações semelhantes


Anúncios Google