A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.

Apresentações semelhantes


Apresentação em tema: "Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4."— Transcrição da apresentação:

1 Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.

2 Semana 1 (7/5/2010) 1.Em naive Bayes típico, é assumido a independência entre os atributos dos dados de treino. Explique a razão para esta presunção e as implicações da mesma. 2.Recorrendo a exemplos, mostra o impacto na estratégia de escolha dos testes (atributos) nos nós de uma árvore de decisão. Use o WEKA para mostrar as diferenças entre entropia e gini.

3 Semana 2 (21/5/2010) 1.Considere o dataset iris. Apresente resultados de taxas de acerto comparativo (para o algoritmo J48 do Weka) usando o dataset pré-discretizado com o algoritmo Fayyad-Irani e o dataset original. Apresente justificações para os resultados obtidos. 2.Considere o dataset labor. Usando os algoritmos J48 e simpleCart (Weka) apresente resultados (as diferentes árvores) que ilustram o uso das várias opções de pruning estudadas e.g. sub-tree rasing, replacement, laplace, minimal complexity pruning, etc. Apresente a justificação para os resultados obtidos com as avaliações por 10-xval e por training data.

4 Semana 3 (28/5/2010) 1.Considere o dataset soybean. Apresente um estudo comparativo usando validação cruzada e os algoritmos NaiveBayes, SimpleCART e J48. Apresente conclusões sobre os melhores desempenhos para cada classe (das 19 existentes). frog-eye-leaf-spot 2.Considerando o valor de AUC para a classe frog-eye-leaf-spot obtido pelo J4.8, que tipo de curva ROC esperaria obter? Justifique.

5 Semana 4 (4/6/2010) 1.Apresenta as diferentes características dos algoritmos de clustering k-means e EM. Ilustre com a execução de um exemplo. 2.Sugira uma estratégia para definir automaticamente o valor de k (número de partições) em algoritmos como o k-means, em que no algoritmo original k é fixado pelo utilizador.

6 Semana 5 (11/6/2010) 1.Execute um 10-XVal para o dataset iris com o algoritmo J48 e com o AdaBoostM1 sobre J48. Apresente os resultados obtidos em termos de erro. Sugira uma explicação para a comparação dos erros obtidos. 2.Que tipo de benefícios esperaria da aplicação de Bagging sobre Naive Bayes num dataset específico, sabendo que o resultado do modelo individual Naive Bayes nesse dataset é bastante bom (erro = 0.005). Justifique.

7 Semana 6 (18/6/2010) 1.Apresente os principais factores de complexidade de um algoritmo de geração de regras de associação. Ilustre a sua resposta com exemplos. 2.Descreva as principais fraquezas da medida de interessa confiança. Apresente exemplos de regras para ilustrar essas fraquezas. Sugira formas de ultrapassar os problemas levantados pelo usa da confiança.


Carregar ppt "Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4."

Apresentações semelhantes


Anúncios Google