Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.

Slides:



Advertisements
Apresentações semelhantes
Inteligência Artificial
Advertisements

Agenda Introdução Justificativa Objetivo Detecção de Spam
Aprendizado de Máquina
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
Aula 8 Contratos.
Gestão de Estoques na Cadeia de Logística Integrada
Teste de Software.
Mineração de Dados Avaliação de Classificadores
Planeamento Temporal e Monitorização do Projecto de SW
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
AULA 23 Profa. Sandra de Amo GBC053 – BCC
Laboratório 3 Aprendizado Baseado em Instâncias e Naive Bayes
1 MergeSort Seja uma lista A de n elementos. O algoritmo consiste das seguintes fases Dividir A em 2 sub-listas de tamanho n/2 Conquistar: ordenar cada.
Medida do Tempo de Execução de um Programa
Medida do Tempo de Execução de um Programa David Menotti Algoritmos e Estruturas de Dados I DECOM – UFOP.
Quantização de cores em Imagens: o caso do K-means
Jacques Robin, Francisco Carvalho, Flávia Barros
Weka Coleção de algoritmos de aprendizado de máquina implementado em Java Tanto é API como aplicativo!!! Open source software Framework para o desenvolvimento.
Sistemas Distribuídos Walfredo Cirne & Fubica Brasileiro Aula 5: Modelos de Sistemas Distribuídos.
Sistemas Distribuídos
Sistemas Distribuídos Walfredo Cirne & Fubica Brasileiro Aula 5: Modelos de Sistemas Distribuídos.
ANÁLISE DOS RESULTADOS DA PROVA DE AFERIÇÃO DE MATEMÁTICA 2012
Título do Trabalho Nome Orientador Data.
INF 1771 – Inteligência Artificial
Sistemas Inteligentes
3. Árvore de Decisão.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Alexandre Xavier Falcão & David Menotti
ME623A Planejamento e Pesquisa
ME623 Planejamento e Pesquisa
Aula Prática Classificação
1 - Lafayette B. Melo – Análise e Projeto de Sistemas para a Internet – COINFO – CEFET-PB 12. Estados Objetivo: compreender a notação do diagrama de estados.
Aprendizagem de Máquina - Agrupamento
Tratamento de Dados Desbalanceados
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
FAC SÃO ROQUE Curso: Administração Turma: ADM-5ª
Clustering Estudo de métodos computacionais para encontrar os grupos naturais existentes nos dados. Processo também conhecido por Segmentação ou por Aprendizagem.
Sistemas Inteligentes
Sistemas Inteligentes
 - PSF Grupo: abc, agsj, fcac.
Redes Bayesianas - Aplicação em Risco Operacional
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Técnicas e Projeto de Sistemas
Seleção de Atributos Ricardo Prudêncio.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
OBJETIVOS E JUSTIFICATIVA
Lista de Exercício IAI 2009 – Ricardo Prudêncio. Os objetivos dessa lista são: –Realizar treinamento de SVMs no WEKA –Praticar procedimento de seleção.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
A Gestão da Tomada de Decisão
2. Visão Geral de MD Alguns slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
Aula 11 - Teste de hipóteses, teste de uma proporção
O que é? É o processo de investigação técnica com intuito de identificar a qualidade, a segurança e a exatidão do software desenvolvido. A validação do.
Regressão Linear.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
1 2º Ciclo de Estudos – Mestrado Informática Médica Docente: Inês Dutra Alunos: João Janeiro Luis Martinez Ricardo Casal Disciplina: Sistemas de Apoio.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Regressão e Previsão Numérica.
SISTEMAS DE APOIO À DECISÃO - SAD
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Laboratório 5 Regras. Bases Utilize a base que se encontra no diretório de dados do weka: wheather.nominal.arff Gere regras usando diferentes classificadores.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Classificação de Textos
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Aula Pratica Aprendizagem WEKA Prof. Ivan Gesteira Costa Filho Centro de Informática Universidade Federal de Pernambuco.
Mineração de Dados (Data Mining)
ADMINISTRAÇÃO INTERDISCIPLINAR
INSTRUÇÕES PARA MONOGRAFIA  Os trabalhos de conclusão de curso(TCC), devem ser desenvolvidos e entregues individualmente.  A formatação deve seguir o.
Transcrição da apresentação:

Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.

Semana 1 (7/5/2010) 1.Em naive Bayes típico, é assumido a independência entre os atributos dos dados de treino. Explique a razão para esta presunção e as implicações da mesma. 2.Recorrendo a exemplos, mostra o impacto na estratégia de escolha dos testes (atributos) nos nós de uma árvore de decisão. Use o WEKA para mostrar as diferenças entre entropia e gini.

Semana 2 (21/5/2010) 1.Considere o dataset iris. Apresente resultados de taxas de acerto comparativo (para o algoritmo J48 do Weka) usando o dataset pré-discretizado com o algoritmo Fayyad-Irani e o dataset original. Apresente justificações para os resultados obtidos. 2.Considere o dataset labor. Usando os algoritmos J48 e simpleCart (Weka) apresente resultados (as diferentes árvores) que ilustram o uso das várias opções de pruning estudadas e.g. sub-tree rasing, replacement, laplace, minimal complexity pruning, etc. Apresente a justificação para os resultados obtidos com as avaliações por 10-xval e por training data.

Semana 3 (28/5/2010) 1.Considere o dataset soybean. Apresente um estudo comparativo usando validação cruzada e os algoritmos NaiveBayes, SimpleCART e J48. Apresente conclusões sobre os melhores desempenhos para cada classe (das 19 existentes). frog-eye-leaf-spot 2.Considerando o valor de AUC para a classe frog-eye-leaf-spot obtido pelo J4.8, que tipo de curva ROC esperaria obter? Justifique.

Semana 4 (4/6/2010) 1.Apresenta as diferentes características dos algoritmos de clustering k-means e EM. Ilustre com a execução de um exemplo. 2.Sugira uma estratégia para definir automaticamente o valor de k (número de partições) em algoritmos como o k-means, em que no algoritmo original k é fixado pelo utilizador.

Semana 5 (11/6/2010) 1.Execute um 10-XVal para o dataset iris com o algoritmo J48 e com o AdaBoostM1 sobre J48. Apresente os resultados obtidos em termos de erro. Sugira uma explicação para a comparação dos erros obtidos. 2.Que tipo de benefícios esperaria da aplicação de Bagging sobre Naive Bayes num dataset específico, sabendo que o resultado do modelo individual Naive Bayes nesse dataset é bastante bom (erro = 0.005). Justifique.

Semana 6 (18/6/2010) 1.Apresente os principais factores de complexidade de um algoritmo de geração de regras de associação. Ilustre a sua resposta com exemplos. 2.Descreva as principais fraquezas da medida de interessa confiança. Apresente exemplos de regras para ilustrar essas fraquezas. Sugira formas de ultrapassar os problemas levantados pelo usa da confiança.