Marcus Sampaio DSC/UFCG
Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão Descrição Pré-processamento Preenche valores faltando Diferentes técnicas de fragmentação Ler dados de mais de 80 formatos diferentes Excel, LOtus, Informix, Oracle,... CART
Marcus Sampaio DSC/UFCG Clementine URL: Funções: Regras de associação, classificação, “clustering”, descoberta de seqüências, previsão Técnicas: Apriori, C5.0, regressão linear, e outras Descrição Escala Arquitetura cliente/servidor Acesso a BD Geração automática de consultas SQL
Marcus Sampaio DSC/UFCG Data Mining Suite URL: Funções: Regras de associação, “clustering”, classificação, série temporal Técnicas: Regras de Associação, Regras de Classificação, predição,... Descrição Modelos resultantes são armazenados e consultados com a linguagem Pattern Query Language
Marcus Sampaio DSC/UFCG Intelligent Miner Funções: Regras de associação, classificação, “clustering”, séries temporais, padrões de seqüências Técnicas: Árvores de Decisão (CART), redes neurais, regressão linear Descrição Integrado com o SGBD DB2 Compatibilidade com o SGBD Oracle
Marcus Sampaio DSC/UFCG Oracle9(10)i Database URL: bi_dm.html bi_dm.html Funções: Regras de Associação, classificação Técnicas: Apriori, NaïveBayes Descrição Componente de mineração de dados embutido no SGBD Oracle9(10)i
Marcus Sampaio DSC/UFCG See5 URL: Função: Classificação Técnica: Árvores de decisão, regras de classificação Descrição Implementação comercial do C5.0 Programas em C podem hospedar comandos da API do sistema
Marcus Sampaio DSC/UFCG WebMiner URL: Função: “Web mining” Descrição Ferramenta de mineração de dados para sites de comércio eletrônico, visando a personalização
Marcus Sampaio DSC/UFCG Outros Produtos
Marcus Sampaio DSC/UFCG Uma Classificação de Produtos General Purpose Data Mining WEKA (Source: Java)WEKA MLC++ (Source: C++)MLC++ SIPINA List from KDNuggets (Various)List from KDNuggets List from Data Management Center (Various)List from Data Management Center ClassificationC4.5 (Decision tree)C4.5 OC1 (Oblique decision tree)OC1 Ripper (Rule-based)Ripper CBA (association-rule based)CBA bayes (Naive Bayes)bayes Evidential distance-based (nearest-neighbor)Evidential distance-based PEBLS (nearest-neighbor)PEBLS mlp (Neural Network)mlp tiberius (Neural Network)tiberius svmlight (Support Vector Machine)svmlight
Marcus Sampaio DSC/UFCG Uma Classificação de Produtos (2) Association AnalysisFIMI Repository of Algorithms Apriori, Eclat, and FP Growth ARTool ARMADA (Association rule mining in Matlab)ARMADA Tree Mining, Closed Itemsets, Sequential Pattern MiningTree Mining, Closed Itemsets, Sequential Pattern Mining Tree Mining, Closed Itemsets, Sequential Pattern MiningTree Mining, Closed Itemsets, Sequential Pattern Mining PAFI Cluster AnalysisCLUTO Open Source Clustering SoftwareCLUTO Open Source Clustering Software Model-based Clustering Online software for Clustering
Marcus Sampaio DSC/UFCG Uma Classificação de Produtos (3) Anomaly DetectionORCA (distance based)ORCA RegressionRegression routines Data PreprocessingFeature Selection Isomap (Dimensionality Reduction - in Matlab)Isomap (Dimensionality Reduction - in Matlab)
Marcus Sampaio DSC/UFCG Banco de “Data Sets” Data Sets IDS data sets Data Sets for Data Mining Competition Data Set UCI Machine learning repository Quest data repository KDNuggets