Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: www.salford-systems.comwww.salford-systems.com Função: Classificação Técnica: Árvore de Decisão.

Slides:



Advertisements
Apresentações semelhantes
Ana Paula B. Barboza Ivana Xavier Rodrigues
Advertisements

Administração de Sistemas de Informação
INTELIGÊNGIA COMPUTACIONAL
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
Evolução dos SGBD’s.
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Felipe Carvalho – UFES 2009/2
Aplicações práticas da descoberta de conhecimento em BD
SISTEMAS DE INFORMAÇÃO
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
Bacharelado em Ciência da Computação
Introdução aos Sistemas Gerenciadores de Banco de Dados
Correção – Completude – Performance – Escalabilidade
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
Weka Coleção de algoritmos de aprendizado de máquina implementado em Java Tanto é API como aplicativo!!! Open source software Framework para o desenvolvimento.
Material III-Bimestre Wagner Santos C. de Jesus
Paulo J Azevedo Departamento de Informática
RN Seleção Temas Projetos Formação de equipes e procedimentos Equipes de 1 a 3 componentes Equipe precisa deixar clara a participação/responsabilidades.
Administração de Sistemas de Informação Banco de Dados
DATA MINING – MINERAÇÃO DE DADOS Prof. Régis Albuquerque
Unidade 3 – Estrutura dos SAD: Componentes e Arquitetura – Slide 1
Novos desafios em estudos de mercado: Knowledge Discovery e Data Mining 7º Congresso da APODEMO Novembro de 2000.
Data Mining, Data Warehousing e OLAP
Sandro Gonçalves Murara
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Sistema Recomendador para Comércio Eletrônico
High-Performance Extensible Indexing Publicado em 1999 na 25th VLDB Conference Por: Marcel Kornacker Apresentado por: Gustavo Augusto e Ivan Silva TABD.
Tecnologia da Informação
4.2. Data Mining (Mineração de Dados)
Curso de Editoração Eletrônica por meio de Seminários São José dos Campos – 28 de junho de 2007.
Sistemas Inteligentes
Data Mining: A arte de minerar conhecimento. Roteiro Visão do Problema –Introdução 1 –Motivação 2 Desafios Tecnologias: –Algoritmos de otimização de mineração.
OLAP Escola Politécnica da Universidade de São Paulo (EPUSP)
Data Mining: Conceitos e Técnicas
Mineração de Dados e Aprendizado de Máquina Marcilio Souto DIMAp/UFRN.
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
2. Visão Geral de MD Alguns slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira.
FERRAMENTAS DE GERENCIAMENTO Aula 01
WEKA Jacques Robin João Batista Marcelino Pereira junho/2001.
SQLite Banco de Dados II.
7. Mineração de Texto ("Text Mining")
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
DESENVOLVIMENTO DE SOFTWARE AULA 7 – Sistemas de Banco de Dados
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Jacques Robin CIn-UFPE Arquiteturas de software e linguagens de consultas para descoberta de conhecimento em BD.
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Mineração de Dados: Introdução
Introdução a Mineração de Dados
Sistemas de Apoio à Decisão (SAD) Decision Support Systems
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão.
INF BD2 SGBD SGBD Grupo: Lorem Ipsum Dolor Sit amet.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
KDD E MINERAÇÃO DE DADOS
O PROCESSO DE KDD Elaborado por: Jader Gustavo de Campos Santos Rhafael Freitas da Costa.
Mineração de Dados Profa. Sandra de Amo
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Conceitos Programação Web.
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
DATA MINING: Conceitos e Principais Técnicas Seminário da disciplina IN940 - Banco de Dados Estudante: João Sedraz Professores: Ana Carolina | Fernando.
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Acesso a Banco de Dados com o JDBC Prof. M.Sc. Ronnison Reges Vidal.
Aula 1.  O que é?  Porque usar?  Onde é usado?  Como funciona?  SGBD  Linguagem SQL  Alguns Exemplos de tecnologias conhecidas.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
Profa. Ms. Léia D’Alvia Aula D. Empresas Capacidade de surpreender o cliente diferente de preço e prazo Reinventaram o seu setor A Informação será o grande.
Transcrição da apresentação:

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão Descrição Pré-processamento Preenche valores faltando Diferentes técnicas de fragmentação Ler dados de mais de 80 formatos diferentes Excel, LOtus, Informix, Oracle,... CART

Marcus Sampaio DSC/UFCG Clementine URL: Funções: Regras de associação, classificação, “clustering”, descoberta de seqüências, previsão Técnicas: Apriori, C5.0, regressão linear, e outras Descrição Escala Arquitetura cliente/servidor Acesso a BD Geração automática de consultas SQL

Marcus Sampaio DSC/UFCG Data Mining Suite URL: Funções: Regras de associação, “clustering”, classificação, série temporal Técnicas: Regras de Associação, Regras de Classificação, predição,... Descrição Modelos resultantes são armazenados e consultados com a linguagem Pattern Query Language

Marcus Sampaio DSC/UFCG Intelligent Miner Funções: Regras de associação, classificação, “clustering”, séries temporais, padrões de seqüências Técnicas: Árvores de Decisão (CART), redes neurais, regressão linear Descrição Integrado com o SGBD DB2 Compatibilidade com o SGBD Oracle

Marcus Sampaio DSC/UFCG Oracle9(10)i Database URL: bi_dm.html bi_dm.html Funções: Regras de Associação, classificação Técnicas: Apriori, NaïveBayes Descrição Componente de mineração de dados embutido no SGBD Oracle9(10)i

Marcus Sampaio DSC/UFCG See5 URL: Função: Classificação Técnica: Árvores de decisão, regras de classificação Descrição Implementação comercial do C5.0 Programas em C podem hospedar comandos da API do sistema

Marcus Sampaio DSC/UFCG WebMiner URL: Função: “Web mining” Descrição Ferramenta de mineração de dados para sites de comércio eletrônico, visando a personalização

Marcus Sampaio DSC/UFCG Outros Produtos

Marcus Sampaio DSC/UFCG Uma Classificação de Produtos General Purpose Data Mining WEKA (Source: Java)WEKA MLC++ (Source: C++)MLC++ SIPINA List from KDNuggets (Various)List from KDNuggets List from Data Management Center (Various)List from Data Management Center ClassificationC4.5 (Decision tree)C4.5 OC1 (Oblique decision tree)OC1 Ripper (Rule-based)Ripper CBA (association-rule based)CBA bayes (Naive Bayes)bayes Evidential distance-based (nearest-neighbor)Evidential distance-based PEBLS (nearest-neighbor)PEBLS mlp (Neural Network)mlp tiberius (Neural Network)tiberius svmlight (Support Vector Machine)svmlight

Marcus Sampaio DSC/UFCG Uma Classificação de Produtos (2) Association AnalysisFIMI Repository of Algorithms Apriori, Eclat, and FP Growth ARTool ARMADA (Association rule mining in Matlab)ARMADA Tree Mining, Closed Itemsets, Sequential Pattern MiningTree Mining, Closed Itemsets, Sequential Pattern Mining Tree Mining, Closed Itemsets, Sequential Pattern MiningTree Mining, Closed Itemsets, Sequential Pattern Mining PAFI Cluster AnalysisCLUTO Open Source Clustering SoftwareCLUTO Open Source Clustering Software Model-based Clustering Online software for Clustering

Marcus Sampaio DSC/UFCG Uma Classificação de Produtos (3) Anomaly DetectionORCA (distance based)ORCA RegressionRegression routines Data PreprocessingFeature Selection Isomap (Dimensionality Reduction - in Matlab)Isomap (Dimensionality Reduction - in Matlab)

Marcus Sampaio DSC/UFCG Banco de “Data Sets” Data Sets IDS data sets Data Sets for Data Mining Competition Data Set UCI Machine learning repository Quest data repository KDNuggets