Sistemas de Apoio à Decisão (SAD) Decision Support Systems Andreas Wichert LEIC Tagus (Página da cadeira: Fenix)
Objectivo Geral Acumular informação para produzir indicadores de negócio que permitam tomar decisões Extracção de conhecimento interessante (regras, padrões, restrições) dos dados existentes em grandes BDs
Corpo docente Andreas Wichert - Teóricas Helena Galhardas andreas.wichert@inesc-id.pt Helena Galhardas José Barateiro - Laboratórios
Organização das aulas Teóricas: Práticas/Laboratório: Matéria (slides baseados no livro e artigos) Apresentação de pessoas externas Práticas/Laboratório: Exercícios Utilização do SW SAS v. 9 Ínicio: 6/3
Avaliação Projecto DW (PDW): grupos de 3 pessoas – 40% Nota mínima: 9,5v Inscrições na página da cadeira no Fenix (agrupamentos) Entrega do enunciado: 13 Março Entrega do projecto: 31 Março Discussões: 3 a 7 Abril Projecto DM (PDM): mesmos grupos de 3 pessoas – 30% Entrega do enunciado: 24 Abril Entrega do projecto: 2 Junho Discussões: 12 -16 Junho Exame (DM): individual – 30% 1º Exame: 20/6, 17H 2º Exame: 15/7, 11H
Data Mining: Concepts and Techniques
Reconhecimento Prof. Jiawei Han hanj@cs.uiuc.edu University of Illinois at Urbana-Champaign http://www-sal.cs.uiuc.edu/~hanj/ Slides: http://www-sal.cs.uiuc.edu/~hanj/bk2/
Bibliografia - DW Data Mining: Concepts and Techniques, J. Han & M. Kamber, Morgan Kaufmann, 2001 The Data Warehouse Toolkit, 2nd ed, Ralph Kimball, Margy Ross, 2002
Bibliografia - DM Artificial ,Intelligence - A Modern Approach, Second Edition, S. Russel and P. Norvig, Prentice Hall, 2003 Machine Learning, T. Mitchell, 1997 Artificial Intelligence - Structures and Strategies for Complex Problem Solving, Second Edition, G. L. Luger and W. A. Stubblefield, Benjamin/Cummings Publishing, 1993
Programa Datawarehouse (DW) e Sistemas de Apoio à Decisão Modelo multidimensional vs modelo relacional, Teoria da normalização do modelo relacional Operações OLAP (Online Analytical Processing) Desenho de DW Arquitectura de DW Implementação de DW
Programa Pré-processamento, transformação e limpeza de dados Exploração de dados (data mining) Descrição de conceitos e generalização de dados Árvores de decisão Redes neuronais Redes bayesianas Regras de associação Análise de clusters Classificação baseada em instâncias
Informação necessária para apoio à decisão Características requeridas para a informação utilizada para a tomada de decisão: precisa fiável actualizada relevante orientada à acção
Sistemas operacionais Contabilidade, compras, reservas, telecomunicações, etc Muitas fontes de dados dispersas (ficheiros excel, BD Access) de suporte a aplicações do tipo: SAP, ERPs, etc Alguns problemas: acesso aos dados díficil, qualidade de dados duvidosa, dados estruturados à aplicação (ex: códigos específicos), suporte a interrogações simples
Conceito de um DW Conjunto centralizado de dados: temáticos históricos datados integrados que oferece um nível de qualidade adequado às aplicações de decisão
Arquitectura geral SAD Data Warehouse Extract Transform Load Refresh Metadata Data Marts Data Storage OLAP Engine Serve OLAP Server Analysis Query Reports Data mining Front-End Tools other sources Operational DBs Data Sources
What is Data Mining ? http://www-sal.cs.uiuc.edu/~hanj/ Chapter 1, Slides: http://www-sal.cs.uiuc.edu/~hanj/bk2/