4.2. Data Mining (Mineração de Dados)

Slides:



Advertisements
Apresentações semelhantes
SISTEMAS DE INFORMAÇÕES GERENCIAIS
Advertisements

Sistemas de Informação
Administração de Sistemas de Informação
SIN - Sistemas de Informação
INTELIGÊNGIA COMPUTACIONAL
SIM- Sistemas de Informação de Marketing
Data Warehouse / Data Marts / DataMining /OLAP
Felipe Carvalho – UFES 2009/2
Planejamento Estratégico de TI
Planejamento Estratégico de TI
PROBLEMAS E DECISÕES EMPRESARIAIS
Universidade Federal do Paraná
Mineração de Dados ou Descoberta de conhecimento em BDs
Redes Neurais (Conceitos Fundamentais)
Descoberta de Conhecimento em BD Jacques Robin e Ricardo Bezerra.
Mineração de Dados Introdução.
Descoberta de Conhecimento em Bases de Dados e Mineração de Dados
DATA MINING Disciplina Banco de Dados 1998 Alunos
FACENS – Engenharia da Computação Inteligência Artificial
Aula 4 – Inteligência de Negócios (Business Intellingence)
Agrupamento de padrões Métodos hierárquicos
KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.
Paulo J Azevedo Departamento de Informática
Noções de Sistemas de Informação – Aula 4
Classes e objetos Modelagem
Unidade 3 – Estrutura dos SAD: Componentes e Arquitetura – Slide 1
Sistema de Informação Gerencial (SIG)
Aprendizado de Máquina
Data Mining como ferramenta de Gestão
Data Warehouse & Data Mining
Link Mining Víctor Medeiros.
DATA MINING (MINERAÇÃO DE DADOS)
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Conhecimento Científico Noutros conhecimentos...
Gerenciamento de Dados
SAD – 1. Introdução - Histórico
Tecnologia da Informação
SAD - 2. Processo Decisório - Etapas
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Capacidades do Data Warehouse
Aprendizado de Máquina - Introdução
Data Mining: Conceitos e Técnicas
Mineração de Dados e Aprendizado de Máquina Marcilio Souto DIMAp/UFRN.
Exercício - 1. Criar no SPSS o banco de dados com as informações fornecidas 2. Salvar o banco com o nome atividade física na pasta pos pilates 3.
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
Volume de dados / filtragem – auxiliar na tomada de decisão Tempo x dinheiro / uso de informações Otimização e organização / investimento.
Superintendente de Produtos e Serviços
TECNOLOGIA DA INFORMAÇÃO
DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira.
Gestão da Tecnologia da Informação
Prof. Ana Martins – UCB Unidade 02 Aula 03
Como Melhorar a Tomada de Decisão
SISTEMAS DE APOIO À DECISÃO - SAD
Mineração de Dados: Introdução
Descoberta de Conhecimento em BD Jacques Robin e Ricardo Bezerra.
Universidade Federal do Paraná
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
KDD E MINERAÇÃO DE DADOS
O PROCESSO DE KDD Elaborado por: Jader Gustavo de Campos Santos Rhafael Freitas da Costa.
KDD E MINERAÇÃO DE DADOS:
Gestão do Conhecimento e da Informação
Aplicações em Redes Neurais Artificiais De acordo com Turbam, McLean e Wetherbe (2004), “a computação neural também pode ser combinada com outros sistemas.
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
DATA MINING: Conceitos e Principais Técnicas Seminário da disciplina IN940 - Banco de Dados Estudante: João Sedraz Professores: Ana Carolina | Fernando.
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informações Sistemas Informações Empresariais 4. SIG Marketing e Vendas Márcio Aurélio Ribeiro Moreira
Reconhecimento de Padrões Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura.
Transcrição da apresentação:

4.2. Data Mining (Mineração de Dados) Qual a motivação? “Temos tudo informatizado na empresa, mas sinto que faltam mais informações. Falta conhecimento. Parece que morro de sede (conhecimento) num oceano de dados” O Data Warehouse não consegue ter insigths durante as análises de dados SPT e SIG: apóiam tarefas rotineiras SE e DW: apóiam o processo cognitivo Data mining: apóia o processo de descoberta Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 1

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 2 Exemplo do Wall-Mart O que fraldas tem a ver com cerveja? Premissas dos gerentes das lojas: Mães compram fraldas  seção feminina e de bebês. Homens compram cervejas  seção masculina e bebidas. O Terada Warehouse Miner fez a seguinte sugestão: Coloquem a seção de fraldas ao lado da seção de cervejas. Resultado: As vendas de cerveja cresceram 30%. As vendas de fraldas cresceram 40%. Porque? Homens casados, entre 25 e 30 anos, compram fraldas e/ou cervejas no final das tardes de sexta-feira no retorno do trabalho para casa. Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 2

Descoberta de conhecimento em DB “Um processo não trivial de identificação de padrões válidos, novos, úteis e implicitamente presentes em grandes volumes de dados.” (Knowledge Discovery in Database - KDD - Fayyad et al. 1996) Usa várias técnicas para descobrir modelos e relações ocultas em grandes bancos de dados Isto permite inferir regras de comportamento futuros e orientar a tomada de decisões “Torture os dados até eles confessarem” Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 3

Etapas do processo de KDD Paradigmas de Data Mining: Árvores de decisão Regras de inferência Baseado em instâncias (exemplos, fatos passados) Redes neurais, algoritmos estatísticos e genéticos Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 4

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 5 KDD x Data Mining Data Mining é o passo do processo de KDD que produz um conjunto de padrões (conhecimento) sob um custo computacional aceitável Incorpora tarefas de escolha do algoritmo adequado, processamento e amostragem de dados e interpretação de resultados O Data Mining fornece os “insights” para gerenciar oportunidades e problemas existentes ou potenciais Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 5

Tipos de Informações do Data Mining Associações Detecta eventos relacionados. Ex: Wall-Mart. Seqüências Comportamento de compras de usuários de cartões. Classificação Quais produtos são mais rentáveis. Aglomeração Identifica agrupamentos nos dados. Ex: locais de crimes. Prognósticos Previsões de vendas, taxa de ocupação de hotéis, etc. Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 6

Tarefas básicas - Previsão Fixa n variáveis e calcula outras k: Cálculo de variáveis de interesse a partir dos valores de um conjunto de variáveis de explicação Normalmente é usada no aprendizado de máquina ou estatística Exemplos: classificação e regressão Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 7

Exemplo de Previsão - Análise de Crédito Legenda: x: crédito recusado o: crédito concedido renda débito x o t sem crédito renda débito x o t sem crédito Plano paralelo: Fácil interpretação: Se renda < t  sem crédito Exemplo: árvores de decisão indução de regras Plano oblíquo: melhor separação Exemplos: regressão linear perceptron Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 8

Exemplo de Previsão - Análise de Crédito Legenda: x: crédito recusado o: crédito concedido renda débito x o t sem crédito renda débito x o t sem crédito Superfície não linear: melhor classificação pior interpretação Exemplos: perceptrons multicamadas regressão não-linear Baseado em exemplos Exemplos: k-vizinhos mais próximos raciocínio baseado em casos Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 9

Exemplo de Árvore de Decisão Sexo País Idade Compra M França 25 Sim Inglaterra 21 F 23 34 30 Não Alemanha 20 18 55 País Alemanha Inglaterra França Sim Não Idade > 25 < 25 Sim Não Dados das vendas por mala direta do livro: “Um guia para restaurantes franceses na Inglaterra”. Fonte: Aurélio, Vellasco e Lopes (1999) Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 10

Tarefas básicas - Descrição Reportar relações entre as variáveis do modelo de forma simétrica À princípio, está mais relacionada ao processo de KDD Exemplos: agrupamento, sumarização (inclusive de textos), dependências, análise de desvio Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 11

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 12 Exemplo de Descrição Agrupamento Exemplo: Vector quantization Web Mining: Data Mining aplicado à servidores web Prevê padrões de acesso a servidores Análise de crédito renda débito + t +: exemplo Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 12

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 13 Data Mining - Cases American Express: Software analisa bilhões de compras para: Criar campanhas de marketing individuais Detectar fraudes e roubos de cartões de crédito Lojas Brasileiras: Reduziu mix de produtos de 51000 para 14000 Otimizou a organização das gôndolas Exemplo de anomalias detectadas: Roupas de inverno e guarda chuvas encalhadas no nordeste Batedeiras 110V a venda em SC (lá só tem 220V) Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 13

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 14 Data Mining - Cases Bank of America: Selecionou entre seus 36 milhões de clientes Aqueles com menor risco de dar calotes Tinham filhos com idades entre 18 e 21 anos Resultado: Em três anos o banco lucrou 30 milhões de dólares com a carteira de empréstimos NASA: Cataloga imagem de satélites classifica eventos similares Empresas de Telecom: Detecção de ligações fraudulentas e clones de celulares Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 14

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 15 Data Mining - Produtos Fabricantes: Líderes: Oracle, SPSS e SAS Grandes: IBM e CA Produtos: Oracle Data Mining SPSS SAS – Enterprise Miner IBM DB2 Inteligent Miner PolyAnalist Clementine WizRule e WizWhy Bramining Rule Evolver Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 15

Unidade 4 – Decisões Estruturadas – Data Mining – Slide 16 Oracle Data Mining Márcio Moreira Unidade 4 – Decisões Estruturadas – Data Mining – Slide 16