Mineração de Dados ou Descoberta de conhecimento em BDs

Slides:



Advertisements
Apresentações semelhantes
SISTEMAS DE SUPORTE À DECISÃO
Advertisements

Introdução SEAOF - Sistema Especialista para Auxílio a Operações Financeiras.
Introdução aos Sistemas de Informação Gerencial
Administração de Sistemas de Informação
INTELIGÊNGIA COMPUTACIONAL
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
E-business: Como as Empresas Usam os Sistemas de Informação.
Sistemas de Informação Valor da informação e suas características
Data Warehouse / Data Marts / DataMining /OLAP
Felipe Carvalho – UFES 2009/2
Planejamento Estratégico de TI
1 MD - junho/2008 Identificação do problema Ao final dessa etapa espera-se ter: Definição da área Definição do problema Definição dos dados.
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
Prof. Dra. Maria Virginia Llatas
Informação - Conceitos
Segmentação de mercado
Preparação Básica Pyle, D. Data preparation for Data Mining Capítulo 4.
Professora: Aline Vasconcelos
Mineração de Dados Introdução.
Aula 4 – Inteligência de Negócios (Business Intellingence)
KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.
- GQM – Goal/Question/Metric
Administração de Sistemas de Informação Banco de Dados
DATA MINING – MINERAÇÃO DE DADOS Prof. Régis Albuquerque
Sistema de Unificação de Cadastros
Cicília Raquel Maia Leite –
Data Mining como ferramenta de Gestão
Data Warehouse & Data Mining
Universidade São Marcos Curso: Gestão de Negócios Internacionais
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Banco de Dados II Prof. Antônio Cordeiro.
SIM - Sistema de Informações de Marketing
Efficient Consumer Response (ECR)
Metolodogia de Desenvolvimento de Data Warehouse
Gerenciamento de Dados
Sociedade da Informação: Ambiente de TI nas Organizações
Pesquisas e Sistemas de Informação de Marketing
Tecnologia da informação e estado
Business Intelligence:
Tecnologia da informação
SAD - 2. Processo Decisório - Etapas
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Capacidades do Data Warehouse
Projeto de Banco de Dados
GESTÃO DAS INFORMAÇÕES DA ORGANIZAÇÃO
TECNOLOGIA DA INFORMAÇÃO
J OÃO C ARVALHO Data Warehouses. D EFINIÇÃO Um Data Warehouse é um sistema de computação utilizado para armazenar informações relativas às actividades.
SATISFAÇÃO, VALOR E RETENÇÃO DE CLIENTES
Extração de Regras de RNA Wilian Soares Lacerda Fevereiro de 2003.
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Sistemas de Informação
RUP - Cap. 4 – Processo Centrado na Arquitetura
FMU PROFESSORA: SANDRA MARA TENCHENA FERRAMENTAS DE MARKETING
Sistemas Digitais e Automação
Prof. Ana Martins – UCB Unidade 02 Aula 03
Unidade 5 – Grupo 19Y.  Estratégias que respondem às necessidades crescentes e variadas dos consumidores: ◦ Introdução Eficiente do Produto ◦ Sortimento.
Mineração de Dados: Introdução
Descoberta de Conhecimento em BD Jacques Robin e Ricardo Bezerra.
Universidade Federal do Paraná
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
DADOS São os fatos em sua forma primária; Tipos: Dados Alfanuméricos;
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Disciplina: Inteligência Artificial
Capítulo 2: SIG / SAD / SAE.
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Modelos de dados.
Objetivos do Capítulo Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
Transcrição da apresentação:

Mineração de Dados ou Descoberta de conhecimento em BDs Márcia Jacyntha N. Rodrigues Anne Magaly Canuto

Indice Introdução Definição Processo de Mineração Identificação do Problema, Pré-processamento, Extração de padrões, Pós-processamento Tecnologias de Suporte Perspectivas Futuras

Introdução Informatização dos meios produtivos permitiu a geração de grandes volumes de dados: Transações eletrônicas; Novos equipamentos científicos e industriais para observação e controle; Dispositivos de armazenamento em massa; Aproveitamento da informação permite ganho de competitividade: “conhecimento é poder Recursos de análise de dados tradicionais são inviáveis para acompanhar esta evolução: processo iterativo de criação, teste e refinamento de hipóteses;

Introdução Análise de dados para tomada de decisão: Solução: Morrendo de sede por conhecimento em um oceano de dados” Análise de dados para tomada de decisão: BD da Wal-Mart: 20 milhões de transações por dia BD da NASA: recebe de satélites 50 GB por hora Solução: ferramentas de automatização das tarefas repetitivas e sistemática de análise de dados ferramentas de auxílio para as tarefas cognitivas da análise integração das ferramentas em sistemas apoiando o processo completo de descoberta de conhecimento para tomada de decisão

Exemplo Problema do mundo dos negócios, entender o perfil dos clientes: desenvolvimento de novos produtos; para controle de estoque em postos de distribuição; propaganda mal direcionada gera maiores gastos e desestimula o possível interessado a procurar as ofertas adequadas; Situação: empresa possui registro de todas as transações efetuadas; mas como aproveitar dessa riqueza de dados? Categorias: produtos de esporte; eletrodomésticos; produtos de entretenimento; produtos para o lar;

Exemplo Analistas precisam de ferramentas capazes de responder a perguntas como: “Qual produto de alta lucratividade venderia mais com a promoção de um item de baixa lucratividade?” Um Datawarehouse(DW) é utilizado por ferramentas OLAp e f. de mineração de dados F. OLAp direcionada a consultas de usuários Esta abordagem impedi que padrões escondidos sejam encontrados por isso a existência de técnicas de análise dirigidas por computador q possibilitem extração de conhecimento

Definição “Extração de conhecimento de BD é o processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis embutidos nos dados” Fayyad, Shapiro e Smyth Dados: fatos ou casos em um repositório de dados Padrões: abstração de um subconjunto de dados em alguma ling. descritiva de conceitos Processo: Extração de conhecimento de base de dados envolvendo diversas etapas; Válido: padroes descobertos devem possuir algum grau de certeza Novos: um padrão encontrado deve fornecer novas informações sob

Processo de Mineração de Dados Pós-processamento Extração de Padrões Pré-processamento Identificação do Problema

Processo de Mineração de Dados Processo Iterativo e Interativo Usuário: especialista do domínio, analista (conhece as etapas do processo), usuário final (utiliza o conhecimento) Identificação do Problema definição de objetivos e metas a serem alcançados Sucesso depende da participação dos especialistas do domínio da aplicação no fornecimento de conhecimento sobre o domínio e apoio aos analistas em sua tarefa de encontrar padrões No pré-processamento, esta etapa ajuda o analista na escolha do melhor conjunto de dados para realizar extrações

Pré-Processamento Extração e Integração: obter dados de diversas fontes e realizar sua unificação Transformação: agrupar dados em forma de resumos, transformação de tipos para adequação do algoritmo Limpeza: erros de digitação, leitura dos dados pelos sensores. Atributos incompletos. Limpeza dependente e independente de domínio Seleção e Redução de Dados: redução do número de exemplo, número de atributos, número de valores de um atributo

Exemplo de Pré-processamento Com seu conhecimento do domínio, analista humano decide: que as informações relevantes a-priori encontram-se nas seguintes tabelas: clientes: nome, identificação, idade, sexo, estado civil, endereço, renda, proprietário da casa; produtos: nome, identificação, preço, categoria, quantidade em estoque, quantidade encomendada; transações: identificador de cliente, identificador de produto, data e hora, quantidade; Eliminar registros incompletos, inconsistentes, etc.

Transformação de dados

Extração de Padrões Escolha de tarefas – é feita de acordo com os objetivo desejáveis para a solução a ser encontrada: atividades preditivas ou descritivas Escolha do algoritmo Extração de Padrões Técnicas usadas em MD: Algoritmo Genético, arvores e regras de decisão, redes neurais, lógica fuzzy, clustering

Pós-Processamento O conhecimento extraído representa o conhecimento do especialista? De que maneira o conhecimento do especialista difere do conhecimento extraído?

Tecnologias de Suporte If ... Then Árvore de Decisão Conhecimento OLAP Informação MD DW MD Dados