KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.

Slides:



Advertisements
Apresentações semelhantes
Agenda Introdução Justificativa Objetivo Detecção de Spam
Advertisements

Administração de Sistemas de Informação
ETAPAS DE ESTUDO EM P.O. Definição e Formulação do Problema
INTELIGÊNGIA COMPUTACIONAL
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
Introdução à Programação Orientada à Objetos Prof. Daniel Merli Lamosa Maio de 2002.
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
Felipe Carvalho – UFES 2009/2
Simulação e Visualização para Robótica Móvel
Fusão e Tratamento de Ambiguidades em Conhecimento Descoberto e Adquirido Paulo Oliveira FEUP, 17 de Dezembro de 2002.
WBEM & WMI Paulo Sacramento ©Paulo Sacramento 2002.
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
Universidade Federal do Paraná
Mineração de Dados ou Descoberta de conhecimento em BDs
Professora: Aline Vasconcelos
Iana Alexandra Alves Rufino
Modelagem e simulação de sistemas
Mineração de Dados Introdução.
FACENS – Engenharia da Computação Inteligência Artificial
Agrupamento de Dados: uma Revisão Data Clustering
Descoberta de Padrões usando Conhecimento Prévio
Using Concept Hierarchies in Knowledge Discovery
DATA MINING Inteligência Artificial
TOpico Especial 1: Banco de Dados Geográfico
Jackson D. N. Mourão Pietrângelo V. Ferronato
Linguagem C Conteúdos já desenvolvidos
Paulo J Azevedo Departamento de Informática
INF 1771 – Inteligência Artificial
II. M o d e l o s d e C o n h e c i m e n t o
Data Mining como ferramenta de Gestão
Data Mining, Data Warehousing e OLAP
Diferenciação de Produtos
27.Fev.2002Sistemas de Informação – Administração Pública 2001/20021 Sistemas de Informação Direcção GestoresContabilidadeFinançasComprasVendasArmazémProduçãoExpedição.
Modelagem de dados e representação da informação
Modelo Conceitual Descreve a informação que o sistema vai gerenciar
Eng. Luiz Carlos Figueiredo -MEE Unileste-MG
Tipologia da Informação “As organizações dependem de informações de naturezas diversas para alcançar seus objetivos” Adriana Beal Classificação quanto.
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Concorrência Real e Concorrência Potencial
Teoria Neoclássica Duas Estruturas de Mercado Extremas
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
Sociedade da Informação: Ambiente de TI nas Organizações
Informação para a Gestão em Saúde: Rede Gaúcha de Informações em Saúde
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Capacidades do Data Warehouse
Aprendizado de Máquina - Introdução
Data Mining: Conceitos e Técnicas
Desenvolvimento Formal de Software
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Extração de Regras de RNA Wilian Soares Lacerda Fevereiro de 2003.
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Patrícia A. Jaques (orientadora) São Leopoldo, dezembro de 2007
M INERAÇÃO DE R ELACIONAMENTOS - L INK M INING Ricardo Prudêncio.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Mineração de Dados: Introdução
Universidade Federal do Paraná
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Descoberta em múltiplos níveis conceituais
KDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Projeto de Banco de Dados
Professora Michelle Luz
DATA MINING: Conceitos e Principais Técnicas Seminário da disciplina IN940 - Banco de Dados Estudante: João Sedraz Professores: Ana Carolina | Fernando.
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
Modelos de dados.
Transcrição da apresentação:

KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002

KDD: Motivação aumento do volume de dados ineficiência da análise manual necessidade de novas teorias e ferramentas para auxílio na extração de conhecimento do crescente volume de dados digitais OLAP (on-line analytical processing): uma das primeiras técnicas de suporte à análise de dados set/2002

KDD: Definição Processo não trivial de identificar padrões que sejam válidos, novos, potencialmente úteis e inteligíveis, em dados. CONHECIMENTO set/2002

KDD: Objetivos 1. Verificação (hipótese do usuário) 2. Descoberta (novos padrões) - previsão - descrição set/2002

Classificação dos Padrões 1. Regra de Associação - regras na forma: A1...  AnB1 ... Bm (atributos) - redes de dependência de probabilidade Itens A e C: A  C (50%, 66.6%) suporte: P(A e C) = 50% confiança: P(C|A) = 66.6% Grau de Interesse set/2002

Classificação dos Padrões 2. Regra de Classificação - classificação de um conjunto de dados baseado nos valores de um atributo (atributo classificador) - árvores de decisão - aprendizado de máquina - redes neurais set/2002

Classificação dos Padrões 3. Agrupamento - agrupa um conjunto de dados (sem um determinado atributo) - similaridade intraclasse x extraclasse 4. Detecção de mudança/desvio - evolução do comportamento de um conjunto de dados set/2002

Classificação dos Padrões 5. Regras de Generalização - sintetizar características gerais de um conjunto de dados ex: média e desvio padrão - visão de alto nível de um conjunto de dados set/2002

Classificação dos Padrões Alimentos pão leite desnatado B A integral branco - Indução orientada a atributos (utiliza hierarquia da conceitos) set/2002

Etapas do KDD Interpretação / Avaliação Mineração de Dados Transformação CONHECIMENTO Pré-processamento Padrões Seleção Dados Transformados Dados Pré-processados Dados Alvo Dados set/2002

Grupo BIOINFO-USP Mundo Externo Mineração de Dados Transformação dos dados Máquinas Paralelas de Alto Desempenho Leitura de Dados Núcleo de Mineração BD Relacional Dados Primários BD de Objetos Complexos OC Elo entre dados primários e OC set/2002

Grupo BIOINFO-USP Mineração de Dados (dados extraídos do BD) - classificadores e técnicas de agrupamento - representação do conhecimento: objetos complexos/BD Relacional Interesses futuros: - técnicas de representação de conhecimento de IA - uso de conhecimento prévio set/2002

Proposta de Pesquisa Ferramentas de representação de conhecimento Base de Conhecimento Permitir a integração com a etapa de Mineração de Dados set/2002

Proposta de Pesquisa Hierarquia de Conceitos Formação: implícita no BD (definida pelo projetista) definida por especialistas análise de distribuição de dados (descoberta) set/2002

Proposta de Pesquisa Hierarquia de Conceitos (cont) Ajuste: dados dinâmicos levam a novos conceitos Codificação: permitir que seja utilizada pelos algoritmos de MD set/2002

Descoberta de padrões em múltiplos níveis conceituais Mineração de conceitos individuais (primitivos ou mais abstratos) (1) em geral, não existem regularidades fortes em conceitos de níveis baixos de abstração (2) regularidades em conceitos de nível mais alto de abstração, em geral podem ser conhecidas set/2002

Descoberta de padrões em múltiplos níveis conceituais Alimentos pão leite desnatado B A integral branco Leite Integral  Pão Branco set/2002

KDD + IA Fim set/2002

Árvores de Decisão Jogar tênis SOL Chuvoso Encoberto umidade sim vento alta normal forte fraco não sim não sim set/2002