HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.

Slides:



Advertisements
Apresentações semelhantes
Agenda Introdução Justificativa Objetivo Detecção de Spam
Advertisements

Administração de Sistemas de Informação
INTELIGÊNGIA COMPUTACIONAL
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
Planejamento Estratégico de TI
SAD - SISTEMA DE APOIO À DECISÃO Prof. Wagner Andrade
HAC MD -junho/ Noções de algoritmos e estudo de casos das principais tarefas de Mineração de dados.
Introdução aos Sistemas Gerenciadores de Banco de Dados
Mineração de Dados ou Descoberta de conhecimento em BDs
Raciocínio Baseado em Casos
Mineração de Dados Introdução.
FACENS – Engenharia da Computação Inteligência Artificial
Aula 4 – Inteligência de Negócios (Business Intellingence)
KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
Conjunto de ferramentas e técnicas que objetivam dar suporte à
Business Intelligence
Unidade 3 – Estrutura dos SAD: Componentes e Arquitetura – Slide 1
Data Mining, Data Warehousing e OLAP
Tomada de Decisão e Sistemas de Informação
INTELIGÊNCIA ARTIFICIAL (IA OU AI)
Metolodogia de Desenvolvimento de Data Warehouse
Gerenciamento de Dados
Sociedade da Informação: Ambiente de TI nas Organizações
Thales Alberto Priscila Tavares Kali Fauaze Igor Daniel William Martin.
Tecnologia da informação e estado
Tecnologia da Informação
Business Intelligence:
Tecnologia da informação
Inteligência Artificial
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Aprendizado de Máquina - Introdução
Data Mining: Conceitos e Técnicas
Sistemas Especialistas
Nomes: Alice C.Cazalli Allison Willian Everton Costa Denis A. Araujo
Marcílio C. P. de Souto DIMAp/UFRN
Software engineering, the software process and their support M.M. Lehman Apresentadora: Tarciana Dias da Silva.
J OÃO C ARVALHO Data Warehouses. D EFINIÇÃO Um Data Warehouse é um sistema de computação utilizado para armazenar informações relativas às actividades.
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Sistemas Baseados em Aprendizado (Aprendizado de Máquina)
DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira.
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Sistemas Especialistas
O paradigma Indutivo Álvaro Degas
Uma proposta para OLAP ontológica Adriana Ribeiro.
Gestão da Tecnologia da Informação
Como Melhorar a Tomada de Decisão
SISTEMAS DE APOIO À DECISÃO - SAD
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Data Warehouse Bruno Estevão Rosa Emerson Barbosa Gonçalves
Mineração de Dados: Introdução
Universidade Federal do Paraná
KDD E MINERAÇÃO DE DADOS
Gestão do Conhecimento e da Informação
Classificação de Textos
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
Disciplina: Inteligência Artificial
Aprendizado por Indução
Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
DECOM – ICEB – UFOP Prof. Álvaro Guarda Aprendizado de Máquina - 0 Aprendizado Indutivo de Conceitos Conceito Conjunto de objetos com características comuns.
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Objetivos do Capítulo Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel.
INTELIGÊNCIA EMPRESARIAL
Sistemas Baseados em Conhecimento
Transcrição da apresentação:

HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte à Decisão Aprendizado de Máquina Estatística

HAC 2 MD - junho/2008 Tecnologias de suporte para MD ● Aprendizado de Máquina – utilizado especialmente na extração de padrões. quando são aplicados os algoritmos ● Estatística – Apoia, especialmente, os métodos na etapa de preparação de dados.

HAC 3 MD - junho/2008 Tecnologias de suporte para MD ● Ferramentas de Visualização – Importante na etapa de pré-avaliação, possibilitando verificar o que foi extraído, e de que forma está organizado. ● Banco de Dados e Data Warehouse Algumas ferramentas são utilizadas para auxiliar a manipulação dos dados.

HAC 4 MD - junho/2008 Aprendizado de Máquina Aquisição de conhecimento: “Transferência e transformação do conhecimento especializado com potencial para a resolução de problemas de alguma fonte de conhecimento para um programa.”

HAC 5 MD - junho/2008 Aprendizado de Máquina ● Classificação de técnicas disponíveis: – Manuais - processo conduzido por engenheiros do conhecimento – Semi-automáticas – especialistas utilizam ferramentas que minimizam a participação do engenheiro do conhecimento – Automáticas – objetivam minimizar a participação humana, extraindo conhecimento de fontes de dados extensas

HAC 6 MD - junho/2008 Aprendizado de Máquina ● AM - subárea da IA relacionada à construção de sistemas capazes de adquirir conhecimento de forma automática (sem a interferência humana)

HAC 7 MD - junho/2008 Aprendizado de Máquina ● Paradigmas: – simbólico - analisam exemplos e contra-exemplos de um conceito e constroem representações simbólicas (expressão lógica, árvore de decisão, regras, redes semânticas) – estatístico - utilizam modelos estatísticos para encontrar uma boa aproximação do conceito induzido – baseado em exemplos (instance based) - classificam exemplos nunca vistos por meio de exemplos similares conhecidos. Os exemplos representativos são armazenados. (lazy learning) – conexionista - relacionado ao treinamento das redes neurais – evolutivo - baseado na teoria da evolução natural

HAC 8 MD - junho/2008 Aprendizado de Máquina ● Indução: forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de exemplos. ● Um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados. ● Hipóteses geradas podem ou não preservar a verdade.

HAC 9 MD - junho/2008 Hierarquia do aprendizado indutivo Aprendi zado indutivo Aprendizad o supervision ado Aprendizado não- supervisionado classific ação regressã o

HAC 10 MD - junho/2008 Sistemas de Aprendizado de Máquina

HAC 11 MD - junho/2008 MD X Aprendizado de Máquina Data Mining Muitos Exemplos Muitos Atributos Aprendizado de Máquina Poucos Exemplos Poucos Atributos

HAC 12 MD - junho/2008 Técnicas Estatísticas ● As técnicas estatísticas são fundamentais para o processo de MD ● Amostragem dos dados (seleção e preparação) ● Naive Bayes, AutoClass (extração de padrões) ● Médias, taxas de erros, desvios (avaliação)

HAC 13 MD - junho/2008 Técnicas Estatísticas ● Essas técnicas, juntamente com técnicas de IA, especialmente as que manipulam incerteza, provêm mecanismos para: – Evitar overfitting nos dados – Tratar ruídos dos dados – Manipular conjunto de dados incompletos – Incorporar conhecimento de fundo

HAC 14 MD - junho/2008 Ferramentas de visualização ● É uma ferramenta exploratória na análise dos dados ● Permite o aumento da capacidade de análise e de interpretação dos resultados obtidos ● Os principais tipos dessas ferramentas são: – linguagens de programação especializadas – ferramentas Graphic User Interface (GUI)

HAC 15 MD - junho/2008 Data Warehousing ● Definição – Data Warehousing é um processo, não um produto, para montar e gerenciar dados de várias fontes com o propósito de ganhar uma visão detalhada e singular de parte ou do todo de um negócio – O produto gerado de um projeto de Data Warehousing é o seu Data Warehouse (DW)

HAC 16 MD - junho/2008 ● O objetivo principal é ter uma visão mais ampla das informações relacionadas à empresa/organização. ● É responsável pelo agrupamento dos dados históricos da empresa

HAC 17 MD - junho/2008  Voltadas para análise multidimensional de dados de modo superior aos mecanismos oferecidos pelas ferramentas tradicionais É a análise, síntese e consolidação de grandes volumes de dados multidimensionais [Codd 93].  Ferramenta geralmente utilizada para a análise de Data Warehouse OLAP (On Line Analytical Processing)

HAC 18 MD - junho/2008 Consultas OLAP ● Auxiliam os usuários a sintetizar as informações através de visões comparativas e personalizadas, assim como analisar dados históricos. ● É uma tecnologia que possibilita aos usuários acesso: – rápido – consistente – interativo

HAC 19 MD - junho/2008 OLAP

HAC 20 MD - junho/2008 OLAP 107,00

HAC 21 MD - junho/2008 OLAP 39,4

HAC 22 MD - junho/2008 Diferença OLAP e MD Se Idade >= 35 e Duração >=20 então Risco = Baixo

HAC 23 MD - junho/2008 Extração de informação e apoio à Extração do Conhecimento OLAP Informações Ferramentas de DMConhecimento

HAC 24 MD - junho/2008 Extração de informação e apoio à Extração do Conhecimento Quando se tem perguntas específicas OLAP Quando não se sabe qual é a pergunta Ferramentas de MD

HAC 25 MD - junho/2008 Conhecimento para os Sistemas de Suporte à Tomada de Decisão SISTEMAS DE SUPORTE À DECISÃO MINERAÇÃO DE DADOS DATA WAREHOUSE BASES DE DADOS Dados para o Data Warehouse Dados do Data Warehouse para Mineração Resultados / Conhecimento

HAC 26 MD - junho/2008 OLAP if... then DM BD Dados Informação Conhecimento DW