Tópicos Especiais Mineração de Dados

Slides:



Advertisements
Apresentações semelhantes
Sistemas de Informação
Advertisements

Conceitos e Tipos de Pesquisa
Administração de Sistemas de Informação
SIN - Sistemas de Informação
Sistema de Informações
INTELIGÊNGIA COMPUTACIONAL
Data Warehouse / Data Marts / DataMining /OLAP
Felipe Carvalho – UFES 2009/2
Modelos de Preferências em Inteligência Artificial CP-Nets
Bacharelado em Ciência da Computação
Modelos de Preferências AULA 15 DATA MINING Sandra de Amo.
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
Mineração dePreferências Contextuais A. Soulet et al AULA 19 Data Mining Profa. Sandra de Amo.
Preparação Básica Pyle, D. Data preparation for Data Mining Capítulo 4.
Mineração de Dados ou Descoberta de conhecimento em BDs
Mineração de Dados Introdução.
Gestão das Informações Ambientais
Agrupamento de padrões Métodos hierárquicos
DATA MINING Inteligência Artificial
Paulo J Azevedo Departamento de Informática
Blogues (Blogs) Ed. Física e Desporto ISCE Jun 2008 © Rui Lourenço.
Categorias do E-Business
Prof. Ilaim Costa Jr. Novas Tecnologias Prof. Ilaim Costa Jr.
Data Warehouse & Data Mining
Link Mining Víctor Medeiros.
Sistemas de Recomendação
Dos dados ao Conhecimento: O Papel da Estatística no Marketing de Resultados UFRJ - 31/03/2005.
Estrutura de Sistemas de Informação
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Sistema Recomendador para Comércio Eletrônico
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
Taxonomia Profa. Lillian Alvares,
Gerenciamento de Dados
INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.
Tecnologia da informação e estado
Tecnologia da Informação
Capacidades do Data Warehouse
Aprendizado de Máquina - Introdução
Recuperação de Informação
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
Universidade Federal de Minas Gerais Escola de Ciência da Informação Biblioteconomia – Noturno Teoria e Gestão da Informação Usuários da Informação Grupo.
Matricula: U4R8V9. Perfil da Geração Y Integrados Globais e conectados Conscientes e críticos Comportamento é diretamente influenciado pelo grande volume,
Filtragem Colaborativa
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Introdução a Banco de Dados
Equipe: Artur Lira Diego Lemos Igor Pontes Lucas Figueiredo Rosana Matos Thiago Rocha.
Avaliação de Desempenho UFABC Pós-graduação em Engenharia da Informação Professor: Carlos Alberto Kamienski ( ) Santo André, Fevereiro.
LIG - Université Grenoble Mineração de Preferências Contextuais sobre dados de preferência “pairwise” Data Mining AULA 19 – Parte I Sandra de Amo.
INE5644 – Data Mining Profa Vania Bogorny
Gestão da Tecnologia da Informação
Prof. Ana Martins – UCB Unidade 02 Aula 03
Mineração de Dados: Introdução
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Introdução à Inteligência Artificial Fundamentos Prof. Horácio.
BANCO DE DADOS PARA SISTEMAS DE INFORMAÇÕES CONTÁBEIS
O PROCESSO DE KDD Elaborado por: Jader Gustavo de Campos Santos Rhafael Freitas da Costa.
Gestão do Conhecimento e da Informação
Mineração de Dados Profa. Sandra de Amo
AULA 4 Marketing.
Especificações Técnicas
Prof. Sidney Galeote. 2 www. prasabermais. com  Visão Geral sobre a dimensão de qualidade “performance”  Custo da qualidade  Como a performance deve.
Administração de Sistemas de Informação 7º Sem
DATA MINING: Conceitos e Principais Técnicas Seminário da disciplina IN940 - Banco de Dados Estudante: João Sedraz Professores: Ana Carolina | Fernando.
TRABALHO ACADÊMICO PROJETO DE PESQUISA
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Curso de verão Data Mining Web Mining. O que é Web Mining?  Web Mining é o uso de técnicas de data mining para descobrir e extrair automaticamente informações.
Laboratório de Mídias Sociais
1 PESQUISA EM MARKETING Prof. Ms. Vlademir Fernandes.
Transcrição da apresentação:

Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade de Computação Universidade Federal de Uberlândia

Mestrado em Ciencia da Computacao 2008 Contexto e Motivação Mineração de dados: Por que ? O que é ? O processo de descoberta de conhecimento Tarefas de mineração: preditivas, descritivas 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mineração de Dados: Por que ? Ponto de Vista Comercial Quantidades gigantescas de dados são coletados e armazenados em empresas, corporações, etc Dados de comércio eletrônico, Dados de navegação na internet Dados de compras de clientes em grandes lojas de departamentos, supermercados, Dados de transações bancárias, ou de cartão de crédito Computadores mais baratos e mais potentes Pressão da Competição 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mineração de Dados: Por que ? Ponto de Vista Cientifico : Medicina, Biologia, Engenharia Dados coletados e armazenados a velocidades enormes (GB/hora) Sensores remotos em satélites Telescópios Microarrays gerando dados de expressões de genes Simulações científicas gerando terabytes de dados. Técnicas tradicionais não apropriadas para analisar tais dados: ruídos e grande dimensionalidade 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mineração de Dados - Por que ? Frequentemente existe informação “escondida” nos dados que não é evidente de ser encontrada utilizando linguagens de consultas tradicionais. Analistas humanos podem levar semanas para correlacionar e descobrir alguma informação útil dentro de uma grande massa de dados. Boa parte dos dados nunca é analisado: “cemitério” de dados. 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mineração de Dados: Por que ? Técnicas de Mineração podem ajudar analistas: Entender e prever as necessidades dos clientes Descobrir fraudes Descobrir perfis de comportamento de clientes Técnicas de Mineração podem ajudar cientistas: Classificar e segmentar dados Formular hipóteses 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mineração de Dados: O que é ? Não Fazer uma consulta no Google sobre “Data Mining ” Procurar um nome numa lista telefônica Fazer uma consulta SQL a um banco de dados. Sim Agrupar documentos similares retornados pelo Google de acordo com seu contexto. Descobrir se certos nomes aparecem com mais frequência em determinadas regiões da cidade (periferia, centro, bairros abastados,…) 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mestrado em Ciencia da Computacao 2008 Exemplos Qual o perfil do cliente que consome mais ? Que produtos são comprados conjuntamente ? E em sequência ? Meu site web tem uma boa estrutura ? Como as chuvas, variação de temperatura, aplicação de pesticidas afetam as colheitas ? Existe uma relação entre o aquecimento global e a frequência e intensidade das perturbações no ecossistema tais como secas, furacões, enchentes ? 25/03/2017 Mestrado em Ciencia da Computacao 2008

Etapas do Processo de KDD Limpeza dos Dados Integração dos Dados Seleção Transformação Mineração Avaliação ou Pós-Processamento Visualização dos Resultados 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mestrado em Ciencia da Computacao 2008 Conhecimento Análise do Resultado Mineração: Etapa central do processo de Descoberta de Conhecimento Mineração Dados Relevantes Data Warehouse Seleção Limpeza Integração dos Dados Banco de Dados 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mestrado em Ciencia da Computacao 2008 Tarefas de Mineração Tarefa ato de descobrir um certo tipo de padrão Regras de Associação Análise de Sequências Classificação Agrupamento Outliers 25/03/2017 Mestrado em Ciencia da Computacao 2008

Tarefas de Mineração de Dados Tarefas Preditivas predizer o valor de um determinado atributo baseado nos valores de outros atributos Classificação – Predição Tarefas Descritivas Derivar « padrões » : correlações, tendências, anomalias, agrupamentos dentro de uma grande massa de dados. Regras de Associação – Padrões Sequenciais – Agrupamentos - Anomalias 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mestrado em Ciencia da Computacao 2008 O que é Mineração ? Mineração de Dados Descoberta de Conhecimento (KDD) KDD = Knowledge Discovery in Databases 25/03/2017 Mestrado em Ciencia da Computacao 2008

Mestrado em Ciencia da Computacao 2008 Sistemas de Mineração Intelligent Miner (IBM) DBMiner Enterprise Miner Clementine MineSet Genamics Expressions 25/03/2017 Mestrado em Ciencia da Computacao 2008

Um tópico atual Mineração de Preferências

Consulta Quais os pacotes turísticos de menos de 15 dias que você pode me propor em 2011 ? Resposta

Minhas Preferências ... Prefiro estadias mais curtas (menos de duas semanas) do que estadias longas (de duas semanas ou mais). Prefiro viajar durante as férias de verão. Para estadias curtas prefiro aquelas nas grandes cidades, pois gosto de ir a museus, bons restaurantes e shows. Para minhas viagens durante as férias de verão, prefiro viajar para a praia, caso eu viaje com a família. Caso eu viajo sozinho, je prefiro ir para uma cidade histórica.

Problemas a resolver Como modelar as preferências do usuário ? Usar regras ? Usar scores ? 2. Como obter as preferências do usuário ? 3. Como utilizar as preferências do usuário para “personalizar” as respostas ?

1) Como modelizar preferências Conjunto de regras Regras SE a viagem é durante minhas férias de verão e eu vou viajar com minha família ENTÃO eu prefiro ir para uma praia do que para uma cidade histórica. SE a viagem é durante minhas férias de verão e eu vou viajar sozinho ENTÃO eu prefiro ir para uma cidade histórica do que para uma praia.

2) Como obter as preferências do usuário ? Perguntar ao usuário ? Mostrar algumas respostas e pedir um feedback do usuário se gostou ou não ? Utilizar métodos automáticos ? Mineração de Preferências

3) Como colher as amostras de preferências do usuário Sistema de Amostragem de NOTAS (scores) Sistema de Amostragem de Pares Sistema de Amostragem de Listas (muito usado em Information Retrieval) 25/03/2017 Mestrado em Ciencia da Computacao 2008

Exemplo Internet Movie Database Dados Coletados

Pequena amostragem de filmes classificados por um usuário ID Genero Diretor Ano Ator Rating 1 comedy Woody Allen 80 Charlotte Rampling 8 2 Mia Farrow 7 3 romance Joel Coen Charlote Rampling 4 drama 70 5 6

ID Genero Directo Ano Ator Nota 1 comedy Woody Allen 80 Charlotte Rampling 7 2 Mia Farrow 6 3 romance Joel Coen Charlote Rampling  ? 4 drama 70 5

Comparando dois filmes pela nota dada ... Genre Director ANO Actor ID Director' Pref 1 comedy W Allen 80 C.Rampling 2 W. Allen Mia Farrow W.Allen 4 drama 70 6 romanc Joel Coen 7 C. Rampling J.Coen

ID GEN Diretor ANO Ator ID' GE' Diretor' Ator' Pref 1 comedy Woody Allen 80 Charlotte Rampling 3 romance Joel Coen Charlote Rampling ? 5 Mia Farrow 2 4 drama 70 6

Temas de Pesquisa Como “descobrir” as preferências de um usuário a partir de uma amostra de preferências capturada na internet ? Como “descobrir” as preferências comuns a um perfil de usuários ?

Mineração de Preferências

Pesquisa em desenvolvimento 2 métodos desenvolvidos dentro do grupo de Banco de Dados Método 1: CprefMiner (tese de Mestrado) Método 2: ProfMiner (em colaboração com pesquisadores da Université de Tours (França)