INE5644 – Data Mining Profa Vania Bogorny Vania.bogorny@ufsc.br.

Slides:



Advertisements
Apresentações semelhantes
Luis Otavio Alvares – II/UFRGS
Advertisements

Novos desafios em estudos de mercado: Knowledge Discovery e Data Mining 7º Congresso da APODEMO Novembro de 2000.
Dos dados ao Conhecimento: O Papel da Estatística no Marketing de Resultados UFRJ - 31/03/2005.
INE5644 – Data Mining Profa Vania Bogorny
Mineração de Dados: Introdução
Programa de Pós-Graduação em Demografia do Cedeplar-UFMG, Belo Horizonte, 08 a 12 de Agosto de 2011 Martin Handford, Where´s Wally? Oficina-Curso: Abordagens.
O papel do professor e do aluno no ensino a distância Profs. Cristiane Borges, Denys Sales e Iraci Schmidlin.
TeSP – Automação, Robótica e Manutenção Industrial TeSP – Fabricação Automática TeSP – Tecnologia Automóvel Fundamentos de Matemática ECTS: 5 Horas de.
APRESENTAÇÃO: EMPRESA DE CONSULTORIA DE ENGENHARIA FOCADA EM EFICIÊNCIA ENERGÉTICA. OBJETIVO PRINCIPAL É REDUZIR OS VALORES DAS CONTAS DE ÁGUA E ENERGIA.
Gestão Financeira e Tributária Prof. João Carlos Moreira.
ENG1290 – Instalações Elétricas Prediais Prof. Felipe de Sousa Nobre.
CONTEÚDO P2 ANÁLISE DE MERCADO AULA 10 PROFª BRUNA ROSSETTI CANDIDO.
Arquitetura de Sistemas de Software. ... continuação  Como vimos anteriormente, SOAP transporta e o WSDL descreve.  E o que faz a UDDI ?
Gestão Operacional: Gestão da tesouraria, de contas a receber e de estoques  Formandos :  Andreia Reis  Bruno Silva  Claudina  Elisandra Formador:
(Times New Roman ou Arial, negrito, fonte 14, espaçamento simples)
LEARNING ANALYTICS CRUZEIRO DO SUL Dr. Alberto Messias da Costa Souza
Tutorial do Meu EBSCOhost
Procedimentos para Medição e Verificação de Desempenho
Introdução a Engenharia de Alimentos
O Observatório da Despesa Pública é uma unidade de produção de informações estratégicas e monitoramento dos gastos públicos Identificar riscos de fraude,
Descoberta de Conhecimento em Bancos de Dados
Leitura e Documentação
Coordenação: Marcelo Correa
Organização e arquitetura de computadores
Tecnologias e Sistemas de Informação
Linguagem Natural, Linguagem Artificial e Linguagem Documentária
DESENVOLVIMENTO COMERCIAL DE SISTEMAS
Ciência de Dados aplicada à Saúde
Sobre a IOP Publishing IOP Publishing é um dos líderes mundiais em publicações científicas e disseminação eletrônica de informação. Abrange todas as áreas.
Introdução O presente trabalho tem o objetivo de apresentar informações sobre o tema “Gênero textual”. Nele serão encontradas definições e exemplos de.
1ª AULA Tópicos Introdutórios da Contabilidade e Patrimônio
Disciplina de Banco de Dados II
ESTATÍSTICA AULA 01 CONCEITOS E PLANEJAMENTO DE PESQUISA – Unidade 1
APLICAÇÃO DO ALGORITMO K-MEANS EM BASES DE DADOS DE MICROARRANJOS
ADMINISTRAÇÃO DE ESTOQUES E LOGÍSTICA
1.
Vendendo um produto ou serviço
Data Warehousing & Business Intelligence
Organização de um Relatório
VISUALIZAÇÃO DA INFORMAÇÃO E SUA APLICAÇÃO NA RECUPERAÇÃO DE INFORMAÇÃO. Jessica Monique de Lira Vieira Renato Fernandes Corrêa.
Agente para Minas Gerais
DESCOBERTA DE CONHECIMENTO ATRAVÉS DE MÉTODOS DE APRENDIZAGEM DE MÁQUINA SUPERVISIONADOS APLICADOS AO AMBIENTE VIRTUAL DE APRENDIZAGEM SIGAA/UFPI Aline.
Modelagem de Objetos de Domínio com Diagrama de Classes
DEPRECIAÇÃO CQP - Analice Ceccagna.
Guia de renovações. Guia de renovações RENOVAÇÕES Os usuários do Sistema de Bibliotecas FMU/FIAM-FAAM possuem uma conta pessoal que lhes permite atualizar.
Tópicos Especiais Mineração de Dados
Universidade Federal do Paraná
Agrotóxicos Tecnologia de controle ambiental para evitar contaminação do solo.
Linguagem de Programação
Trabalho de Conclusão de Curso I
INF 1771 – Inteligência Artificial
Prof. Elisson de Andrade
PSICOFISIOLOGIA Aula 4- Aprendizagem e memória.
INF 1771 – Inteligência Artificial
Prof. Paulo Cesar Spigolon (Paulinho)
Universidade Federal Fluminense Curso de Engenharia de Produção Arranjo Físico Industrial Prof. Artur Pessoa.
Prof. Paulo Cesar Spigolon (Paulinho)
Prof. Paulo Cesar Spigolon (Paulinho)
Prof. Paulo Cesar Spigolon (Paulinho)
Curso Superior de Administração Disciplina Informática Aplicada II
Prof. Paulo Cesar Spigolon (Paulinho)
Linguagem Natural, Linguagem Artificial e Linguagem Documentária
Computação Bioinspirada
Apresentação da Disciplina Disciplina: Linguagens de Programação Prof. Antonio Oseas.
Resultado e Discussões Considerações Finais Referências
Linguagem Natural, Linguagem Artificial e Linguagem Documentária
SISTEMAS DISTRIBUIDOS
Mineração de Textos Rodrigo Lins Rodrigues
(Área Temática do Trabalho)
Prof. Me. Diego Fernandes Emiliano Silva
Transcrição da apresentação:

INE5644 – Data Mining Profa Vania Bogorny Vania.bogorny@ufsc.br

Objetivo : Objetivos Específicos: Apresentar e aplicar as principais técnicas de mineração de dados e o processo de descoberta de conhecimento com vistas à identificação de padrões importantes e não óbvios em grandes bancos de dados. Objetivos Específicos: Assimilar os principais conceitos acerca de Mineração de Dados (MD); Compreender os passos do processo de descoberta de conhecimento em bases de dados (KDD); Realizar a análise exploratória dos dados; Compreender as principais tarefas da mineração de dados e relacionar as respectivas técnicas; Conhecer e saber aplicar as principais técnicas de mineração de dados; Utilizar ferramenta para uso de algoritmos de mineração de dados.

Programa da disciplina 1. Introdução e Conceitos 2. Processo de Descoberta de Conhecimento 3. Análise Exploratória de Dados 4. Classificação 5. Agrupamento 6. Associação 7. Tópicos Avançados 8. Projeto

Avaliação VER no site

Conteúdo das aulas Horário: Terças e quintas às 18:30hs Site da disciplina: www.inf.ufsc.br/~vania/teaching/INE5644

Introdução Grande quantidade de informação armazenada em muitas áreas: comércio, indústria, governo, ciência, etc. Exemplos: cada compra em um supermercado fica registrada em uma tabela de transações(com o código de barra) todas as chamadas telefônicas (origem, destino, horário, duração, ...) o SUS mantém registro magnético de todos os atendimentos realizados (hospital, data, médico, diagnóstico, procedimentos realizados, ...) Imagens de satélite, bioinformática, ...

BDs atuais BDs atuais são feitos para armazenar e recuperar rápida e eficientemente dados operacionais BDs atuais são úteis para recuperar dados específicos, mas não são capazes de extrair conhecimento genérico Exemplo: um sistema bancário recupera rapidamente as últimas movimentações ou o saldo de uma conta, mas teria dificuldade em descrever o perfil do cliente em relação a outros clientes ou determinar se ele seria um bom pagador em caso de fazer um empréstimo

BD x DM Banco de Dados Data Mining Encontre todos os clientes com sobrenome “Silva”. Identifique os clientes que compraram mais de R$1.000,00 no último mês. Encontre todos os clientes que compraram leite. Encontre todos os clientes com baixo risco, em caso de realizarem um empréstimo. Identifique clientes com hábitos de compras similares. Encontre todos os itens que são normalmente comprados junto com leite.

Descoberta de conhecimento em bases de dados Objetivo: extrair conhecimento novo, útil e interessante, implícito em grandes volumes de dados, e representá-lo de forma acessível para o usuário.

Porque extrair conhecimento? Exemplo de uso de conhecimento Michael Dell: venda de assinaturas de jornais

Relações da DCBD com outras áreas O processo de DCBD utiliza conhecimento de várias áreas: BD IA: aprendizagem de máquina, redes neurais, representação de conhecimento, ... Estatística ...

DCBD: Exemplo Em uma empresa de fornecimento de água encanada uma das maiores despesas é com energia elétrica Objetivo da empresa: reduzir o consumo de energia elétrica

DCBD: Exemplo Dados: consumo diário de água aspectos do tempo (temperatura, umidade do ar, …) dia da semana e do mês, feriado, férias, ... Objetivo da DCBD: prever o consumo de água, de forma a minimizar o bombeamento, e por conseguinte, o consumo de energia elétrica

Bibliografia Artigos de congressos e revistas científicas TAN,P-N;STEIMBACH, M; KUMAR,V. Introduction to Data Mining. Boston: Addison Wesley, 2006. 769p. HAN,J.; KAMBER, M. Data mining: concepts and techniques. Morgan Kaufmann, 2006 – 2. edição. ADRIAANS, Pieter, ZANTINGE, Dolf. Data Mining. Harlow : Addison-Wesley, 1997. 158p. FAYYAD, Usama M. et al. Advances in Knowledge Discovery and Data Mining. American Association for Artificial Intelligence, 1996. 611p. BERRY, Michael J. A.; LINOFF, Gordon. Data Mining techniques for marketing, sales and custumer support. New York: John Wiley, 1997. 454p. PYLE, Dorian. Data preparation for data mining. San Diego: Academic Press, 1999. 540p. Artigos de congressos e revistas científicas