Francisco Daniel de Oliveira Costa Ana Carolina Greef

Slides:



Advertisements
Apresentações semelhantes
SISTEMAS DE INFORMAÇÕES GERENCIAIS
Advertisements

Teoria e Prática Prof.Ms. Nilson Aguilar
Sistemas de Informação
Secretaria de Mudanças Climáticas e Qualidade Ambiental
Administração de Sistemas de Informação
Programas Eficiência Energética
INTELIGÊNGIA COMPUTACIONAL
(CARGOS, SALÁRIOS E BENEFÍCIOS)
Plano de Gestão Energética Prof.. Tomaz Nunes
Felipe Carvalho – UFES 2009/2
TÍTULO: CARACTERIZAÇÃO DE PERFIS DE CONSUMIDORES DE ENERGIA ELÉCTRICA DE MÉDIA TENSÃO USANDO TÉCNICAS DE DATA MINING ORIENTADORES: PROFESSOR ANTÓNIO MACHADO.
Darciele de Souza e Luiz Felipe Netto
1 MD - junho/2008 Identificação do problema Ao final dessa etapa espera-se ter: Definição da área Definição do problema Definição dos dados.
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
Modelagem de Processos com BPM
A PPLYING D ATA M INING T ECHNIQUES TO S EMI -A UTOMATICALLY D ISCOVER G UIDELINES FOR M ETAMODELS {andreza, franklin, patricia,
Método de Clusterização baseado em Densidade Algoritmo DBSCAN
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
Ricardo Alexandre Veiga Gimenes
ANÁLISE DE MODOS DE FALHAS E EFEITOS (AMFE)
Mineração de Dados ou Descoberta de conhecimento em BDs
Pré-processamento e Pós-processamento dos Dados
Modelo de Estimativa de Risco de Incidência de Tuberculose em Municípios Brasileiros Mineração de Dados Cleiton Lima Eric Ferreira.
Agrupamento de Dados: uma Revisão Data Clustering
DATA MINING Inteligência Artificial
Descoberta de Conhecimento em Base de Imagens Mamográficas
Jackson D. N. Mourão Pietrângelo V. Ferronato
IMPORTÂNCIA E MODELO DE ESTRUTURA
QUALIFICAÇÃO DE GESTORES DO SUS EM EAD: O FORTALECIMENTO DA BAIXADA FLUMINENSE DO ESTADO DO RIO DE JANEIRO ATRAVÉS DA EDUCAÇÃO PERMANENTE DOS TRABALHADORES.
Ações de Eficiência Energética no Projeto Esplanada Sustentável
Curso Técnico em Meio Ambiente
Data Mining como ferramenta de Gestão
Data Warehouse & Data Mining
Aprendizagem de Máquina - Agrupamento
testes de regressão e testes baseados em riscos
Dos dados ao Conhecimento: O Papel da Estatística no Marketing de Resultados UFRJ - 31/03/2005.
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Sistema Recomendador para Comércio Eletrônico
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
Sistemas de avaliação de qualidade de dados
INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.
Tecnologia da informação
Capacidades do Data Warehouse
Relacionamento de Bases de Dados na ANS
Data Mining: Conceitos e Técnicas
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
Eduardo Sampaio SMART GRID Piloto do IBAMETRO no âmbito do Governo do Estado da Bahia 29 de novembro de 2012.
TECNOLOGIA DA INFORMAÇÃO
Estrutura do Trabalho Elementos Pré-textuais: Capa, Contracapa, Resumo, Sumário I INTRODUÇÃO 1.1 PROBLEMA 1.2 HIPÓTESE 1.3 OBJETIVOS Objetivo Geral.
Gestão de defeitos.
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
Morgana PRÁ1; Lalucha MASSUCHETI 2.
FERRAMENTAS DE GERENCIAMENTO Aula 01
Motivação Projeto Esplanada Sustentável (PES), que tem por objetivo principal a promoção da sustentabilidade ambiental e socioeconômica na Administração.
Bases de dados estatísticas e numéricas
INE5644 – Data Mining Profa Vania Bogorny
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
24/4/2015IA - Prof. Paulemir Campos1 WEKA UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos.
Mineração de Dados: Introdução
Laboratório 5 Regras. Bases Utilize a base que se encontra no diretório de dados do weka: wheather.nominal.arff Gere regras usando diferentes classificadores.
O PROCESSO DE KDD Elaborado por: Jader Gustavo de Campos Santos Rhafael Freitas da Costa.
KDD E MINERAÇÃO DE DADOS
POLITICAS DE SEGURANÇA
SISTEMA SIM e CRM Aula 12.
sistemas de informação
PESQUISAS EXPLORATÓRIAS
DATA MINING: Conceitos e Principais Técnicas Seminário da disciplina IN940 - Banco de Dados Estudante: João Sedraz Professores: Ana Carolina | Fernando.
Curso: Pós Graduação - Docência do Ensino Superior Disciplina: Política e Sociedade na Perspectiva Interdisciplinar Professora: Luiza Olívia Lacerda Ramos.
EXERCICIO “Diagnóstico energético, eficiência energética, substituições inter-energéticas e correlação entre energia, desenvolvimento e meio ambiente”
Transcrição da apresentação:

Mineração de dados sobre pesquisa de hábitos de consumo de energia no sul do Brasil Francisco Daniel de Oliveira Costa Ana Carolina Greef Denise Fukumi Tsunoda, Profa. Dra. Universidade Federal do Paraná Programa de Pós-Graduação em Ciência, Gestão e Tecnologia da Informação Curitiba/PR franciscodaniel@gmail.com

SUMÁRIO Introdução; Algoritmo Apriori para mineração de dados; Processo de Descoberta de Conhecimento em Bases de Dados; Aplicação do KDD; Considerações finais; Referências.

INTRODUÇÃO Pesquisa experimental; Artigo sobre dados do Programa Nacional de Conservação de Energia Elétrica (Procel) - de 1985 - subordinado à Eletrobrás - controlada pelo Ministério de Minas e Energia, do Brasil; Promover a racionalização da produção e do consumo de energia elétrica; Base de dados nacional, relativa a questionário sobre posse de eletrodomésticos e hábitos de consumo de energia, em 2005; Dados selecionados da Região Sul – estudo “piloto”; Dados de 2010 ainda não publicados; Algoritmo Apriori – ausência de atributo meta, descoberta de regras embutidas nos dados cuja noção prévia seria inviável.

APRIORI Regra de associação  formato X→Y . Correspondência a um suporte (X U Y): ocorrências individuais e conjuntas de cada valor de cada atributo; Correspondência e a uma confiança (X →Y): número de registros que contemplam todos os componentes de uma regra, sobre os registros que contemplam o antecedente.

KNOWLEDGE DISCOVERY IN DATABASE (KDD) Processo de Descoberta de Conhecimento em Bases de Dados (KDD): seleção dos dados a serem minerados; limpeza dos mesmos para eliminação de ruídos, dados irrelevantes e duplicidades; integração com outras bases de dados, com objetivo de agregar abrangência e confiabilidade ao resultado esperado; transformação de valores, por exemplo, em categorias; mineração dos dados, para aplicação de algoritmos de associação, clusterização ou classificação; Interpretação. (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996).

KDD SOBRE DADOS DO PROCEL – REGIÃO SUL DO BRASIL (1/4) Estudo estruturado com a base de dados e o questionário utilizado para obtenção desses: 102 questões relativas a: perfil socioeconômico; posse de eletrodomésticos; valores e períodos de consumo; atitudes para economia de energia e relacionamento do cliente com a respectiva concessionária; questões discursivas, objetivas, de atribuição de nota, de ordenação de prioridades e tabelas; ausência de padronização no instrumento de coleta, realizada manualmente.

KDD SOBRE DADOS DO PROCEL – REGIÃO SUL DO BRASIL (2/4) SELEÇÃO Programa Nacional de Conservação de Energia Elétrica (Procel). LIMPEZA Por exemplo “código da residência”, “ação para redução de consumo: geladeira, ar condicionado, freezer, chuveiro, lava roupas, stand by, microondas, lâmpadas, outro.”; Limpeza devido à não pertinência ou à desestruturação dos dados. PRÉ-PROCESSAMENTO / TRANSFORMAÇÃO Por exemplo “Tempo de moradia em anos” e “Tempo de moradia em meses” – convertidas em meses; Manutenção de valores “99” – “Não sabe ou Não respondeu”, e “888” – “Vazio”; MINERAÇÃO WEKA 3.6.4; Suporte mínimo 0,8 (80%); Confiança mínima 1 (100%); 1754 regras: 19 dos 72 atributos da base.

KDD SOBRE DADOS DO PROCEL – REGIÃO SUL DO BRASIL (3/4) RESULTADOS 952 ocorrências: “Se não houve Desligamento / Queima de disjuntor, e não houve Choque elétrico em eletrodomésticos nos últimos 3 meses, na residência, então não houve Aquecimento de parede no mesmo período” (Resultado do software: 1. tresDoisB=2 tresDoisD=2 952 ==> tresDoisE=2 952 conf:(1)). Das 1754 regras, 1626 tiveram “Não ocorrência de Aquecimento de parede nos últimos 3 meses” como consequente; 837 ocorrências na base: “Se os vidros da residência não são coloridos ou têm película, Não houve desligamento / Queima de disjuntor, queda de tensão, tampouco aquecimento da parede nos últimos 3 meses, então Não houve Choque elétrico em eletrodomésticos nos últimos 3 meses, na residência” (Resultado do software: 1282. doisQuatroI=2 doisOito=1 tresDoisB=2 tresDoisC=2 tresDoisE=2 cinco=1 809 ==> tresDoisD=2 809 conf:(1)).

KDD SOBRE DADOS DO PROCEL – REGIÃO SUL DO BRASIL (4/4) Interpretação: Somente perfis de consumidores, e não de consumo de energia; Atributos relevantes para ações de distribuição de energia, conscientização sobre consumo sustentável e adequação de serviços foram ignorados pela ferramenta; Devido ao processo de pesquisa? Devido ao instrumento de pesquisa desestruturado e à forma manual de coleta e tabulação? Devido à baixa representatividade dos dados existentes? Defasagem dos resultados devido ao período em que a pesquisa foi realizada e em que os dados foram distribuídos.

CONSIDERAÇÕES FINAIS Processo decisório estruturado = organização de dados que o fundamentam; O formato de condução da pesquisa dificulta a melhoria contínua do processo decisório no que tange ao Procel (Zhang; Zhou, 2004); falhas incorrem em tratamento e interpretação custosos e incertos; o não uso de tecnologias para constituição da base de dados em si, compromete sua credibilidade. Sugestão de aplicação das etapas do KDD aos dados das demais regiões do Brasil, na mesma base, e a atualização das regras com dados de 2010 – quando disponíveis.

REFERÊNCIAS FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. American Association for Artificial Intelligence, 1996. Disponível em: <http://www.kdnuggets.com/gpspubs/aimag-kdd-overview-1996-Fayyad.pdf>. Acesso em: 29 mai. 2011. PROGRAMA NACIONAL DE CONSERVAÇÃO DE ENERGIA ELÉTRICA – Procel. Disponível em: <http://www.eletrobras.com/elb/procel/>. Acesso em: 29 mai. 2011. ZHANG, D.; ZHOU, L.. Discovering golden nuggets: data mining in financial application, IEEE transactions on systems, man, and cybernetics—part c: applications and reviews, v. 34, n. 4, nov. 2004. Disponível em: <http://suraj.lums.edu.pk/~cs631s05/Papers/financial.pdf>. Acesso em: 31 mai. 2011.