Jackson D. N. Mourão Pietrângelo V. Ferronato

Slides:



Advertisements
Apresentações semelhantes
Exemplos de Problemáticas
Advertisements

João Luiz Fernandes e Aura Conci Universidade Federal Fluminense
Aprendizado de Máquina
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
INTELIGÊNGIA COMPUTACIONAL
Aula 8 Contratos.
Lógica Fuzzy Aplicada a Sistemas de Diagnóstico
Felipe Carvalho – UFES 2009/2
Programação Aplicada Luiz Silveira Universidade Federal Rural do Semi-Árido Departamento de Ciências Ambientais Aula 02: Conceitos e tipos de linguagens.
Uma das tarefas descritivas da
1 Mineração de Dados - Trabalho Final junho/julho de 2008 Selecionar um arquivo de dados entre os sugeridos no repósitório UCI (
Metodologia Científica e Tecnológica
11. Gerenciamento de riscos do projeto
Aprendizado de Máquina
PREDIÇÃO DATA MINING AULA 13 SANDRA DE AMO
Universidade Federal do Paraná
Relações Adriano Joaquim de O Cruz ©2002 NCE/UFRJ
Produzido pela equipe do CAEF. Porto Alegre, 2001.
Implementação de AG no Balanceamento Interativo de Linhas de Montagem
Arquivos Seqüenciais Inhaúma Neves Ferraz
Mineração de Dados ou Descoberta de conhecimento em BDs
Reconhecimento de Padrões Seleção de Características
Branch-and-Bound Marcone Jamilson Freitas Souza
Reconhecimento de Padrões Dissimilaridade
Modelo de Estimativa de Risco de Incidência de Tuberculose em Municípios Brasileiros Mineração de Dados Cleiton Lima Eric Ferreira.
FACENS – Engenharia da Computação Inteligência Artificial
Métodos Quantitativos
A FAST APRIORI implementation
Sistemas Lineares.
AVALIAÇÃO DE PROGRAMAS MARCO LEGAL MARCO LEGAL - LEI Nº O marco legal de avaliação do PPA 2004/2007 é constituído pelo Art. 12 da Lei nº ,
Autores Lívia Maria de Pádua Ribeiro (UNI-BH)
KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.
CALENDÁRIO DE ATIVIDADES DO ESTADO DO CEARÁ-2006.
Resolução Proposicional
Descoberta de Conhecimento em Base de Imagens Mamográficas
Grupo 5: Fernando Lourenço Pinho Costa Rafael de Souza Santos
Grupo 5: Fernando Lourenço Pinho Costa Rafael de Souza Santos
Configuração de manutenção
II. M o d e l o s d e C o n h e c i m e n t o
QFD: MATRIZ 1.
Data Mining como ferramenta de Gestão
Tópicos em Gestão de Serviços – Regressão Linear
Data Warehouse & Data Mining
UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA INFORMAÇÃO CURSO DE BIBLIOTECONOMIA FLORIANÓPOLIS, 2005.
Microeconomia A III Prof
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
PMBOK 5ª Edição Capítulo 11
Carlos Eduardo Santin Grupo de Bancos de Dados Inteligentes - UFRGS
Sistema Recomendador para Comércio Eletrônico
Integrantes Gisely C. Oliveira Marcelo C. Ribeiro Maria Ap. Ferreira Rafael Vaz Walisson Junior Wesley C. Gomes.
Programação I Aula 2 (Métodos)
Prof. Msc. Mauro Enrique Carozzo Todaro
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
Probabilidades e Combinatória Distribuição de Probabilidades
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Como estimar incertezas de uma medida indireta
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo de Probabilidades. Regra de Laplace. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo Combinatório. Problemas de Contagem. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
APLICAÇÃO DA TECNOLOGIA COMPUTACIONAL NO PROCESSO DE ENSINO E APRENDIZAGEM DA MATEMÁTICA ESCOLAR: análise de sua contribuição Aluna: Daiely Aparecida de.
Pesquisa Mensal de Emprego
Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do.
1 UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO DE CIÊNCIAS JURÍDICAS E ECONÔMICAS DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS DETERMINAÇÃO DA ESTRUTURA DE ATIVO.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Mineração de Dados: Introdução
Medidas de Interesse Mineração de Dados Aluno: Thiago José Marques Moura.
A maior parte dos programas de computador gera uma saída resultante de um processamento que é executado sobre dados que ele recebe como entrada. Em geral.
Universidade Federal do Paraná
Busca em Espaço de Estados
Mineração de Dados Felipe Carvalho – UFES 2009/2.
Transcrição da apresentação:

Jackson D. N. Mourão Pietrângelo V. Ferronato Generalização de Regras de Associação Utilizando Taxonomias Após Pós-Processamento Prévio. Jackson D. N. Mourão Pietrângelo V. Ferronato

Processo de Extração de Padrões em Bases de Dados Para que serve? Quem utiliza? Qual o problema?

Trabalhos Relacionados Descrição de um Algoritmo para Generalização de Regras de Associação (DOMINGUES, 2004) Objetivo: filtrar conjunto de regras; Método Adotado: taxonomias; Resultados: redução entre 14,61% e 50,11%; Influência da Imputação de Valores Ausentes nos Classificadores Descobertos (CALIL, 2008) Objetivo: imputação de valores ausentes; Método Adotado: árvores de decisão; Resultados: redução na quantidade de regras e na taxa de erro do classificador;

Trabalhos Relacionados Um Método de Pós-processamento de Regras de Associação com Base nas Relações de Dependência entre os Atributos (BÜRKLE, 2006) Objetivo: eliminar regras redundantes; Método Adotado: relações de dependência entre atributos; Resultados: bons percentuais de redução nas quatro bases de dados testadas; Análise do Conhecimento Extraído de Classificadores Simbólicos Utilizando Medidas de Avaliação e de Interessabilidade (GOMES, 2002) Objetivo: medir os padrões descobertos; Método Adotado: medidas qualitativas e quantitativas; Resultados: algumas regras potencialmente mais interessantes.

Trabalhos Relacionados Identificação de Regras de Associação Interessantes por meio de Análises com Medidas Objetivas e Subjetivas (SINOARA, 2006) Objetivo: identificar regras potencialmente mais interessantes; Método Adotado: medidas objetivas e subjetivas; Resultados: demonstrou-se que a combinação proposta auxilia na avaliação das regras;

Conceitos Regras de Associação “Um cliente que compra os produtos (X1,X2, ..., Xn) também irá comprar os produtos (Y1, Y2, ..., Ym) com probabilidade c%” Padrão Apriori Y  X Z (50.5%, 80.2%)

Avaliação e Poda de Regras Conceitos Avaliação e Poda de Regras Objetivos Avaliar regras geradas; Reduzir o tamanho do conjunto de regras; Método Medidas objetivas e subjetivas; Medidas quantitativas e qualitativas; Identificar regras redundantes ou potencialmente não interessantes;

Convicção Domínio: de zero a infinito; Conceitos Convicção Domínio: de zero a infinito; Caso for 1: existe a independência completa entre A e B; Caso for infinito: A nunca aparece sem B (confiança de 100%);

Generalização de Regras Conceitos Generalização de Regras Aplica-se conhecimento de domínio para gerar regras mais representativas e informativas. “5% dos clientes que compram pão-pullman-light, também compram leite-parmalat-desnatado” “30% dos clientes que comprar pão, também compram leite”

Técnica da Taxonomia Conceitos Roupas_leves Camiseta Bermuda Roupas_pesadas Japona Sobretudo Camiseta  bone Bermuda  bone Roupas_leves  bone

Método Proposto Avaliar e eliminar regras através da medida objetiva Convicção; Generalizar as regras: Agrupar por Conseqüente; Generalizar em Linha; Agrupar por Antecedente/Taxonomia; Generalizar em Coluna; Desfazer Generalizações Não Repetidas; Concatenar Taxonomias aos Dados Calcular Suporte e Confiança para as Regras Generalizadas; “Desgeneralizar” Regras de Baixa Confiança; Gerar Arquivo de Saída;

Agrupar por Conseqüente Método Proposto Agrupar por Conseqüente Árvore de Agrupamento Bone ? 2 Bermuda camiseta  bone Sandalia camiseta  bone Chinelo bermuda  bone Chinelo brinco  bone Cachecol 1 Sobretudo  cachecol Japona  cachecol Japona camiseta  cachecol Início da Estrutura Conseqüentes Taxonomias Qtd. de Itens no Antecedente Regras

Generalizar em Linha Método Proposto Regras Bermuda camiseta  bone Chinelo bermuda  bone Chinelo brinco  bone Sandalia camiseta  bone Japona  cachecol Sobretudo  cachecol Japona camiseta  cachecol Regras Generalizadas em Linha Roupas_leves  bone Chinelo bermuda  bone Chinelo brinco  bone Sandalia camiseta  bone Japona  cachecol Sobretudo  cachecol Japona camiseta  cachecol

Agrupar por Antecedente Método Proposto Agrupar por Antecedente Árvore de Agrupamento Bone ? 1 Roupas_leves  bone 2 Sandalia camiseta  bone Chinelo bermuda  bone Chinelo brinco  bone Início da Estrutura Conseqüentes Taxonomias Qtd. de Itens no Antecedente Regras

Agrupar por Antecedente Método Proposto Agrupar por Antecedente Árvore de Agrupamento Bone ? Roupas_leves 1 Roupas_leves  bone Calcados_abertos 2 Sandalia camiseta  bone Chinelo bermuda  bone Chinelo brinco  bone Início da Estrutura Conseqüentes Taxonomias Qtd. de Itens no Antecedente Regras

Generalizar em Coluna Método Proposto Árvore de Agrupamento Bone ? Roupas_leves 1 Roupas_leves  bone Calcados_abertos 2 Calcados_abertos camiseta  bone Calcados_abertos bermuda  bone Calcados_abertos brinco  bone Início da Estrutura Conseqüentes Taxonomias Qtd. de Itens no Antecedente Regras

Generalizar em Coluna Método Proposto Árvore de Agrupamento Bone ? Calcados_abertos brinco  bone Roupas_leves 1 Roupas_leves  bone 2 Calcados_abertos roupas_leves  bone Calcados_abertos Início da Estrutura Conseqüentes Taxonomias Qtd. de Itens no Antecedente Regras

Desfazer Generalizações não Repetidas Método Proposto Desfazer Generalizações não Repetidas Regras Calcados_abertos brinco  bone Calcados_abertos Roupas_leves  bone Roupas_leves  bone Regras Chinelo brinco  bone Calcados_abertos Roupas_leves  bone Roupas_leves  bone

Concatenar Taxonomias aos Dados Método Proposto Concatenar Taxonomias aos Dados Dados Original Bermuda bone chinelo Chinelo brinco bone Dados com Taxonomias Roupas_leves acessorios calcados_abertos Calcados_abertos ? Acessorios

Calcular Suporte e Confiança Método Proposto Calcular Suporte e Confiança Varre a base de dados buscando itens nos registros duplos (linha das respectivas taxonomias e linha original); Dados com Taxonomias Roupas_leves acessorios calcados_abertos Bermuda bone chinelo Calcados_abertos ? Acessorios Chinelo brinco bone

“Desgeneralizar” Regras com Baixa Confiança Método Proposto “Desgeneralizar” Regras com Baixa Confiança Regras Chinelo brinco  bone (10%; 80%) Calcados_abertos Roupas_leves  bone (15%; 90%) Calcados_abertos Roupas_leves  bone (13%; 85%) Roupas_leves  bone (10%; 82%) Roupas_pesadas  cachecol (50%; 60%) Regras Chinelo brinco  bone (10%; 80%) Calcados_abertos Roupas_leves  bone (15%; 90%) Calcados_abertos Roupas_leves  bone (13%; 85%) Roupas_leves  bone (10%; 82%) Japona  cachecol (20%; 83%) Sobretudo  cachecol (17%; 86%)

Método Proposto Gerar Arquivo de Saída

Resultados 1062 Regras Podadas (50,8% menor) 1285 Registros 958 Regras (7% menor)

Conclusão A eficácia do método depende: Do quão generalizáveis são os dados; De quanto conhecimento de domínio está disponível; Da configuração das taxonomias confeccionadas;

Trabalhos Futuros Generalizar conseqüente da regra; Agrupar no arquivo de saída as regras que possuem antecedentes de mesma taxonomia; Roupas_banho Sunga Biquíni Maiô Regras Generalizadas Roupas_banho  entraNoMar Sunga  entraNoMar Biquini  entraNoMar Maiô  naoEntraNoMar

Referências BÜRKLE, Paula Yamada. Um Método de Pós-processamento de Regras de Associação com Base nas Relações de Dependência entre os Atributos. Universidade Federal Fluminense, Niterói, 2006. CALIL, Leonardo Aparecido de Almeida. Influência da imputação de valores ausentes nos classificadores descobertos. Universidade Tuiuti do Paraná, Curitiba, 2008. CARVALHO, Veronica Oliveira de. Generalização de regras de associação utilizando conhecimento de domínio e avaliação do conhecimento generalizado. Universidade de São Paulo, São Carlos, 2007. DOMINGUES, Marcos Aurélio. Generalização de regras de associação. Universidade de São Paulo, São Carlos, 2004. GOMES, Alan Keller. Análise do Conhecimento Extraído de Classificadores Simbólicos Utilizando Medidas de Avaliação e de Interessabilidade. Universidade de São Paulo, São Carlos, 2001. GONÇALVES, Eduardo Corrêa. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Universidade Federal Fluminense, Niterói, 2005. MELANDA, Edson Augusto. Pós-processamento de Regras de Associação. Universidade de São Paulo, São Carlos, 2004. REZENDE, Solange Oliveira. Sistemas Inteligentes – Fundamentos e Aplicações. 1a edição. Barueri – SP Editora Manole, 2003. SINOARA, Roberta Akemi. Identificação de regras de associação interessantes por meio de análises com medidas objetivas e subjetivas. Universidade de São Paulo, São Carlos, 2006. SOUZA, Viviane Dal Molin; CARVALHO, Deborah Ribeiro. Avaliando a relação entre quão corretas e interessantes podem ser as regras de associação descobertas. Tuiuti: Ciência e Cultura, Curitiba, n.37, p. 9-19, 2005. Disponível em: http://www.utp.br/tuiuticienciaecultura/TCC%5Fonline/. Acesso em: 19 out. 2009.

Nova Versão no Site http://code.google.com/p/generalizer/downloads/list