Mineração de Dados Felipe Carvalho – UFES 2009/2.

Slides:



Advertisements
Apresentações semelhantes
Mineração de Dados Clusterização
Advertisements

Escola Politécnica de Pernambuco Departamento de Ensino Básico
Mineração de Dados Algoritmo APRIORI
Amintas engenharia.
ANÁLISE DISCRIMINANTE
ESTIMAÇÃO.
Uma das tarefas descritivas da
Universidade Federal do Paraná
MONTAGEM-TORQUE Tendo visto que o pré-carregamento é desejado em uniões importantes, deve-se agora considerar os meios de assegurar que o pré-carregamento.
A FAST APRIORI implementation
CLOSET: An Efficient Algorithm for Mining Frequent Closed Itemsets Jian Pei, Jiawei Han e Runying Mao Apresentação preparada por Alexandre Lorenzatti.
(a + b)(a + b) = a² + ab + ba + b² = a² + 2ab + b²
SISTEMAS LINEARES I Prof. Marlon.
DEMANDA A demanda (procura) de um indivíduo por um determinado bem (ou serviço) refere-se à quantidade desse bem que ele está disposto e capacitado a comprar,
Exercícios de php Dia 04/03/2011.
ESTRUTURAS ALGÉBRICAS
II. M o d e l o s d e C o n h e c i m e n t o
Prof. Wellington D. Previero
01) Abaixo, quatro das infinitas etapas da construção do fractal denominado Curva de Koch. Se a área do triângulo destacado inicialmente vale A e cada.
CAPÍTULO I- TEORIA DAS PROBABILIDADE
Módulo 5 – Introdução à Teoria Estatística da Medição
MÉTODO DE NEWTON-RAPHSON
6/7/2014 Mestrado em Ciencia da Computacao Otimização da Técnica Apriori Sandra de Amo Data Mining AULA 4.
Sistema Recomendador para Comércio Eletrônico
DERIVADA SEGUNDA Função que se obtém ao derivar a derivada de f(x)
(a + b)(a + b) = a² + ab + ba + b² = a² + 2ab + b²
Amostragem Pontos mais importantes:
Equações diferenciais ordinárias
PROBABILIDADE.
2 Probabilidade Albertazzi.Probabilidade. (2.1).
Aula 12: Probabilidade Prof. Diovani Milhorim
PROGRESSÕES ARITMÉTICAS
Introdução a Cálculo Numérico
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Campus de Caraguatatuba Matemática Discreta 1 – MD 1
Ferramentas apresentadas
Estatística Geral (Elementos de Probabilidade)
3. Distribuições de probabilidade
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Esquematicamente, temos:
Agrupamentos – Permutações com Elementos Repetidos Colégio Jardim São Paulo Prof. Mauricio Boni.
RESOLVA OS CÁLCULOS EM SEU CADERNO.
Retaguarda – Curva ABC 1. Objetivo A Curva ABC classifica os produtos mais vendidos da empresa em valores e quantidades. Sua principal função é auxiliar.
PROGRESSÃO ARITMÉTICA P.A.
Uso da calculadora Coloque a calculadora em cima de sua mesa.
Medidas de Interesse Mineração de Dados Aluno: Thiago José Marques Moura.
Método de Euler O método de Euler para resolver EDO com condições iniciais é o método numérico mais simples. Ele consiste em aproximar a solução y ( x.
Calculando o número de observações (tamanho da amostra) Após a comparação de duas médias duas e somente duas afirmativas podem ser feitas: – 1. Rejeitamos.
Exercícios de Fluxo em Redes
Regras. Regras Rudimentarias 1R: aprende uma regra por atributo  atribuí a classe mais freqüente  taxa de erro: proporção de instâncias que não pertence.
Comparando Médias 1. Se um conjunto de medidas(amostra) faz parte de uma população. 1.1 Desvio padrão da população conhecido(teste –z) 1.2 Desvio padrão.
Uso da calculadora Coloque a calculadora em cima de sua mesa.
Métodos numéricos para resolver uma EDO
Probabilidade Probabilidade Condicional Teorema do Produto
Probabilidade Definição de Probabilidade Principais Teoremas
Algoritmo de Transportes Objecto de Aprendizagem Manuel Pina MarquesDEIG
III - Amostragem Prof. Herondino.
Conceitos Básicos – Amostragem e Amostras
PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA 2015.
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
INTRODUÇÃO AO ESTUDO DE PROBABILIDADE
PROBABILIDADE.
Princípio Fundamental da Contagem (Regra do Produto) Exemplo
1 1 Eletrônica II Germano Maioli Penello II _ html Aula 20.
PROBABILIDADE Profa. Ana Clara Guedes.
Amostragem e tratamento de dados faltantes Prof. Luciana Nunes Risco Relativo e Razão de Chances.
CURVA ABC PARA ESTOQUE PROF. JEFFERSON SALLES. CURVA ABC Obtém-se a curva ABC através da ordenação dos itens que serão analisados, conforme sua importância.
Problema do Empacotamento (Bin Packing) Heurística Simulated Annealing Dionatan de Souza Moura Lucas Nowaczyk Seadi Tobias Brignol Petry.
Comportamento Assintótico
Probabilidade Marcelo Pessoa.
Transcrição da apresentação:

Mineração de Dados Felipe Carvalho – UFES 2009/2

Uma base de dados transacional

Regras de associação Uma regra de associação é o tipo mais simples de regra que pode ser gerada a partir da mineração de conjuntos de itens freqüentes e, intuitivamente, indica a probabilidade de dois conjuntos de itens distintos ocorrerem numa mesma transação

1ª. etapa [busca de conjuntos de itens freqüentes] Considerando um limite mínimo de freqüência igual a 3 (i.e., apenas conjuntos que aparecem em pelo menos 3 transações em D são desejados), obtemos os seguintes conjuntos de itens freqüentes: - {leite} [freqüência = 3] - {pão} [freqüência = 4] - {queijo} [freqüência = 3] - {pão, queijo} [freqüência = 3]

2ª. etapa [geração de regras de associação fortes] Apenas como exemplo, vamos iniciar calculando a cobertura e a precisão da regra {leite}  {pão}: cobertura({leite}  {pão})= P({leite} U {pão}) = freqüência( {leite, pão} ) / n = 2 / 5 = 40% precisão({leite}  {pão}) = P({pão} | {leite}) = freqüência( {leite, pão} ) / freqüência({leite}) = 2 / 3 = 66,7% Podemos então escrever esta regra como: {leite}{pão} [cobertura = 40%, precisão = 66,7%]

2ª. etapa [geração de regras de associação fortes] Aplicando um limite mínimo de cobertura de 40% e um limite mínimo de precisão de 60%, podemos classificar as regras de associação obtidas a partir dos conjuntos de itens freqüentes como fortes ou não: {leite}  {pão} [cobertura = 40%, precisão = 66,7%]  forte {leite}  {queijo} [cobertura = 20%, precisão = 33,3%] {leite}  {pão, queijo} [cobertura = 20%, precisão = 33,3%] {pão}  {leite} [cobertura = 40%, precisão = 50% ] {pão}  {queijo}[cobertura = 60%, precisão = 75% ]  forte {queijo}  {leite} [cobertura = 20%, precisão = 33,3%] {queijo}  {pão}[cobertura = 60%, precisão = 100% ]  forte {pão, queijo}  {leite}[cobertura = 20%, precisão = 33,3%]

2ª. etapa [geração de regras de associação fortes] Observamos que não existem regras como {pão}  {pão, leite}; pois, os conjuntos representando as condições e a conclusão de uma regra devem ser disjuntos, i.e., para a regra A  B ser válida devemos ter A interseção B = Vazio. Notamos também que, enquanto a regra {leite}  {pão} foi classificada como forte, a regra {pão}  {leite} não o foi. A razão desse fato está na diferença de precisão entre as duas regras, i.e., há mais chances de alguém que comprou leite comprar pão, do que de alguém que comprou pão comprar leite. Se tivéssemos escolhido um limite mínimo mais baixo de precisão, a regra {pão}  {leite} poderia também ter sido qualificada como forte. Porém, o uso de limites muito baixos pode acarretar em quantidades muito altas de regras, a maioria delas provavelmente não muito interessantes