A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Using Concept Hierarchies in Knowledge Discovery

Apresentações semelhantes


Apresentação em tema: "Using Concept Hierarchies in Knowledge Discovery"— Transcrição da apresentação:

1 Using Concept Hierarchies in Knowledge Discovery
Usando Hierarquias Conceituais na Descoberta de Conhecimento

2 Descoberta em múltiplos níveis conceituais
Padrões podem ser descobertos: 1) no nível conceitual representado no Banco de Dados (BD) 2) num nível conceitual mais elevado, utilizando informação de hierarquias de conceitos  descoberta de padrões de alto nível Observações: em geral, não existem regularidades fortes em conceitos com baixo nível de abstração. regularidades em conceitos de nível mais alto de abstração, podem ser conhecidas ou de senso comum. conceitos em níveis intermediários podem apresentar maior grau de interesse. SET 2004 SBIA Marco Di Beneditto

3 SBIA 2004 - Marco Di Beneditto
Valores dos atributos valores existentes no BD; ou generalizações ou agrupamentos dos valores existentes no BD nível de abstração mais elevado nível de abstração do BD SET 2004 SBIA Marco Di Beneditto

4 SBIA 2004 - Marco Di Beneditto
Aspectos a considerar Utilização em qualquer SGBD relacional que suporte consultas em SQL. Representação de hierarquias conceituais no próprio SGBD, sem necessitar de uma outra ferramenta. Desnecessidade de pré-generalizar o BD num determinado nível conceitual. SET 2004 SBIA Marco Di Beneditto

5 Especialização de hipóteses de regras
Se (A1,v1)  (A2, v2) ... (Ai, vi) então cn especialização na hierarquia adição de par Av Se (A1,v1)  (A2, v2) ... (Ai, v’i) então cn Se (A1,v1) ...(Ai, vi)  (Ai+1, vi+1) então cn uso de hierarquias de conceitos SET 2004 SBIA Marco Di Beneditto

6 Primitiva de Contagem para o cálculo de medidas de relevância
Avaliação de hipótese de regra expressa em SQL. Regra expandida pela adição de mais um atributo. SE COR ENTÃO classe=? SELECT cor, classe, COUNT(*) FROM tabela_dados GROUP BY cor, classe; SE COR = preta  FORMA ENTÃO classe=? SELECT forma, classe, COUNT(*) FROM tabela_dados WHERE cor = ‘preta’ GROUP BY forma, classe; SET 2004 SBIA Marco Di Beneditto

7 Saída da primitiva de contagem
Classes Proposta por Alex Freitas (1997). Tuplas por valor de atributo Atributo valor SET 2004 Tuplas por classe

8 Cálculo do Suporte e Confiança com hierarquias conceituais
SET 2004 SBIA Marco Di Beneditto

9 Primitiva de contagem com hierarquias conceituais
SE COR = escura  FORMA ENTÃO classe = ? SELECT forma, classe, COUNT(*) FROM tabela_dados WHERE (cor = ‘preta’ OR cor = ‘marrom’) GROUP BY forma, classe; SET 2004 SBIA Marco Di Beneditto

10 Codificação de Hierarquias Conceituais
Verificar se um conceito é mais geral que outro sem necessitar consultar a hierarquia. Representar a relação de ordem parcial entre conceitos. Percurso pós-fixado da hierarquia conceitual SET 2004 SBIA Marco Di Beneditto

11 SBIA 2004 - Marco Di Beneditto
Sistema NETUNO-HC 1. Atributos 2. Hierarquias 3. Valores mínimos das medidas de relevância 4. Largura do feixe Algoritmo NETUNO Banco de Dados Regras descobertas Teste SET 2004 SBIA Marco Di Beneditto

12 Experimentos preliminares - uso da primitiva de contagem
Implementação da primitiva de contagem no algoritmo ParDRI (Taylor, 1999). O algoritmo ParDRI realiza consultas de alto nível utilizando os valores abaixo da raiz da hierarquia (descendentes de QUALQUER). Banco de dados Cogumelo (UCI) SET 2004 SBIA Marco Di Beneditto

13 Taxa de acerto X Medidas de relevância
Suporte: p/P Confiança: p/(n+p) ou P(C|A) Obs: Taxa de acerto total, sem computar os exemplos não classificados (não cobertos por uma regra) SET 2004 SBIA Marco Di Beneditto

14 Número de regras descobertas
Número de regras descobertas para o BD Cogumelo sem HC com HC SET 2004 SBIA Marco Di Beneditto

15 SBIA 2004 - Marco Di Beneditto
Conclusões 1) representação eficiente das hierarquias conceituais. estrutura interna de representação codificação da hierarquia 2) redução do número de acessos ao BD. uso da primitiva de contagem empregando hierarquias conceituais SET 2004 SBIA Marco Di Beneditto

16 SBIA 2004 - Marco Di Beneditto
Conclusões 4) Alterações nos valores mínimos das medidas de relevância. um valor maior de suporte tende a descobrir um conjunto de regras com valores de mais alto nível. 5) O uso de hierarquias pode descobrir um conjunto menor de regras. SET 2004 SBIA Marco Di Beneditto

17 FIM


Carregar ppt "Using Concept Hierarchies in Knowledge Discovery"

Apresentações semelhantes


Anúncios Google