A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Data Mining como ferramenta de Gestão

Apresentações semelhantes


Apresentação em tema: "Data Mining como ferramenta de Gestão"— Transcrição da apresentação:

1 Data Mining como ferramenta de Gestão

2 Denis Rezende

3 SISTEMAS INTELIGENTES PARA APOIO NA TOMADA DE DECISÕES PODEM USAR:
REDES NEURAIS ALGORITMOS GENÉTICOS LÓGICA FUZZY DATA MINING RBC AQUISIÇÃO DE CONHECIMENTO SISTEMAS ESPECIALISTAS Monard (1997)

4 Conhecimento Não-planejado Resposta SI Tradicionais Planejado
Antecipado Não-antecipado Estímulo

5 ? INTERPRETAÇÃO/ AVALIAÇÃO CONHECIMENTO DATA MINING PADRÕES
FAYYAD 1996 ? CONHECIMENTO PADRÕES DADO TRANSFORMADO DATA MINING INTERPRETAÇÃO/ AVALIAÇÃO DADOS SELEÇÃO PRÉ-PROCESSAMENTO ANALISADO PROCESSADO TRANSFORMAÇÃO

6 Tarefas de Data Mining Classificação Descoberta de Regras de Associação Clustering

7 Classificação

8 SE (país = “Alemanha”) ENTÃO (comprar=“não”)
Classificação SE (país = “Alemanha”) ENTÃO (comprar=“não”) Se (país = “Inglaterra”) ENTÃO (comprar = “sim”) SE (país = “França” E idade  25) ENTÃO (comprar = “sim”) SE (país = “França” E idade > 25) ENTÃO (comprar = “não”)

9 + + - - + + + - - - - + + + - - - - - - - - + + + - - - Classificação
(Freitas 200)

10 Descoberta de Regras de Associação
Cada registro corresponde a uma transação de um cliente, com itens assumindo valores binários (sim/não), indicando se o cliente comprou ou não o respectivo item.

11 Descoberta de Regras de Associação
Uma regra de associação é um relacionamento do tipo: SE (x) ENTÃO (y) onde x e y são conjuntos de itens X  Y =  A cada regra são atribuídos dois fatores: Suporte Confiança Tarefa é descobrir todas a regras de associação com suporte ao suporte mínimo e confiança  confiança mínima (Freitas 200)

12 Descoberta de Regras de Associação
SE (café) ENTÃO (pão) sup=0.3 conf.=1 SE (café) ENTÃO (manteiga) sup=0.3 conf.=1 SE (pão) ENTÃO (manteiga) sup=0.4 conf.=0.8 SE (manteiga) ENTÃO (pão) sup=0.4 conf.=0.8 SE (café E pão) ENTÃO (manteiga) sup=0.3 conf.=1 SE (café E manteiga) ENTÃO (manteiga) sup=0.3 conf.=1 SE (café) ENTÃO (manteiga E manteiga) sup=0.3 conf.=1 (Freitas 200)

13 Análise de Cluster Esta técnica agrupa informações homogêneas de grupos heterogêneos entre os demais e aponta o item que melhor representa cada grupo, permitindo, desta forma, que consigamos perceber a característica de cada grupo. GTI (2002) - Deborah R. Carvalho

14 Estudo de Caso A base de dados alunos. Primeira fase - cursos de Computação, restringiu-se a base para 1557 alunos: PD EC, CC e BSI.

15 Estudo de Caso

16 Estudo de Caso

17 Estudo de Caso

18 Estudo de Caso

19 Estudo de Caso

20 Estudo de Caso

21 Estudo de Caso - 4 cursos MATEMATICA (A) <- ARQUIT. COMPUT. RNF (10.7%, 41.3%) INTROD. LOGICA (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 43.1%) CIDADANIA (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 45.0%) LINGUAGEM E TEC. PROG. (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 48.6%) SISTEMASDECOMPUTACAO (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 48.6%) INGLES (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 50.5%) ALGEBRA BOOLEANA E CIRC LOG (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 44.0%) DINAMICA GRUPO E REL. HUM. (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 68.8%)

22 Estudo de Caso - BSI INT. COMP. (A) <- ENG. SW (RNF)FUND.MAT.(A) (10.5%, 94.7%) FUND.MAT.(A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 90.0%) DIN. GRUPO E REL. HUM. A <- ENG. SW (RNF) FUND.MAT.(A) (10.5%, 94.7%) INT. COMP. (A) <- ENG. SW (RNF) HAB. ACAD. (A) (10.5%, 94.7%) HAB. ACAD. (A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 90.0%) DIN. GRUPO E REL. HUM. (A)<- ENG. SW (RNF) HAB. ACAD. (A) (10.5%, 94.7%) DIN. GRUPO E REL. HUM. (A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 95.0%) DIN. GRUPO E REL. HUM. (A) <- ENG. SW (RNF) LING. PROG. (A) (10.5%, 94.7%)

23 Estudo de Caso - CC INT. COMP. (A) <- LOG. PROG. (RN) (11.4%, 55.0%) HAB. ACAD. (A) <- PROG. COMP. (RN) (12.0%, 57.1%) PROG. COMP. (RNF) <- LOG. PROG.(RNF) (15.7%, 67.3%) LOG. PROG. (RNF) <- PROG. COMP. (RNF) (16.2%, 64.9%) PROG. COMP. (RNF) <- INT. COMP. (RNF) (16.0%, 58.9%) INT. COMP. (RNF) <- PROG. COMP. (RNF) (16.2%, 57.9%) CALC. DIF. INTEG I (RNF) <- INT. COMP. (RNF) (16.0%, 55.4%) INT. COMP. (RNF) <- LOG. PROG.(RNF) PROG. COMP. (RNF) (10.5%, 73.0%)

24 Estudo de Caso - EC CALC. DIF. INTEG A (RN) <- GEOM. ANAL. (RN) (10.0%, 53.8%) DESENHO TEC. (A) <- GEOM. ANAL. (RN) (10.0%, 65.4%) ALGEBRA LINEAR (RNF) <- GEOM. ANAL. (RNF) (10.4%, 66.7%) GEOM. ANAL. (RNF) <- ALGEBRA LINEAR (RNF) (12.7%, 54.5%) DESENHO TEC. (A) <- CALC. DIF. INTEG A (RN) (15.4%, 60.0%)

25 Estudo de Caso - PD SIST. COMP. (A)<- ARQUIT. COMPUT. (RNF) MATEMATICA (A) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) (10.8%, 100.0%) INGLES (A) <- ARQUIT. COMPUT. (RNF) INTRODUCAO LOGICA (A) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) DIN. GRUPO E REL. HUM. (A) (11.1%, 100.0%) DIN. GRUPO E REL. HUM. (A) <- ESTRUTURA DADOS (RN) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) (12.2%, 100.0%) INGLES (A) <- ESTRUTURA DADOS (RN) SISTEMAS DE COMPUTACAO (A) (11.9%, 100.0%) DIN. GRUPO E REL. HUM. (A) <- ESTRUTURA DADOS (RN) SISTEMAS COMPUTACAO (A) (11.9%, 100.0%)

26 Requisito básico para a realização dos experimentos;
Conclusões: A Importância dos Dados Requisito básico para a realização dos experimentos; “Boa” quantidade de dados é uma necessidade. A qualidade da solução indicada é fortemente dependente da qualidade dos dados; Data mining não pode ser considerado uma alquimia; não é possível tranformar pedra em ouro.

27 That’s all folks!


Carregar ppt "Data Mining como ferramenta de Gestão"

Apresentações semelhantes


Anúncios Google