Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Data Mining como ferramenta de Gestão
2
Denis Rezende
3
SISTEMAS INTELIGENTES PARA APOIO NA TOMADA DE DECISÕES PODEM USAR:
REDES NEURAIS ALGORITMOS GENÉTICOS LÓGICA FUZZY DATA MINING RBC AQUISIÇÃO DE CONHECIMENTO SISTEMAS ESPECIALISTAS Monard (1997)
4
Conhecimento Não-planejado Resposta SI Tradicionais Planejado
Antecipado Não-antecipado Estímulo
5
? INTERPRETAÇÃO/ AVALIAÇÃO CONHECIMENTO DATA MINING PADRÕES
FAYYAD 1996 ? CONHECIMENTO PADRÕES DADO TRANSFORMADO DATA MINING INTERPRETAÇÃO/ AVALIAÇÃO DADOS SELEÇÃO PRÉ-PROCESSAMENTO ANALISADO PROCESSADO TRANSFORMAÇÃO
6
Tarefas de Data Mining Classificação Descoberta de Regras de Associação Clustering
7
Classificação
8
SE (país = “Alemanha”) ENTÃO (comprar=“não”)
Classificação SE (país = “Alemanha”) ENTÃO (comprar=“não”) Se (país = “Inglaterra”) ENTÃO (comprar = “sim”) SE (país = “França” E idade 25) ENTÃO (comprar = “sim”) SE (país = “França” E idade > 25) ENTÃO (comprar = “não”)
9
+ + - - + + + - - - - + + + - - - - - - - - + + + - - - Classificação
(Freitas 200)
10
Descoberta de Regras de Associação
Cada registro corresponde a uma transação de um cliente, com itens assumindo valores binários (sim/não), indicando se o cliente comprou ou não o respectivo item.
11
Descoberta de Regras de Associação
Uma regra de associação é um relacionamento do tipo: SE (x) ENTÃO (y) onde x e y são conjuntos de itens X Y = A cada regra são atribuídos dois fatores: Suporte Confiança Tarefa é descobrir todas a regras de associação com suporte ao suporte mínimo e confiança confiança mínima (Freitas 200)
12
Descoberta de Regras de Associação
SE (café) ENTÃO (pão) sup=0.3 conf.=1 SE (café) ENTÃO (manteiga) sup=0.3 conf.=1 SE (pão) ENTÃO (manteiga) sup=0.4 conf.=0.8 SE (manteiga) ENTÃO (pão) sup=0.4 conf.=0.8 SE (café E pão) ENTÃO (manteiga) sup=0.3 conf.=1 SE (café E manteiga) ENTÃO (manteiga) sup=0.3 conf.=1 SE (café) ENTÃO (manteiga E manteiga) sup=0.3 conf.=1 (Freitas 200)
13
Análise de Cluster Esta técnica agrupa informações homogêneas de grupos heterogêneos entre os demais e aponta o item que melhor representa cada grupo, permitindo, desta forma, que consigamos perceber a característica de cada grupo. GTI (2002) - Deborah R. Carvalho
14
Estudo de Caso A base de dados alunos. Primeira fase - cursos de Computação, restringiu-se a base para 1557 alunos: PD EC, CC e BSI.
15
Estudo de Caso
16
Estudo de Caso
17
Estudo de Caso
18
Estudo de Caso
19
Estudo de Caso
20
Estudo de Caso
21
Estudo de Caso - 4 cursos MATEMATICA (A) <- ARQUIT. COMPUT. RNF (10.7%, 41.3%) INTROD. LOGICA (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 43.1%) CIDADANIA (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 45.0%) LINGUAGEM E TEC. PROG. (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 48.6%) SISTEMASDECOMPUTACAO (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 48.6%) INGLES (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 50.5%) ALGEBRA BOOLEANA E CIRC LOG (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 44.0%) DINAMICA GRUPO E REL. HUM. (A) <- ARQUIT. COMPUT. (RNF) (10.7%, 68.8%)
22
Estudo de Caso - BSI INT. COMP. (A) <- ENG. SW (RNF)FUND.MAT.(A) (10.5%, 94.7%) FUND.MAT.(A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 90.0%) DIN. GRUPO E REL. HUM. A <- ENG. SW (RNF) FUND.MAT.(A) (10.5%, 94.7%) INT. COMP. (A) <- ENG. SW (RNF) HAB. ACAD. (A) (10.5%, 94.7%) HAB. ACAD. (A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 90.0%) DIN. GRUPO E REL. HUM. (A)<- ENG. SW (RNF) HAB. ACAD. (A) (10.5%, 94.7%) DIN. GRUPO E REL. HUM. (A) <- ENG. SW (RNF) INT. COMP. (A) (11.0%, 95.0%) DIN. GRUPO E REL. HUM. (A) <- ENG. SW (RNF) LING. PROG. (A) (10.5%, 94.7%)
23
Estudo de Caso - CC INT. COMP. (A) <- LOG. PROG. (RN) (11.4%, 55.0%) HAB. ACAD. (A) <- PROG. COMP. (RN) (12.0%, 57.1%) PROG. COMP. (RNF) <- LOG. PROG.(RNF) (15.7%, 67.3%) LOG. PROG. (RNF) <- PROG. COMP. (RNF) (16.2%, 64.9%) PROG. COMP. (RNF) <- INT. COMP. (RNF) (16.0%, 58.9%) INT. COMP. (RNF) <- PROG. COMP. (RNF) (16.2%, 57.9%) CALC. DIF. INTEG I (RNF) <- INT. COMP. (RNF) (16.0%, 55.4%) INT. COMP. (RNF) <- LOG. PROG.(RNF) PROG. COMP. (RNF) (10.5%, 73.0%)
24
Estudo de Caso - EC CALC. DIF. INTEG A (RN) <- GEOM. ANAL. (RN) (10.0%, 53.8%) DESENHO TEC. (A) <- GEOM. ANAL. (RN) (10.0%, 65.4%) ALGEBRA LINEAR (RNF) <- GEOM. ANAL. (RNF) (10.4%, 66.7%) GEOM. ANAL. (RNF) <- ALGEBRA LINEAR (RNF) (12.7%, 54.5%) DESENHO TEC. (A) <- CALC. DIF. INTEG A (RN) (15.4%, 60.0%)
25
Estudo de Caso - PD SIST. COMP. (A)<- ARQUIT. COMPUT. (RNF) MATEMATICA (A) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) (10.8%, 100.0%) INGLES (A) <- ARQUIT. COMPUT. (RNF) INTRODUCAO LOGICA (A) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) DIN. GRUPO E REL. HUM. (A) (11.1%, 100.0%) DIN. GRUPO E REL. HUM. (A) <- ESTRUTURA DADOS (RN) ALGEBRA BOOLEANA E CIRCUITOS LOGICOS (A) (12.2%, 100.0%) INGLES (A) <- ESTRUTURA DADOS (RN) SISTEMAS DE COMPUTACAO (A) (11.9%, 100.0%) DIN. GRUPO E REL. HUM. (A) <- ESTRUTURA DADOS (RN) SISTEMAS COMPUTACAO (A) (11.9%, 100.0%)
26
Requisito básico para a realização dos experimentos;
Conclusões: A Importância dos Dados Requisito básico para a realização dos experimentos; “Boa” quantidade de dados é uma necessidade. A qualidade da solução indicada é fortemente dependente da qualidade dos dados; Data mining não pode ser considerado uma alquimia; não é possível tranformar pedra em ouro.
27
That’s all folks!
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.