A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

© NeuroTech 2012 NeuroTech Ltda. Paulo Adeodato D 3 M: Domain-Driven Data Mining O Diferencial Competitivo do Conhecimento em Negócios.

Apresentações semelhantes


Apresentação em tema: "© NeuroTech 2012 NeuroTech Ltda. Paulo Adeodato D 3 M: Domain-Driven Data Mining O Diferencial Competitivo do Conhecimento em Negócios."— Transcrição da apresentação:

1 © NeuroTech 2012 NeuroTech Ltda. Paulo Adeodato D 3 M: Domain-Driven Data Mining O Diferencial Competitivo do Conhecimento em Negócios

2 © NeuroTech 2012 Abordagem Tradicional para Mineração de Dados Data Mining KDD CRISP-DM Inteligência Artificial (IA) Tecnologia=BD+Estat.+IA+ADS Gestão de Projetos + Tecnologia

3 © NeuroTech 2012 Metodologia de Trabalho: CRoss-Industry Standard Process for DM (CRISP-DM) Entendimento do Negócio Entendimento do Negócio Entendimento dos Dados Entendimento dos Dados Transformação dos Dados Transformação dos Dados Modelagem de I.A. Modelagem de I.A. Avaliação de Desempenho do Negócio Avaliação de Desempenho do Negócio Implantação Dados

4 © NeuroTech 2012 Arquitetura da Solução NeuroTech – Visão Modular Fontes Internas Portal + Inte- grador + Cons- trutor de Data- Marts Portal + Inte- grador + Cons- trutor de Data- Marts WorkFlow / Processo Operacional Motor de Regras Motor de IA Gateway Mesa para Avaliação Humana Mesa para Avaliação Humana Camada de Persistência Base de Conheci mento Base de Conheci mento Fontes Externas Parâmetros de Operação Processos Lista Negativa Lista Negativa MIS Sistema de Infor- mações Geren- ciais MIS Sistema de Infor- mações Geren- ciais Processos Relatórios OLAP OLAM Relatórios OLAP OLAM Data- Mart Data- Mart

5 © NeuroTech 2012 Necessidade Brasileira Atual Fontes Internas Portal + Inte- grador + Cons- trutor de Data- Marts Portal + Inte- grador + Cons- trutor de Data- Marts WorkFlow / Processo Operacional Motor de Regras Motor de IA Gateway Mesa para Avaliação Humana Mesa para Avaliação Humana Camada de Persistência Base de Conheci mento Base de Conheci mento Fontes Externas Parâmetros de Operação Processos Lista Negativa Lista Negativa MIS Sistema de Infor- mações Geren- ciais MIS Sistema de Infor- mações Geren- ciais Processos Relatórios OLAP OLAM Relatórios OLAP OLAM Data- Mart Data- Mart

6 © NeuroTech 2012 Investimento Científico Brasileiro Atual Fontes Internas Portal + Inte- grador + Cons- trutor de Data- Marts Portal + Inte- grador + Cons- trutor de Data- Marts WorkFlow / Processo Operacional Motor de Regras Motor de IA Gateway Mesa para Avaliação Humana Mesa para Avaliação Humana Camada de Persistência Base de Conheci mento Base de Conheci mento Fontes Externas Parâmetros de Operação Processos Lista Negativa Lista Negativa MIS Sistema de Infor- mações Geren- ciais MIS Sistema de Infor- mações Geren- ciais Processos Relatórios OLAP OLAM Relatórios OLAP OLAM Data- Mart Data- Mart

7 © NeuroTech 2012 Maior Necessidade Internacional Atual: D 3 M Fontes Internas Portal + Inte- grador + Cons- trutor de Data- Marts Portal + Inte- grador + Cons- trutor de Data- Marts WorkFlow / Processo Operacional Motor de Regras Motor de IA Gateway Mesa para Avaliação Humana Mesa para Avaliação Humana Camada de Persistência Base de Conheci mento Base de Conheci mento Fontes Externas Parâmetros de Operação Processos Lista Negativa Lista Negativa MIS Sistema de Infor- mações Geren- ciais MIS Sistema de Infor- mações Geren- ciais Processos Relatórios OLAP OLAM Relatórios OLAP OLAM Data- Mart Data- Mart

8 © NeuroTech 2012 D 3 M: RoboCup 2D Objetivo: Aumentar a chance de fazer gol ao chutar Objetivos específicos: Estimar a chance de gol a partir da análise instantânea do ambiente Explicar em termos de regras explícitas a chance estimada Dados: 10 mil cenas de chute a gol de 3 campeonatos mundiais

9 © NeuroTech 2012 Variáveis utilizadas Variáveis originais: Posições (x,y) de cada jogador e da bola no campo Variáveis transformadas: Ângulo da barra na visão do chutador Distância da bola ao centro da barra Posição do goleiro em relação ao centro da barra Perpendicularidade do chutador à barra Distância mínima de um adversário à trajetória da bola + outras que um atacante considera ao chutar

10 © NeuroTech 2012 D 3 M: Competição Ford – Detecção de Falhas Variáveis Originais OK Not-OK

11 © NeuroTech 2012 Variáveis Transformadas Potência do sinal Relação sinal/ruído Freqüência de oscilação Amplitude máxima + conceitos do domínio de materiais e oscilações

12 © NeuroTech 2012 D 3 M: KDD-2008: Detecção de Câncer de Mama Objetivo: Diagnosticar se a paciente está com câncer Dados: imagens de nódulos candidatos Principal característica da solução: Embutir conhecimento do domínio nas transformações (clusters para representar micro-calcificações) "microcalcifications that are more scattered are probably due to a benign (non-cancerous) cause, a cluster of microcalcifications may increase concern that there may be an underlying tumor (ductal carcinoma in situ)".

13 © NeuroTech 2012 Variáveis originais Posição de cada nódulo Lado do seio (E / D) Tipo de imagem (CC ou MLO) V 001 a V 117, todas com média=0 e desvio=1 Variáveis transformadas Conceito de “cluster” de nódulos numa imagem do seio Conceito de “cluster” de nódulos nas 2 imagens do seio Re-normalização de V 001 a V 117, por seio+imagem

14 © NeuroTech 2012 D 3 M: Retenção Universitária Objetivo : Estimar a propensão de retenção dos alunos ao final do 2o. semestre do seu curso para auxiliar o aconselhamento para a matrícula no período seguinte.

15 © NeuroTech 2012 Condições da base de dados Variáveis originais: notas e status no grão Aluno_Semestre_Disciplina; Dados: Informações acadêmicas dos 6 cursos; Pedagogia, Direito, Letras, Medicina, Engenharia Civil e Ciências Econômicas

16 © NeuroTech 2012 Regressão Logística – Variáveis Significativas Ordenadas VariávelbSign. (p) Constante4,560,000 TaxaRepFrequencia1Sem3,420,000 TaxaRepNota1Sem1,930,000 TaxaCancelamento1Sem0,830,000 TaxaAprovaçãoExameFinal1Sem0,510,000 ReprovaçãoDiscPrincipal2Sem0,430,004 TurnoManhã-0,30,000 CursoPedagogia-0,970,000 TurnoIntegral-1,130,000 TaxaRepFrequencia2Sem-2,160,000 CursoDireito-2,530,000 Trancamento2sem-3,260,000 CoefVariaçãoNota-5,650,000 CursoMedicina-5,830,000

17 © NeuroTech 2012 D 3 M: Behavior Scoring – RFM Analysis Behavior scoring é uma forma de transformar o problema de “previsão” em “classificação” Grande quantidade de Séries curtas de Múltiplos indicadores em Intervalos não uniformes Múltiplos indicadores (RFM) R: Recency (tempos desde a última transação, atraso etc.) F: Frequency (freqüências no mês, semestre, ano etc.) M: Monetary value (valores pagos, atrasados etc.)

18 © NeuroTech 2012 Aplicações práticas de Behavior Scoring Aplicações atuais de behavior scoring Crédito/Cobrança/Fraude/CRM Generalizamos para: Falhas em sistemas -Redes elétrica, hidráulica etc. -Frotas de veículos, aviões, navios etc. Saúde de pessoas / animais -Doenças, crises etc. (Recursos para Internação hospitalar, exames etc.) Reincidência criminal Atentados terroristas

19 © NeuroTech 2012 Generalização do behavior scoring para sistemas Múltiplos indicadores (RFI) R: Recency (tempos desde a última falha, doença etc.) F: Frequency (freqüências no mês, semestre, ano etc.) I: Impact (valor, perda, volume, potência etc.) Fundamentação teórica Análise de Fourier Distribuição Inversa de Wishart D 3 M: Behavior Scoring – RFI Analysis

20 © NeuroTech 2012 Conclusões sobre o NeuroDataBuilder O NeuroDataBuilder tem 3 papéis fundamentais Embutir o conhecimento humano nas transformações (PI) Embutir o conhecimento estatístico nas transformações (PI) Acoplar as visões de dados da base com as entradas de IA Diferenciais competitivos Criar templates com conhecimento humano para agilizar a modelagem das transformações Ter uma arquitetura de SW robusta e escalável de transformação Prover ao modelador uma plataforma user-friendly e sistemática

21 © NeuroTech 2012 Soluções completas para decisões inteligentes www.neurotech.com.br Obrigado!


Carregar ppt "© NeuroTech 2012 NeuroTech Ltda. Paulo Adeodato D 3 M: Domain-Driven Data Mining O Diferencial Competitivo do Conhecimento em Negócios."

Apresentações semelhantes


Anúncios Google