TECNOLOGIA DA INFORMAÇÃO

Slides:



Advertisements
Apresentações semelhantes
Agenda Introdução Justificativa Objetivo Detecção de Spam
Advertisements

Preparação e apresentação do relatório
Administração de Sistemas de Informação
SIN - Sistemas de Informação
Sistema de Informação Gerencial
INTELIGÊNGIA COMPUTACIONAL
SIM- Sistemas de Informação de Marketing
Felipe Carvalho – UFES 2009/2
Planejamento Estratégico de TI
SAD - SISTEMA DE APOIO À DECISÃO Prof. Wagner Andrade
Defesa de Dissertação de Mestrado
PLANEJAMENTO DA PESQUISA
Disciplina:Tópicos Avançados de Sistemas de Informação
Mineração de Dados ou Descoberta de conhecimento em BDs
Aula 4 – Inteligência de Negócios (Business Intellingence)
KDD + IA Técnicas de IA em Descoberta de Conhecimento em Bancos de Dados set/2002.
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
DATA MINING Inteligência Artificial
Data Warehouse Um Data Warehouse é um armazém de dados, contendo dados extraídos do ambiente de produção da empresa. De acordo com INMON (1997), um.
BI – Business Intelligence
Conjunto de ferramentas e técnicas que objetivam dar suporte à
Prof. Everton Lopes Bonifácio
Business Intelligence – BI Análise de sistemas de informação
ENTERPRISE RESOURSE PLANNING
Gestão Tecnológica da Informação
Pesquisa de mercado e comportamento
Dos dados ao Conhecimento: O Papel da Estatística no Marketing de Resultados UFRJ - 31/03/2005.
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
Metolodogia de Desenvolvimento de Data Warehouse
Gerenciamento de Dados
Sociedade da Informação: Ambiente de TI nas Organizações
Thales Alberto Priscila Tavares Kali Fauaze Igor Daniel William Martin.
Algoritmos 1º Semestre Materia: Informática Profº: Cristiano.
Tecnologia da Informação
Business Intelligence:
ACCESS 2007 EDIMILSON JÚNIOR.
Análise e Projeto de Sistemas
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Capacidades do Data Warehouse
Data Mining: Conceitos e Técnicas
TECNOLOGIA DA INFORMAÇÃO APLICADA Prof. Diego H. Minholi.
J OÃO C ARVALHO Data Warehouses. D EFINIÇÃO Um Data Warehouse é um sistema de computação utilizado para armazenar informações relativas às actividades.
1 Gerenciamento da Informação O que é gerenciamento? O que é gerenciamento? Como uma idéia geral, gerenciamento, gestão ou administração é a atividade.
DATA MINING Fabiany Lamboia Luciano Machado Pereira Fabiany Lamboia Luciano Machado Pereira.
METODOLOGIA, MÉTODOS E FERRAMENTAS
FMU PROFESSORA: SANDRA MARA TENCHENA FERRAMENTAS DE MARKETING
Iniciando na logística empresarial
SISTEMAS DE APOIO À DECISÃO - SAD
Mineração de Dados: Introdução
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
O PROCESSO DE KDD Elaborado por: Jader Gustavo de Campos Santos Rhafael Freitas da Costa.
KDD E MINERAÇÃO DE DADOS
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Gestão do Conhecimento e da Informação
ORGANIZAÇÃO, SISTEMAS E MÉTODOS
B. I., DATAMINING e OLAP Henrique Liduario Joab Esequiel
SISTEMA SIM e CRM Aula 12.
LOGÍSTICA E ESTRÁTEGIA OPERACIONAL
Sistema de Informações Gerenciais
Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção
Etec Philadelpho Gouvêa Netto Extensão José Felício Miziara
Data Warehouse Introdução ao Data Warehouse Introdução ao Data Warehouse Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Conceituação de Data Warehouse.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Evolução da Tecnologia da Informação
Curso: Pós Graduação - Docência do Ensino Superior Disciplina: Política e Sociedade na Perspectiva Interdisciplinar Professora: Luiza Olívia Lacerda Ramos.
1 Projeto Piloto Conclusão em Agenda Projeto Piloto –Descrição –Execução da aplicação –Implementação de requisitos funcionais e não- funcionais.
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
Controle Interno Preventivo CONTROLE INTERNO PREVENTIVO O QUE É? POR QUÊ? PARA QUÊ? COMO?
COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA MOURA 1 ;
Transcrição da apresentação:

TECNOLOGIA DA INFORMAÇÃO Ana Cláudia Ana Carnelossi Andréia Vieira Erick Tsuneto Flávia Siqueira

DATA MINING

DATA MINING Recursos computacionais - grandes volumes de dados. Necessidade de novas técnicas e ferramentas. Sistemas convencionais de gerenciamento de banco de dados. Data Mining - Mineração de Dados (três áreas: estatística clássica, inteligência artificial e aprendizado de máquina).

DATA MINING Data mining – é o processo de extração de informações, sem conhecimento prévio, de um grande banco de dados e seu uso para tomada de decisões. Permite a extração não trivial de conhecimento previamente desconhecido e potencialmente útil de um banco de dados. Data Mining é parte de um processo maior conhecido como KDD (Knowledge Discovery in Databases) – Descoberta de Conhecimento em Bases de Dados.

Processo e Subprocesso Descoberta de Conhecimento em Base de Dados (KDD) Data Mining (DM)

Processo de Descoberta de Conhecimento em Base de Dados (KDD) Iteração Interação

Etapas do Processo de Descoberta de Conhecimento em Base de Dados (KDD)

Etapas do Processo de Descoberta de Conhecimento em Base de Dados (KDD) Limpeza de Dados (DC) 80% do Tempo Qualidade dos Dados Selecionados

Armazenagem adequada dos Dados Pré- Processados (DW) Etapas do Processo de Descoberta de Conhecimento em Base de Dados (KDD) Armazenagem adequada dos Dados Pré- Processados (DW) Dados organizados Data Warehouse: depósito central de dados, extraído de dados operacionais, em que a informação é orientada a assuntos, não volátil e de natureza história.

pré-processados e já organizados (DM) Etapas do Processo de Descoberta de Conhecimento em Base de Dados (KDD) Mineração dos dados pré-processados e já organizados (DM) Informações pertinentes Data Mining: processo automatizado de extração de informações, sem conhecimento prévio, de um grande banco de dados e seu uso para tomada de decisões.

Métodos do Data Mining para definição de Metas Mineração dos dados pré-processados e já organizados (DM) Classificação Modelos de Relacionamento entre variáveis Análise de Agrupamento Sumarização Modelo de Dependência Regras de Associação Análise de Séries Temporais Metas Estabelecidas

DATA MINING - EXEMPLOS DE APLICAÇÕES MARKETING: Análise do perfil do consumidor; Posicionamento de itens em prateleira; Controle de estoque.

DATA MINING - EXEMPLOS DE APLICAÇÕES ECONOMIA: Análise de mercado; Análise de ações; Análise de investimentos.

DATA MINING - EXEMPLOS DE APLICAÇÕES SEGURANÇA: Detecta intrusões em rede; Detecta vírus.

DATA MINING - EXEMPLOS DE APLICAÇÕES WALMART: Análise do perfil do consumidor; Verificação de semelhanças; Otimização das atividades; Redefinição de layout; Aumento do consumo em 30%.

DATA MINING - EXEMPLOS DE APLICAÇÕES VESTIBULAR PUC – RJ: Análise dos candidatos à vestibular; Candidatos do sexo feminino, que trabalham e obtiveram aprovação; Regra: não efetivavam a matrícula; Existiam exceções.

Ferramentas da Mineração de Dados Darwin Data Mining Software Oracle; Transformação de dados Inteligência corporativa

Darwin Data Mining Software Atuação: - criação de padrões e correlações de dados; Resultados; Algoritmos;

Darwin Data Mining Software Ponto Forte: wizards Criação de modelos Seleção

FERRAMENTA CLEMENTINE Da empresa SPSS Inc. Essa metodologia é composta por seis fases.

FERRAMENTA CLEMENTINE Entendimento do Negócio (Business Understanding): Visa entender os objetivos e requisitos do projeto, do ponto de vista do negócio. Entendimento dos Dados (Data Understanding): Coleta de dados e identificação dos problemas. Preparação dos Dados (Data Preparation): Seleção dos dados relevantes. Modelagem (Modelling): Aplicação de técnicas de modelagem para obter valores ótimos. Avaliação (Evaluation): A partir do modelo, avalia-se os passos para verificar se representa o objetivo. Deverá obter uma decisão sobre o uso dos resultados da mineração de dados. Utilização ou Aplicação (Deployment): Duas formas: 1. O analista recomenda ações a serem tomadas baseado no modelo e resultados; 2. O modelo apliado a diferentes conjunto de dados.

FERRAMENTA CLEMENTINE Interface Possui uma interface de programação visual, facilitando a construção de modelos de Data Mining. Oferece ricas facilidades para a exploração e manipulação de dados. Possui várias técnicas de modelagem e recursos gráficos, para visualização dos dados. As operações são representadas numa área de trabalho, formando um fluxo de dado, chamados streams. Área de trabalho é a área de construção e manipulação dos streams e dados.

FERRAMENTA CLEMENTINE Interface

FERRAMENTA CLEMENTINE Interface Na paleta de objeto localizam-se os nós, onde possuem as seguintes funções: - Source: importar dados; - Record Ops: manipular registros e campos; - Graphs: visualizar os dados a partir de gráficos; - Modelling: construir modelos a partir de diversas técnicas de modelagem; - Output: Avaliação dos resultados com os recursos.

FERRAMENTA CLEMENTINE Interface

FERRAMENTA CLEMENTINE Interface Na paleta de modelos gerados, aparecem os resultados de um modelo construído depois de executado.

FERRAMENTA CLEMENTINE Interface

FERRAMENTA CLEMENTINE Interface Para execução de um modelo, clicar no botão de execução, assim todos os streams válidos serão executados.

FERRAMENTA CLEMENTINE Interface

FERRAMENTA CLEMENTINE Interface O Report Window mostra um feedback do progresso das operações. O Status Window mostra informações sobre o que a aplicação está realizando no momento. Também mostra mensagens de pedido de retorno do usuário.

FERRAMENTA CLEMENTINE Interface

FERRAMENTA CLEMENTINE Estudo Dados fornecidos pelo IBGE – Instituto Brasileiro de Geografia e Estatística. Estes dados referem-se a Pesquisa Nacional por Amostra de Domicílios (PNAD) – 1999. Finalidade: Produção de informações básicas para o estudo do desenvolvimento socioeconômico do País. Os dados encontram-se disponíveis em dois arquivos, um referente a pessoas e o outro a domicílios.

FERRAMENTA CLEMENTINE Estudo Arquivo pessoas: possui informações de identificação e caracterização dos moradores. Arquivo domicílio: possui informações com características das moradias. O estudo analisou somente as pessoas ocupadas em atividades agrícolas. Os dados encontram-se disponíveis em dois arquivos, um referente a pessoas e o outro a domicílios. Variáveis selecionadas: Unidade de Federação, Sexo, Idade, Cor/Raça, Sabe Ler/Escrever, Anos de Estudo, Rendimento Mensal Domiciliar.

FERRAMENTA CLEMENTINE Aplicação 1º Passo: A partir do nó Source, carregar os dois arquivos no Software Clementine. 2º Passo: Uní-los com o nó Merger.

FERRAMENTA CLEMENTINE Aplicação 3º Passo: Separou-se as informações através do nó Select, dividindo-as por unidade federativa.

FERRAMENTA CLEMENTINE Aplicação 4º Passo: Realizou-se uma análise exploratória de dados utilizando o nó Statistics na paleta Output. Assim, gerou-se um relatório com várias medidas estatísticas (média, desvio padrão, erro, variância, entre outros) referente a Renda Mensal Domiciliar.

FERRAMENTA CLEMENTINE Aplicação

FERRAMENTA CLEMENTINE Aplicação 5º Passo: Construção de uma árvore de decisão. Utilizou-se o nó Build C5.0 para a região Centro-Oeste.

FERRAMENTA CLEMENTINE Aplicação Foi necessário inserir diversas variáveis de entrada, então utilizou-se o nó Type.

FERRAMENTA CLEMENTINE Aplicação Resultado: árvore de decisão obtida após modelagem.

FERRAMENTA CLEMENTINE Entendendo as Árvores de Decisão As árvores de decisão funcionam e trabalham recursivamente, ou seja, ocorre a divisão dos dados com base nos valores dos campos de entrada. Estes dados que são divididos são chamados de ramo ou galho, porém, apenas o galho inicial, onde estão englobadas todos os registro, é chamado de raiz. Já os galhos que não podem ser mais divididos são conhecidos como galhos terminais ou folha.

CONSIDERAÇÕES FINAIS Nas ferramentas estudadas identificou-se a utilização de uma técnica específica de Data Mining, ou seja, a classificação dos dados por meio de árvores de decisão. O uso da ferramenta proporciona aos usuários meios para encontrar informações que permitam detectar tendências e características disfarçadas e confirmar a necessidade de estudos de novas relações. Deve ficar claro que nenhuma ferramenta de Data Mining trabalha por si só e elimina a necessidade de conhecimento, entendimento do negócio e a compreensão dos dados a serem minerados, nem mesmo substitui os analista e pesquisadores desta área.

CONSIDERAÇÕES FINAIS Portanto, conclui-se que a utilização do Data Mining está crescendo, é um auxílio para as organizações tomarem as decisões com base em banco de dados, com agilidade e confiança para as decisões futuras tanto a curto como a longo prazo.