Luis Paulo Vieira Braga, D.Sc., Mba.

Slides:



Advertisements
Apresentações semelhantes
Teoria e Prática Prof.Ms. Nilson Aguilar
Advertisements

Prof. Alberto Martins Júnior
Análise e Projeto de Sistemas I
É importante para o Bradesco
INTELIGÊNGIA COMPUTACIONAL
Felipe Carvalho – UFES 2009/2
Programa Intel® Educar
7º Encontro de Coordenação do PNAFM Comunidade Temática Geoprocessamento 7 a 11 de Maio de 2007 São Luís / Maranhão CONCLUSÕES.
Empreendorismo para Computação Criando Negócios de Tecnologia
Tópicos Avançados de Sistemas de Informação
Sistema Gerenciador de Banco de Dados SGBD
Orientação a Objetos: Encapsulamento e Classificação
ABGP – IPMA Certificação Nível D Grupo de Estudos Área V do RBC Elementos 29, 35 e 37 Normando Nereu de Souza Coelho APRESENTAÇÃO PROJEXPERT – FOLDER.
Mineração de Dados ou Descoberta de conhecimento em BDs
Vice Reitoria Acadêmica - Assessoria de Pesquisa Diretório dos Grupos de Pesquisa do Brasil Versão Assessoria de Pesquisa Vice-Reitoria Acadêmica.
Arlon Cunha Eduardo Moschetta Felipe Varga Giovani Facchini Renato Frederico V. da Costa Rossana Queiroz Gerência de Projetos – 2005/2 Professor: Cândido.
Visão Geral do Desenvolvimento de Sistemas e Papéis no Desenvolvimento de Software Marcely Dias
O Marketing como ferramenta de vendas e relacionamento
ONAP-HOME INFORMÁTICA LTDA
MISSÃO Oferecer oportunidades de aumento de competitividade empresarial através da Logística Reversa.
Projeto Cursos e Negócios
A empresa Somos uma operadora de telecomunicações outorgada pela Anatel. Sócios: Ideiasnet (ações em Bolsa, Banco Pactual, Grupo Lorentzen e outros) –
QUEM SOMOS Fundada em 1992, a van Rooy Comércio e Informática é uma empresa com grande experiência no desenvolvimento de software para telemarketing ativo,
CASH PASSPORT – VISA TRAVEL MONEY
SCAM Sistema de Controle e Gerenciamento Administrativo para Construtoras.
Principais Tecnologias – NF-e
Eventos 2011 Objetivo Como deve ser estruturada uma equipe de Análise de Negócios dentro de uma organização? É diferente para empresas que fornecem serviços.
Objetivo Auxiliar na administração de Clínicas, otimizando processos e aumentando qualidade do atendimento.
UNIVERSIDADE FEDERAL DE MINAS GERAIS
Uma equipe empenhada em realizar sempre o melhor.
Ensino Médio Integrado em Informática Departamento de Ciências da Computação.
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
Treinamento do Microsoft® Access® 2010
SACADO Cobrança Caixa Instalação Cadastramento inicial Parâmetros Inicio Fim Acesso ao sistema Responsáveis Grupos de sacados Sacados Títulos Relatórios.
Trabalho realizado por
Tutorial de Utilização do Controle de Pendências – JIRA
Gerenciamento de Dados
Neste momento o operador esta disponível aguardando um contato para iniciar o seu atendimento.
15 anos desenvolvendo soluções criativas
Planejamento financeiro de projetos
PMBOK 5ª Edição Capítulo 9
Aula 9 Segmentação de mercado Profa. MSc. Daniela Ferreira Suarez
Nova solução CRM da Riosoft
Seminário APCER “Gestão de Valor: Criação de Valor para as partes interessadas” Lisboa, 29 de Junho de 2004 Direcção Qualidade e Segurança José Araújo.
A sua porta para o mercado de Comunicação Vagas de empregos na área de Comunicação A sua porta para.
Sistemas de Informação e as decisões gerenciais na era da Internet
UniCNPL UniCNPL Universidade Corporativa da Confederação Nacional das Profissões Liberais.
ORÇAMENTO EMPRESARIAL - FACITEC Prof. CARLOS EDUARDO MARINHO DINIZ
Microsoft Azure Apresentação de visão geral para parceiros
Estratégia Organizacional
4 passos para a conquista do cliente
Geoposicionamento e Prospecção
Você deseja ser um vendedor de sucesso?
GESTÃO DE PROJETOS DE MANUTENÇÃO
Apresentação e visão geral
Volume de dados / filtragem – auxiliar na tomada de decisão Tempo x dinheiro / uso de informações Otimização e organização / investimento.
Trabalho de Conclusão de Curso TCC
Um Convite Especial Para Você Próximo. Faça a DiferençaAcontecer Próximo.
Infra-estrutura da tecnologia de informação
Prof. Ana Martins – UCB Unidade 02 Aula 03
Sistemas de informação (nome da nossa disciplina)
Mineração de Dados: Introdução
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Uma Escola do Tamanho do Brasil
Professora: Fabrícia F. de Souza
10 anos atuando com trabalho e dedicação!
TÉCNICO I – REDE EXTERNA
15 anos15 anos. Onde encontrá-lo? Podemos encontrar todos os Procedimentos provenientes do SGQ disponibilizados em nossa rede pelo caminho : Z:\S G Q\Procedimentos.
#apresentação Com o advento do maior rigor implementado às indústrias no que tange a temática de segurança dos trabalhadores, sobretudo, na interface.
Clima Organizacional 2005 Pesquisa sobre Terceirização de Serviços no Setor de Telecomunicações Cícero Domingos Penha Diretor de Relações Corporativas.
Transcrição da apresentação:

Luis Paulo Vieira Braga, D.Sc., Mba. Mineração de Textos Luis Paulo Vieira Braga, D.Sc., Mba. lpbraga@im.ufrj.br http://www.dme.im.ufrj.br/braga.html c.p. 2386 20.001-970 Rio de Janeiro, R.J.

Mineração de dados Mineração de dados O que é ? Metodologia básica Mineração de textos Para que serve Como é feita Exemplos

Mineração de dados O que é: A mineração de dados é uma metodologia para predição e classificação em grandes massas de dados observacionais, sem a tendenciosidade e a limitação de uma análise baseada exclusivamente na experiência do especialista.

Mineração de Dados Armazém de dados Seleção dos dados de interesse Pré-processamento Transformações matemáticas Classificação ou Previsão

Mineração de Dados

Mineração de Dados

Mineração de Dados

Mineração de Dados

Mineração de Dados Classificação Não-Supervisionada: Tem por objetivo a separação das observações em sub-grupos ou classes. Segmentação é a criação de classes.

Mineração de Dados

Mineração de Dados Classificação Supervisionada: Determinar uma regra que possa ser usada para classificar, de forma otimizada, uma nova observação a uma classe já rotulada.

Mineração de Dados 1. Problema: identificar clientes que se interessariam em comprar CDB´s. 2. Dados: amostra de 150.000 clientes dos quais se mediram os seguintes atributos: idade, renda, variáveis demográficas, lucratividade, nível do depósito, freqüência de investimentos, ocasião das aplicações entre outras. 3. Extração de características : considerar apenas os atributos relacionados à recência, freqüência e fator monetário. 4. Modelo : Árvore de decisão

Mineração de Dados 5. Avaliação: A árvore explicou 80% do comportamento dos clientes 6. Implementação: Baseado na árvore foram enviados convites para parte da totalidade dos clientes do Banco propondo a aplicação em CDB´s 7. Retorno do Investimento: Gastou-se 30% a menos em divulgação porque ao contrário de outras promoções o contato só foi feito com parte dos clientes. A resposta foi 50% melhor do que em promoções anteriores.

Mineração de Dados

Mineração de Dados Análise de Associação: Determinar uma associação significativa entre diferentes observações.

Mineração de Dados

Mineração de Dados Predição: Prever o valor de um atributo em função das observações de outros atributos.

Mineração de textos O objetivo da Mineração de Textos é o processamento de informação textual, extraindo índices numéricos significativos a partir do texto e então tornar esta informação acessível para os programas disponíveis nos sistemas de mineração de dados.

Mineração de textos Podem ser analisadas palavras, agrupamentos de palavras, ou mesmo documentos entre si através das suas similaridades ou de suas relações com outras variáveis de interesse num projeto de mineração de textos.

Mineração de textos O objetivo na fase inicial do projeto é “transformar textos em números (índices significativos” , que podem então ser incorporados em outras análises tais como classificação supervisionada ou não supervisionada.

Mineração de textos Algumas aplicações típicas para mineração de textos: Análise de questões abertas em questionários. Processamento automático de mensagens, “e-mails”, etc... Busca de referências em uma coleção de artigos, motores de busca.

Mineração de textos Mais apropriado para um grande número de textos de tamanho médio ou pequeno. Não deve ser tratado como uma caixa preta. A intervenção do analista é necessária. Soluções não podem ser importadas de outra língua.

Mineração de textos Etapas em um Projeto de Mineração de Textos: Entrada dos textos Pré-processamento Cálculo de frequências Indexação Semântica Visualização Classificação Não Supervisionada(“clustering”) Classificação Supervisionada (“preditive data mining”)

Mineração de textos Entrada dos textos m1 Academia de Desenvolvimento Profissional e Organizacional Como evitar riscos com a TERCEIRIZAÇÃO 24 e 25 de Outubro de 2007 Elegemos uma equipe de profissionais capacitados para debater sobre os aspectosestratégicos, legais e burocráticos da terceirização. Saiba como sua empresa pode obter maior produtividade, com menor risco além de altos níveis de competitividade com a Terceirização. Serão abordados, entre outros, temas como: Como identificar uma terceirização ilícita A competitividade através do outsourcing A visão do judiciário com relação ao trabalho terceirizado Prevenindo riscos trabalhistas decorrentes da terceirização Como minimizar riscos na contratação e gestão de prestação de serviços de terceiros Participação Especial: GRAN SAPORE BRASIL SA CSN – COMPANHIA SIDERURGICA NACIONAL ADVB – ASSOCIAÇÃO DOS DIRIGENTES DE VENDAS E MARKETING DO BRASIL SOLICITE PROGRAMAÇÃO COMPLETA! Informe-se por e-mail ou ligue 11 3031-6777 Se deseja excluir seu email de nosso mailing, CLIQUE AQUI

Mineração de textos Entrada dos textos m2 Visitar Bordeaux, uma das regiões vinícolas mais importantes do mundo, já é um privilégio. Imagine ter a honra de participar de uma degustação com o Sommelier pessoal da Baronesa Philippine de Rothschild , tendo como pano de fundo o lendário Château Mouton Rothschild. Quer visitar um dos maiores museus da história do vinho e jantar no restaurante Saint Julien? Participando desta promoção você ganha cupons para concorrer a esta mágica viagem, com direito a acompanhante. Acompanhe o roteiro da viagem: Dia 1: Viagem a Paris Dia 2: Trem TGV com destino a Bordeaux. Dia 3: Visita ao Chatêau Mouton Rothschild Visita ao Museu, caves e salas de barricas; Degustação com o sommelier pessoal da Baronesa Philippina Almoço no Restaurante Saint Julien Dia4: Visita a Saint Emillion Dia5: Retorno a Paris / Brasil.

Mineração de textos Entrada dos textos m3 Cursos via Internet Calendario de cursos de Outubro de 2007 Curso Básico de Segurança em Instalações e Serviços em Eletricidade - NR 10 De: 20/10/2007 à 18/12/2007 Eletricistas, Eletrotécnicos, Operadores, Técnicos, Supervisores, Auxiliares de Manutenção, Mecânicos de Refrigeração, Engenheiros, Gerentes de Construção, Operação e Manutenção; Membros da CIPA, Técnicos e Engenheiros de Segurança e outros interessados responsáveis pela área elétrica e de segurança das instituições em geral. Proteger os trabalhadores que interagem com instalações elétricas, inclusive os que atuam em suas proximidades para fins de ...Saiba mais... Acompanhamento Os participantes terão o acompanhamento do engenheiro de segurança do trabalho habilitado, Sr. Benedito Lázaro Belut, durante todo o curso, para dirimir suas dúvidas. Formação do Tutor: ENGENHARIA DE AVALIAÇÕES - 2000 ENGENHARIA DE SEGURANÇA DO TRABALHO - 1995 ENGENHARIA ELÉTRICA UNESP – (FUNDAÇÃO EDUCACIONAL) – BAURU/SP - 1983 TECNOLOGIA DE SISTEMAS ELÉTRICOS – FUNDAÇÃO EDUCACIONAL – BAURU/SP - 1980 TÉCNICO ELETROTÉCNICA / COLÉGIO TÉCNICO INDUSTRIAL DE BOTUCATU/SP – 1976 37 Cursos de atualização áreas de: Elétrica, Informática, Segurança, Qualidade e Gestão. Investimento de R$ 666,00 por R$ 499,00 (quatrocentos e noventa e nove reais ).

Mineração de textos Textos agrupados em uma planilha

Mineração de textos Pré-processamento: 1) Exclusão de palavras e números, baseada no tamanho, nas letras inicial e final ou outros critérios. 2) Manutenção ou exclusão de palavras baseada em uma lista previamente definida. 3) Identificação de sinônimos e antônimos. 4) Determinação de radicais

Mineração de textos Pré-processamento: 1) Exclusão de palavras e números, baseada no tamanho, nas letras inicial e final ou outros critérios. Caracteres válidos: letras latinas e algarismos arábicos Tamanho mínimo da palavra, tamanho máximo, número máximo de consoantes, etc...

Mineração de textos Pré-processamento: 2) Manutenção de palavras (lista de inclusão) e eliminação de palavras (lista de exclusão). Há também uma lista de “multipalavras” para inclusão. Lista de inclusão: curso, treinamento, atualização, especialização... Lista de exclusão: o, de, para, até, ser, estarei, estarei, ter, haver... Lista de multipalavras: estado da arte, mineração de dados...

Mineração de textos Pré-processamento: 3) Identificação de sinônimos e antônimos. Lista de sinônimos: profissional=técnico=executivo=empregado Lista de antônimos: junior x senior

Lista de radicais: arquia- autarquia, monarquia Mineração de textos Pré-processamento: 4) Determinação de radicais Lista de radicais: arquia- autarquia, monarquia

Mineração de textos Cálculo de frequências: 1) Log-frequências 2) Frequências binárias 3) Frequências relativas a textos 4) Frequências de palavras 5) Frequências inversas

Mineração de textos Cálculo de frequências: 2) Frequências binárias

Mineração de textos Indexação Semântica: Decomposição em Valores Singulares

Mineração de textos Decomposição em Valores Singulares

Mineração de textos Decomposição em Valores Singulares

Mineração de textos Classificação Não Supervisionada

Mineração de textos Academia de Desenvolvimento Profissional e Organizacional Como evitar riscos com a TERCEIRIZAÇÃO 24 e 25 de Outubro de 2007 Elegemos uma equipe de profissionais capacitados para debater sobre os aspectosestratégicos, legais e burocráticos da terceirização. Saiba como sua empresa pode obter maior produtividade, com menor risco além de altos níveis de competitividade com a Terceirização. Serão abordados, entre outros, temas como: Como identificar uma terceirização ilícita A competitividade através do outsourcing A visão do judiciário com relação ao trabalho terceirizado Prevenindo riscos trabalhistas decorrentes da terceirização Como minimizar riscos na contratação e gestão de prestação de serviços de terceiros Participação Especial: GRAN SAPORE BRASIL SA CSN – COMPANHIA SIDERURGICA NACIONAL ADVB – ASSOCIAÇÃO DOS DIRIGENTES DE VENDAS E MARKETING DO BRASIL SOLICITE PROGRAMAÇÃO COMPLETA! Informe-se por e-mail ou ligue 11 3031-6777 Se deseja excluir seu email de nosso mailing, CLIQUE AQUI

Mineração de textos f1: deposit the cash and check in the bank f2: the river boat is on the bank f3: borrow based on credit f4: river boat floats up the river f5: boat is by the dock near the bank f6: with credit, I can borrow cash from the bank f7: boat floats by dock near the river bank f8: check the parade route to see the floats f9: along the parade route

Mineração de textos 1-2 do que 1-3

Mineração de textos