Link Mining Víctor Medeiros.

Slides:



Advertisements
Apresentações semelhantes
Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Advertisements

Transmissão de pacotes
Administração de Sistemas de Informação
INTELIGÊNGIA COMPUTACIONAL
Felipe Carvalho – UFES 2009/2
ATSI ExtendingAndFormalizingTheFrameworkForInormati onStyleArchitecture Alunos: Manuel Mendes- nº49703 Francisco Silva – nº51298 Cristina Fraga- nº51383.
HISTÓRICO E ORIGEM DOS GRAFOS
Apresentação da Monografia
Peer to Peer Referência:
Aplicação de XML Web Semântica Tópicos Avançados em Bancos de Dados II
Universidade Federal do Paraná
Árvores.
Preparação Básica Pyle, D. Data preparation for Data Mining Capítulo 4.
Mineração de Dados ou Descoberta de conhecimento em BDs
GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.
Grafos – Parte 1 Projeto e Análise de Algoritmos Aline Vasconcelos
Introdução a Teoria da Classificação
Árvore Geradora de Peso Mínimo
O processo de coletar os requisitos (escopo do cliente)
ESTRUTURA DE COMUNICAÇÃO DE DADOS
Competência: Compreender as métricas de Software
INF 1771 – Inteligência Artificial
Grafos Msc. Cintia Carvalho Oliveira Doutoranda em Computação – UFU
Sistemas de Informação e Gestão
Detecção de Comunidades
Formas de representação e manipulação básica
Data Warehouse & Data Mining
Aprendizagem de Máquina - Agrupamento
Predição de Relacionamentos
D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Dayvid Victor Rodrigues de Oliveira Guilherme Ramalho Magalhães
DATA MINING (MINERAÇÃO DE DADOS)
1 Descoberta de Conhecimento em Bases de Dados por Algoritmos Genéticos Prof. Marco Aurélio C. Pacheco.
K-Means / Clustering.
Arquitetura de computadores
O problema do emparelhamento máximo
Capacidades do Data Warehouse
TI em Foco Grupo: Tiago Albuquerque, Werbert Sena.
Marcílio C. P. de Souto DIMAp/UFRN
A abordagem de banco de dados para gerenciamento de dados
Superintendente de Produtos e Serviços
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Filtragem Colaborativa
C LASSIFICAÇÃO DE N ÓS Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
INTRODUÇÃO À WEB SEMÂNTICA E À ANÁLISE DE REDES SOCIAIS
Msc. Daniele Carvalho Oliveira
Link Prediction Problem for Social Networks
Mineração de Dados: Classificação e Predição
M INERAÇÃO DE R ELACIONAMENTOS - L INK M INING Ricardo Prudêncio.
LINK MINING Rafael Santos. Roteiro  Contexto  Data mining e Link mining  Tarefas:  Relacionadas a Objetos Ranking de objetos baseado em links Classificação.
Gestão da Tecnologia da Informação
SISTEMAS DE APOIO À DECISÃO - SAD
Filtragem de Informação
Mineração de Dados: Introdução
Redes Complexas Silvia Benza Bareiro
Tópicos Avançados em Agentes Inteligentes Análise e Mineração de Redes Complexas Ricardo Prudêncio –
Mecanismo de sugestão e processo de caracterização de redes sociais
Universidade Federal do Paraná
Projetos de Pesquisa Adriano C. M. Pereira / 21-Dez-2009.
Mineração de Grafos e Predição de Links
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Aplicações em Redes Neurais Artificiais De acordo com Turbam, McLean e Wetherbe (2004), “a computação neural também pode ser combinada com outros sistemas.
REDES COMPLEXAS Rafael Dahis Engenharia de Computação e Informação UFRJ Redes de Computadores II – 2009/2 Professores: Luis Henrique Otto.
Prof. Gabriela LottaPMCS Apresentação da disciplina e introdução Problemas Metodológicos em Ciências Sociais.
Aprendizado por Indução
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais – parte I Prof. Dalton Martins Gestão da Informação Universidade.
Curso de verão Data Mining Web Mining. O que é Web Mining?  Web Mining é o uso de técnicas de data mining para descobrir e extrair automaticamente informações.
UNIVERSIDADE ESTADUAL PAULISTA “Júlio de Mesquita Filho” Faculdade de Filosofia e Ciências – Campus de Marília Universidade Aberta à Terceira Idade Aula19/11-
Transcrição da apresentação:

Link Mining Víctor Medeiros

Referência Link Mining: A Survey Lise Getoor , Christopher P. Diehl, “Link mining: a survey”, ACM SIGKDD Explorations Newsletter, v.7 n.2, p.3-12, December 2005

Agenda Data Mining Link Mining Tarefas Desafios de Link Mining relacionadas a Vértices relacionadas a Arestas relacionadas a Grafos Desafios de Link Mining

Agenda Data Mining Link Mining Tarefas Desafios de Link Mining relacionadas a Vértices relacionadas a Arestas relacionadas a Grafos Desafios de Link Mining Ideia inicial: Explicar brevemente o que é Data Mining, colocando um exemplo de vários registros de pessoas com informações pessoais com o objetivo de identificar quem são os líderes (tarefa que futuramente será melhor executada considerando-se os links, no Link Mining)

2009: 6,8 bilhões de humanos 2006: 161 bilhões Gigabytes

Como extrair algo útil de tanta informação?

Data Mining Analisar dados de forma automática Mineração de dados Classificar Resumir Descobrir e categorizar padrões Descobrir anomalias

Data Mining Formadores de opinião? Nome: Fulano Idade: 23 anos Sexo: Masculino Interesses: ... Escolaridade: 3º grau ... Nome: Cicrana Idade: 17 anos Sexo: Feminino Interesses: ... Escolaridade: 2º grau ...

Data Mining Formadores de opinião?

Agenda Data Mining Link Mining Tarefas Desafios de Link Mining relacionadas a Vértices relacionadas a Arestas relacionadas a Grafos Desafios de Link Mining Ideia inicial: - Começar mostrando o mesmo conjunto de dados anterior, mas com links de amizades entre as entidades, mostrando uma entidade que anteriormente foi classificada como não-líder com muitas conexões, mostrando que a abordagem anterior estava errada. - Falar da crescente quantidade atual de registros que são melhores representados por grafos (objetos relacionados)

Link Mining Formadores de opinião?

Link Mining Informação Informações representadas por grafos Relações entre as entidades como informações relevantes: Comprador – Vendedor Sintoma - Doença Links em páginas da WEB Amizades Interesses similares etc... Informação

Link Mining Data Mining: Link Mining: Busca extrair conhecimento útil dos dados Eficiente ao analisar entidades independentes Comete muitos erros quando trata entidades interdependentes como sendo independentes Link Mining: Objetivos similares a Data Mining Eficiente ao analisar entidades interdependentes Explora as informações representadas pelas Relações (ou Links)

Link Mining Link Mining é a intersecção de: Análise de links Mineração da Web e de Hipertextos Aprendizagem relacional Programação em Lógica Indutiva Mineração de grafos

Link Mining Análise de Redes Sociais (SNA) Analise das relações e trocas de informações entre pessoas, grupos, organizações, computadores ou quaisquer entidades capazes de processar informações e/ou conhecimento Intimamente relacionada com Link Mining Daremos um foco nessa área de aplicação

Agenda Data Mining Link Mining Tarefas Desafios de Link Mining relacionadas a Vértices relacionadas a Arestas relacionadas a Grafos Desafios de Link Mining

Tarefas Vértices Arestas Grafos Podem ser baseadas em: Explicar cada uma e mostrar uma técnica de cada, que seja a mais comum (mais usada) e associada a SNA.

Tarefas Relacionadas a Vértices ou Objetos Ranking de Objetos baseado em links

Ranking de Objetos baseado em links Ordenar/priorizar os objetos de um grafo Em SNA, ordenação com base na importância (ou centralidade) A definição da centralidade depende do que é considerado “importante” para a aplicação Centralidade: Medição: Simples x Complexa Uso ou não de informações adicionais Foco global ou relativo

Ranking de Objetos baseado em links Tarefa exemplo: Ordenar os amigos de uma pessoa em uma rede social pela sua “importância”, para exibir informações sobre eles em um mural Exemplo: Newsfeed do Facebook Centralidade: Interesses em comum, relativamente à pessoa dona do mural, com informações extras disponíveis para análise

Tarefas Relacionadas a Vértices ou Objetos Ranking de Objetos baseado em links Classificação de Objetos baseada em links

Classificação de Objetos baseada em links Classificar os vértices em categorias pré- definidas Dois vértices relacionados tendem a apresentar correlação na classificação Bons resultados com algoritmos de classificação coletiva

Classificação de Objetos baseada em links Tarefa exemplo: Identificar indivíduos como parte de uma rede terrorista com base em relações observadas Exemplo: Análise da Al Qaeda O que se procura: Relações específicas com outros membros da organização podem ser indícios de participação

Tarefas Relacionadas a Vértices ou Objetos Ranking de Objetos baseado em links Classificação de Objetos baseada em links Detecção de grupos

Detecção de grupos Identificar grupos (clusters) de vértices com características em comum Em SNA, duas principais tarefas: Identificar papéis Identificar partições de grupos

Detecção de grupos Tarefa exemplo: Exemplo: O que se encontrou: Identificar papéis em redes de microblogging Exemplo: Análise do Twitter O que se encontrou: Um grupo seleto de pessoas altamente conectados, com muitos seguidores

Tarefas Relacionadas a Vértices ou Objetos Ranking de Objetos baseado em links Classificação de Objetos baseada em links Detecção de grupos Relacionadas a Arestas ou Links Predição de Links

Predição de Links Predição de links: Que não foram registrados Que surgirão no futuro A maioria dos grafos interessantes para essa aplicação são esparsos Melhores resultados com modelos de inferência que englobam todo grafo Alto custo -> métodos de aproximação

Predição de Links Tarefa exemplo: Exemplo: Busca: Prever relações de amizade entre membros de uma rede social Exemplo: Friend Finder do Facebook Busca: Relações existentes mas não observadas

Predição de Links Tarefa exemplo: Exemplo: Busca: Prever compra de novos produtos com base no histórico de compras Exemplo: Recomendações do Amazon Busca: Relações ainda não existentes (nesse caso, de compra de produtos)

Tarefas Relacionadas a Vértices ou Objetos Ranking de Objetos baseado em links Classificação de Objetos baseada em links Detecção de grupos Relacionadas a Arestas ou Links Predição de Links Relacionadas a Grafos Descoberta de Subgrafos

Descoberta de Subgrafos Descobrir padrões interessantes e/ou comuns em um conjunto de grafos Tipicamente, duas fases: Geração de padrões candidatos Busca desses candidatos no grafo Outras abordagens costumam ser otimizações dessas ideia Pode ser o primeiro passo para uma tarefa de classificação de grafos

Descoberta de Subgrafos Tarefa exemplo: Encontrar padrões em um certo tipo de relação humana, como relações românticas

Agenda Data Mining Link Mining Tarefas Desafios de Link Mining relacionadas a Vértices relacionadas a Arestas relacionadas a Grafos Desafios de Link Mining

Desafios de Link Mining Crescente quantidade de dados representados como grafos Necessidade de resolver tarefas mais complicas que essas apresentadas Dar um foco aqui em redes sociais. Se ver algo relacionado a uma técnica passada, poderia falar junto com o anterior. [possivelmente, tira isso daqui de vez]

Desafios de Link Mining Ex: Dinamismo das necessidades do usuário

Desafios de Link Mining Ex2: Grafos em constante mudança

Desafios de Link Mining Ex3: Combinar técnicas Produtos Clientes 1 2 3 4 5 6

Desafios de Link Mining Ex3: Combinar técnicas Produtos Clientes 1 2 3 4 5 Detectar grupos 6

Desafios de Link Mining Ex3: Combinar técnicas Idosos Produtos Clientes 1 Mulheres 14-17 anos 2 3 4 Classificar Objetos 5 Homens 18-26 anos 6

Desafios de Link Mining Ex3: Combinar técnicas Idosos Produtos Clientes 1 Mulheres 14-17 anos 2 3 4 Previsão de links 5 Homens 18-26 anos 6

Desafios de Link Mining Ex4: Análise de grafos gigantescos

Desafios de Link Mining Ex: Dinamismo das necessidades do usuário Ex2: Grafos em constante mudança Ex3: Combinar técnicas Ex4: Análise de grafos gigantescos E muitos outros...

? Dúvidas

Link Mining Víctor Medeiros