D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.

Slides:



Advertisements
Apresentações semelhantes
Cortes (cut-sets)‏ 1.
Advertisements

Grafos Orientados (digrafos)
Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Antonio Dirceu Rabelo de Vasconcelos Filho
Teoria dos Grafos – Aula 2
Fluxo em Redes Prof. Ricardo R. Santos.
Experiments with Clustering as a Software Remodularization Method Nicolas Anquetil and Timothy C. Lethbridge University of Ottawa, Canada WCRE 1999:
Grafos – Parte 2 Projeto e Análise de Algoritmos Aline Vasconcelos
Cortes (cut-sets)‏ 2010/2 Teoria dos Grafos (INF 5037/INF2781)‏ 1.
Percursos em um grafo 2010/1 Teoria dos Grafos (INF 5037/INF2781)
Conectividade e Separabilidade
10º CAPÍTULO Segmentação de imagem.
Grafos Grafo G = (V, E) V — conjunto de vértices
Pesquisa em profundidade
Conexidade e Conectividade
Prof. M.Sc. Fábio Francisco da Costa Fontes Abril
Teoria dos Grafos – Aula 3 Árvores
Teoria dos Grafos Loana T. Nogueira Aula 5.
Árvores.
Árvore Geradora de Peso Mínimo
Pesquisa Operacional - Profa Úrsula L. F. Ribeiro
José Augusto Baranauskas
INF 1771 – Inteligência Artificial
Grafos Msc. Cintia Carvalho Oliveira Doutoranda em Computação – UFU
Detecção de Comunidades
Baseado em: The Algorithm Design Manual Steven S. Skiena
Algoritmos em Grafos.
Algoritmos em Grafos Conceitos principais Prof. André Renato
Grafos Árvores Geradoras.
CLUSTERING: UMA REVISÃO AOS ALGORITMOS BÁSICOS
Análise de Centralidade
Link Mining Víctor Medeiros.
Aprendizagem de Máquina - Agrupamento
Finding and Evaluating Community Structure in Networks
Predição de Relacionamentos
JUNG Daniel Brito.
Agrupamentos / Clustering
R ESOLUÇÃO DE E NTIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Análise de Redes Complexas – Conceitos e Propriedades Básicas
D IFUSÃO EM REDES COMPLEXAS Ricardo Prudêncio. W ORD - OF - MOUTH Opinião PúblicaAdoção de Inovações Marketing e Propaganda Brand Awareness Informação.
Exercícios PAA- Grafos
K-Means / Clustering.
Segmentação de Imagens
Operações com grafos União Exemplo
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Aprendizagem de Máquina - Agrupamento Prof. Sérgio Queiroz Slides inicialmente preparados pelo Prof. Ricardo Prudêncio, aos quais foram feitas modificações.
Análise de Redes Complexas – Conceitos e Propriedades Básicas
C LASSIFICAÇÃO DE N ÓS Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Conexidade 1.
Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
Aprendizado não-supervisionado
Msc. Daniele Carvalho Oliveira
Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo.
Link Prediction Problem for Social Networks
M INERAÇÃO DE R ELACIONAMENTOS - L INK M INING Ricardo Prudêncio.
Recuperação Inteligente de Informação
Análise de Centralidade
Tópicos Avançados em Agentes Inteligentes Análise e Mineração de Redes Complexas Ricardo Prudêncio –
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Agrupamento Camilo Daleles Rennó
Mecanismo de sugestão e processo de caracterização de redes sociais
Mineração de Grafos e Predição de Links
REDES COMPLEXAS Rafael Dahis Engenharia de Computação e Informação UFRJ Redes de Computadores II – 2009/2 Professores: Luis Henrique Otto.
DETECÇÃO DE COMUNIDADES TAIA
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção
Redes Sociais e Sistemas Multiagentes
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise.
Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.
Exercícios de clustering
Transcrição da apresentação:

D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio

L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós Classificação de Nós Detecção de Grupos Resolução de Entidades Predição de Links Descoberta de Sub-Grafos Classificação de Grafos Modelos Geradores

I NTRODUÇÃO Grupos coesos ou comunidades são estruturas comuns em redes sociais Comunidade Subconjuntos de vértices com ligações fortes dentro do grupo e ligações fracas fora do grupo Grupos formados por afinidade ou por interesses comuns

I NTRODUÇÃO Relacionamento forte intra-grupo Relacionamento fraco inter-grupo

I NTRODUÇÃO Formação de grupos por difusão Relacionamentos em comum Crescimento rápido, longevidade baixa

I NTRODUÇÃO Formação de grupos por não-difusão Interesses ou fatores externos comuns Crescimento lento, longevidade alta

I NTRODUÇÃO Uma vez formados os grupos, como identificá-los de forma automática? Técnicas de detecção de comunidades

D ETECÇÃO DE GRUPOS - A PLICAÇÕES Visualização de dados relacionais E.g., Touchgraph Segmentação de mercado E.g., redes de telefonia Identificação de grupos funcionais de proteínas e genes

D ETECÇÃO DE GRUPOS - A PLICAÇÕES Visualização de redes com grande número de nós Transformação Nós = grupos Arestas = relacionamentos inter-grupo

D ETECÇÃO DE C OMUNIDADES Métodos Tradicionais - Clustering Hierárquico Baseado na similaridade entre vértices E.g., pesos por vizinhos em comum, número de caminhos,... Agrupa os vértices de acordo com maiores similaridades Estrutura de comunidades resultante pode ser representada por uma árvore ou dendograma

D ETECÇÃO DE C OMUNIDADES Dendograma

A LGORITMOS H IERÁRQUICOS A GLOMERATIVOS Passo 1: Inicie alocando cada nó em um cluster diferente; Passo 2: Selecionar o par de clusters mais similares entre si e os agrupe em um cluster mais geral; Passo 3: Repita o passo 2 até a verificação de um critério de parada e.g., até que todos os nós sejam agrupados em um único cluster

A LGORITMOS H IERÁRQUICOS A GLOMERATIVOS Algoritmos variam conforme a maneira de medir similaridade entre dois clusters Single-Link : definida como a máxima similaridade entre os membros dos clusters Complete-Link : definida como a mínima similaridade entre os membros dos clusters Average-Link : definida como a média da similaridade entre os membros dos clusters

D ETECÇÃO DE C OMUNIDADE Métodos Tradicionais Possuem resultados razoáveis Falha Vértices periféricos ficam fora da comunidade a qual deveriam pertencer

M ÉTODO DE G IRVAN -N EWMAN Usa índices de centralidade para encontrar fronteiras entre as comunidade

M ÉTODO DE G IRVAN -N EWMAN Adaptação da intermediação para arestas Mede a frequência com que uma dada aresta aparece no menor caminho entre dois nós quaisquer Potencial para conectar comunidades diferentes Eliminar arestas de alta intermediação pode ter o efeito de desconectar a rede

M ÉTODO DE G IRVAN -N EWMAN Algoritmo 1. Calcula-se o grau de intermediação de cada aresta da rede 2. Remove-se a aresta com maior grau de intermediação 3. Verifica-se a formação de grupos desconectados 4. Calcula-se o grau de intermediação de todas as arestas afetadas pela remoção 5. Volta para o passo 2 até que não reste nenhuma aresta

M ÉTODO DE G IRVAN -N EWMAN G1 G2 G1 G2 Dendograma

M ÉTODO DE G IRVAN -N EWMAN - E XPERIMENTOS Zacharys Karate Club Rede de amizade Clube que foi divido após disputa entre o administrador e instrutor

M ÉTODO DE G IRVAN -N EWMAN - E XPERIMENTOS

Dendograma gerado

M ÉTODO DE G IRVAN -N EWMAN - E XPERIMENTOS Dendograma gerado a partir do método tradicional

M ÉTODO DE G IRVAN -N EWMAN Critério de parada: qual o número ideal de grupos? Ou seja: quando parar de eliminar arestas Para cada nível do dendograma calcular a modularidade da rede

M ÉTODO DE G IRVAN -N EWMAN Modularidade: Dada uma estrutura de K comunidades Defina uma matriz E de tamanho K x K e(i,j) corresponde a fração de arestas que ligam nós do grupo (i) aos nós do grupo (j)

M ÉTODO DE G IRVAN -N EWMAN Modularidade: Conectividade intra-cluster Conectividade inter-cluster

M ÉTODO DE G IRVAN -N EWMAN

Observação: Resultados variam dependendo da aplicação da medida de centralidade de arestas (a) Shortest path (b) Ramdom walk (c) Shortest path – sem recálculo M ÉTODO DE G IRVAN -N EWMAN

(a)(c)(b) M ÉTODO DE G IRVAN -N EWMAN

A PLICAÇÃO - T OUCH G RAPH

C ONCLUSÃO Diversidade de métodos Técnicas hierárquicas divisivas e aglomerativas Particionamento de grafos Otimização da modularidade Greedy search, têmpera simulada, algoritmos genéticos,... Otimização multi-objetivo...

R EFERÊNCIAS M. Girvan and M. E. J. Newman, Community structure in social and biological networks PNAS (12) S. Fortunato, Community detection in graphs, Physics Report, 2010