Detecção de Comunidades

Slides:



Advertisements
Apresentações semelhantes
Cortes (cut-sets)‏ 1.
Advertisements

Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Algoritmos em Grafos (Parte 2)
Antonio Dirceu Rabelo de Vasconcelos Filho
Grafos – Parte 2 Projeto e Análise de Algoritmos Aline Vasconcelos
Exercícios PAA- Grafos
Exercícios PAA- Grafos
Cortes (cut-sets)‏ 2010/2 Teoria dos Grafos (INF 5037/INF2781)‏ 1.
Conectividade e Separabilidade
Métodos para representação de estruturas hierárquicas
Pesquisa em profundidade
Conexidade e Conectividade
Prof. M.Sc. Fábio Francisco da Costa Fontes Abril
HISTÓRICO E ORIGEM DOS GRAFOS
ARQUITETURA DE COMPUTADORES II
PESQUISA – DISSERTAÇÃO COMPONENTES
Teoria dos Grafos – Aula 3 Árvores
2002 LCG/UFRJ. All rights reserved. 1 Localização no Plano Claudio Esperança Paulo Roma.
Introdução Redes LAN - abrangência: edifícios e campos.
Grafos – Parte 1 Projeto e Análise de Algoritmos Aline Vasconcelos
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Árvore Geradora Mínima
Grafos Msc. Cintia Carvalho Oliveira Doutoranda em Computação – UFU
Futebol: uma questão de tempo real? Sistemas de Tempo Real Hugo Santos (27621) Pedro Mónica (25330)
Baseado em: The Algorithm Design Manual Steven S. Skiena
Algoritmos em Grafos.
Para a comunicação em redes de computadores, muitas vezes, apenas um subconjunto das ligações disponíveis é utilizado para comunicar em qualquer tempo.
Algoritmos em Grafos Conceitos principais Prof. André Renato
5.3 Groupware e CSCW - Computer Supported Collaborative Work
Análise de Centralidade
Link Mining Víctor Medeiros.
Finding and Evaluating Community Structure in Networks
D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Modelos de Redes Ricardo Prudêncio.
Análise de Redes Complexas – Conceitos e Propriedades Básicas
Exercícios PAA- Grafos
Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, Embasamento Analítico.
Algorítmos e estrutura de dados III
Operações com grafos União Exemplo
Histórico, exemplos e problemas
O problema do emparelhamento máximo
Fábio de Oliveira Borges
Grafos Msc. Cintia Carvalho Oliveira Doutoranda em Computação – UFU
Disciplina – Teoria Sociológica II para CSO– UFSC 2011/2 Prof Juliana Grigoli.
Hyperlinks e o Desenvolvimento de Redes Sociais
TI em Foco Grupo: Tiago Albuquerque, Werbert Sena.
O Individualismo Metodológico
Análise de Redes Complexas – Conceitos e Propriedades Básicas
Topologia Comunicação de dados Escola Secundaria Sebastião da Gama
C LASSIFICAÇÃO DE N ÓS Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Conexidade 1.
Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo.
Link Prediction Problem for Social Networks
Redes Complexas Silvia Benza Bareiro
Análise de Centralidade
+ Diogo Ribeiro Glauber Ramos iGather: Refinamento de Buscas.
Mestrado em Informática
Mecanismo de sugestão e processo de caracterização de redes sociais
Celso C. Ribeiro Caroline T. Rocha
REDES COMPLEXAS Rafael Dahis Engenharia de Computação e Informação UFRJ Redes de Computadores II – 2009/2 Professores: Luis Henrique Otto.
DETECÇÃO DE COMUNIDADES TAIA
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção
 Prof. Miguel Gabriel Prazeres de Carvalho 1. 2 Redes Sociais GPS Para o correio. Para Viajantes. Pesquisas Biológicas. Distribuição de Tarefas. Recomendações.
Redes Sociais e Sistemas Multiagentes
Redes de Co-citação Wagner de Souza Rolim CIn – UFPE.
Introdução a Análise de Redes Sociais de Informação
Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.
Finding community structure in very large networks
Transcrição da apresentação:

Detecção de Comunidades Henrique Menezes Pedro Lopes

Roteiro Introdução Detecção de Comunidades Método Proposto Redes Geradas por Computador Redes Reais Estrutura de Comunidade Conhecida Estrutura de Comunidade Não Conhecida Demonstração Conclusão

Introdução Muitos sistemas tem a forma de rede Ex.: Redes sociais, redes de conhecimento, web, cadeias alimentares, redes metabólicas, etc. Pesquisadores têm focado em algumas propriedades que essas redes compartilham Efeito mundo pequeno Desvio a direita das distribuições de graus Clustering ou transitividade da rede

Introdução Outra propriedade comum a muitas redes Comunidade Estrutura da comunidade Comunidade Subconjuntos de vértices em que conexões vértice- vértice são densas, mas entre os subconjuntos as conexões são menos densas. Nós da rede estão unidos em grupos coeso, entre os quais existem apenas ligações mais frouxas. Estrutura de comunidade - (clustering*)

Introdução Método para detecção de comunidades Índices de centralidade para encontrar limites da comunidade

Introdução Aplicações práticas: Redes sociais: pode indicar grupos reais Redes de citação: artigos de um mesmo topico Redes metabólicas: ciclos e grupos funcionais Redes na Web: páginas sobre temas relacionados Ser capaz de identificar estas comunidades poderiam nos ajudar a entender e explorar as redes de forma mais eficaz

Detecção de Comunidades Método Tradicional Clustering hierárquico Baseado em pesos entre dois vértices Número de caminhos independentes de nós (node- independent) ou arestas (edge-indepentent) Número total de caminhos entre os vértices Agrupa os vértices, adicionando arestas de acordo com os pesos O grafo resultante pode ser representado por estrutura de árvore Primeiro calcula um peso Wi,j para cada par i,j de vértices na rede. Em seguinda, toma-se os n vértices na rede, sem arestas entre eles, e acrescenta as arestas entre pares, um por um, por ordem de seus pesos, começando com o par com o peso mais forte e progredindo para o mais fraco. Como as arestas são adicionadas, o grafico resultante mostra um conjunto aninhado de componentes e podem ser representados por meio de uma árvore

Detecção de Comunidades Árvore de clustering hierárquico (dendograma)

Detecção de Comunidade Método Tradicional Possui resultados razoáveis Falha Vértices periféricos ficam fora da comunidade a qual deveriam pertencer

Detecção de Comunidade Caso de falha

Método Proposto Intermediação de vértices B G F E Intermediação de vértices Medida de centralidade de um vértice Mede a frequência com que o nó aparece no menor caminho entre dois nós quaisquer Pontecial para conectar comunidades diferentes Eliminar nós de alta intermediação pode ter o efeito de desconectar a rede

Método Proposto Alta Intermediação (pontos críticos para disseminação)

Método Proposto Algoritmo Calcula-se o grau de intermediação de cada aresta da rede Remove-se a aresta com maior grau de intermediação Calcula-se o grau de intermediação de todas as arestas afetadas pela remoção Volta para o passo 2 até que não reste nenhuma aresta

Redes geradas por computador Parâmetros 128 vértices 4 comunidades 32 vértices por comunidade Grau médio z igual a 16 Procedimento Arestas inseridas aleatoriamente para cada par de vértices 𝑃 𝑖𝑛 - probabilidade de ligação com um vértice da mesma comunidade (intracommunity) 𝑃 𝑜𝑢𝑡 - probabilidade de ligação com um vértice de outra comunidade (intercommunity)

Redes geradas por computador

Redes Reais Estrutura de Comunidade Conhecida Zachary’s Karate Club Rede de amizade Clube que foi divido após disputa entre o administrador e instrutor Foi ignorado o grau de afinidade Administrador – 1 Instrutor - 34

Redes Reais Estrutura de Comunidade Conhecida

Redes Reais Estrutura de Comunidade Conhecida Dendograma gerado a partir do Proposto

Redes Reais Estrutura de Comunidade Conhecida Dendograma gerado a partir do Método Tradicional

Redes Reais Estrutura de Comunidade Conhecida Observações O algoritmo conseguiu detectar as comunidades formadas Previsão da evolução da rede Falha: O único caso de falha foi o nó 3

Redes Reais Estrutura de Comunidade Conhecida College Football Vértices: times de futebol americano da divisão I da liga do ano de 2000 Arestas: jogos realizados numa temporada Estrutura de comunidade Conferências formadas por 8 a 12 times Obs: Cada time tem mais jogos com time que pertence a mesma conferência em média Falar da distribuição de jogos entre conferências – não uniforme.

Redes Reais Estrutura de Comunidade Conhecida

Redes Reais Estrutura de Comunidade Conhecida

Redes Reais Estrutura de Comunidade Conhecida Observações Conferências identificadas com alta precisão Falha: A conferência Sunbelt foi separa em duas comunidades Motivo: A estrutuda da rede não corresponde a estrutura da comunidade Sunbelt realizou mais jogos com a conferência Western Athletic do que a própria conferência

Redes Reais Estrutura de Comunidade Não Conhecida Rede de Colaboração Vertices: 271 cientistas do Institute de Pesquisa de Santa Fé nos anos de 1999 e 2000 Arestas: co-autoria em artigos nos anos de 1999 e 2000 Grau médio = 5

Redes Reais Estrutura de Comunidade Não Conhecida Rede de Colaboração 118 vértices Maior Componente

Redes Reais Estrutura de Comunidade Não Conhecida Rede de Colaboração Observações Identificação de áreas de pesquisa Divisão de subáreas Interesse de pesquisa de membro dominante Interessante: agrupamento por metodologia Divisão primária correspondente às linhas de pesquis: formato dos vértices Divisão entre estudo de tráfego e economia subáreas: losangos. Estrutura Bastante coesa: círculos pretos. Interesse de um pesquisador influente dita comunidades Metodologia: agrupamento de Economia e Trafego pelo fato de serem Multiagente: interdisciplicariedade.

Redes Reais Estrutura de Comunidade Não Conhecida Teia Alimentar Vértices: 33 taxa mais proeminetes de Chesapeak Bay Espécies ou Gênero Grupos de espécies relacionadas Arestas: relação trófica entre vértices ligados Direção ignorada

Redes Reais Estrutura de Comunidade Não Conhecida Teia Alimentar

Redes Reais Estrutura de Comunidade Não Conhecida Teia Alimentar Observações Pelágicos vs Bênticos Ecossistemas razoavelmente independentes Bênticos relacionando com Pelágicos Nesse caso a divisão pode não ser apropriada Em cada grupo vários níveis tróficos observados Problema: teias alimentares são densas ou não possuem estruturas de comunidade Separação por profundidade: habitat Interessante, diferentemente do convencional, a clusterização é por habitat em vez de nível trófico. Densa: arestas quadrado vértices

Demonstração TouchGraph Aqui

Conclusão Verificamos os métodos de detecção de comunidade Clássico: núcleos fortementes conectados Proposto: intermediação de arestas Vimos que esses métodos são úteis na análise de redes e que o método proposto é superior ao clássico Várias melhorias podem ser realizadas ainda para método proposto Diversas aplicações podem ser realizadas a partir da detecção de comunidades

Referência [1] M. Girvan and M. E. J. Newman Community structure in social and biological networks PNAS 2002 99 (12) 7821-7826; doi:10.1073/pnas.122653799 [2] http://www.touchgraph.com/navigator

Dúvidas ?