Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo.

Slides:



Advertisements
Apresentações semelhantes
Árvores 2010/1 Teoria dos Grafos (INF 5037/INF2781)
Advertisements

Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Fluxo em Redes Prof. Ricardo R. Santos.
Exercícios PAA- Grafos
Exercícios PAA- Grafos
Pontes Seja (G) o número de componentes conexas de G. Uma ponte é uma aresta a tal que (G - a) > (G)
UFES CC/EC/Mestrado Teoria dos Grafos Árvores. UFES CC/EC/Mestrado Teoria dos Grafos Árvores Grafo Acíclico: não possui ciclos.
Algoritmo polinomial para geração de uma Árvore Geradora Mínima
Pesquisa em profundidade
Prof. M.Sc. Fábio Francisco da Costa Fontes Abril
2002 LCG/UFRJ. All rights reserved. 1 Localização no Plano Claudio Esperança Paulo Roma.
Grafos – Parte 1 Projeto e Análise de Algoritmos Aline Vasconcelos
SEMINÁRIO DE ALGORITMOS
Árvore Geradora de Peso Mínimo
Swarm Intelligence (Inteligência Coletiva)
Ronaldo Celso Messias Correia –
Pesquisa Operacional - Profa Úrsula L. F. Ribeiro
Ordenação Topológica Luis Raphael Mareze Marcus Vinicius Lemos Chagas
Modelos de Redes Complexas
Kraemer CCNA Exploration (Protocolos e Conceitos de Roteamento) Protocolos de Roteamento link-state.
Detecção de Comunidades
Algoritmos em Grafos.
Algoritmos em Grafos Conceitos principais Prof. André Renato
Alexandre Xavier Falcão & David Menotti
Teoria dos Grafos Caminhos e Noção de Grafos com pesos
Análise de Centralidade
Aprendizagem de Máquina - Agrupamento
Finding and Evaluating Community Structure in Networks
Predição de Relacionamentos
D ETECÇÃO DE C OMUNIDADES Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Modelos de Redes Ricardo Prudêncio.
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Análise de Redes Complexas – Conceitos e Propriedades Básicas
- Mais importante meio de comunicação, porém: Recebidos e enviados desordenadamente Prejuízo de US$650 bilhões Sistemas que controlem a sobrecarga.
Seminário LAND A Preferential Attachment Model for Tree Construction in P2P Video Streaming Marcio N. Miranda - Daniel R. Figueiredo Submetido ao First.
Exercícios PAA- Grafos
K-Means / Clustering.
Universidade Católica de Pelotas Mestrado em Ciência da Computação
Redes de Transporte Aéreo João Victor Wanderley Ramos Rafael Barbosa Gonçalves {jvwr, cin.ufpe.br Tópicos Avançados em Inteligência Artificial.
Avaliação de Clusteres Parte II
Problema do menor Caminho
SBRC Formação de clusters em redes P2P por similaridade entre os nós Fabrício Murai Daniel Figueiredo Programa de Eng. e Sist. de Comp. COPPE/UFRJ.
Análise de Redes Complexas – Conceitos e Propriedades Básicas
Aula 8. Classificação Não Supervisonada por Regiões
C LASSIFICAÇÃO DE N ÓS Ricardo Prudêncio. L INK M INING - T AREFAS Relacionadas a Objetos Relacionadas a Arestas Relacionadas a Grafos Ranking de Nós.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
Aprendizado não-supervisionado
Msc. Daniele Carvalho Oliveira
Link Prediction Problem for Social Networks
Recuperação Inteligente de Informação
On Topology Construction in Layered P2P Live Streaming Networks Construção de topologia em redes P2P baseadas em camadas para streaming ao vivo Runzhi.
Probabilidade e Estatística para Avaliação de Desempenho
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Algoritmos FPT para o Problema da k-Cobertura por Vértices
Redes Complexas Silvia Benza Bareiro
Análise de Centralidade
Mecanismo de sugestão e processo de caracterização de redes sociais
Distribuição de Mídia Contínua Localizaçao e Seleçao de Servidores e Roteamento Jussara M. Almeida Junho 2004.
Redes e Manutenção de Computadores
Mineração de Grafos e Predição de Links
REDES COMPLEXAS Rafael Dahis Engenharia de Computação e Informação UFRJ Redes de Computadores II – 2009/2 Professores: Luis Henrique Otto.
Redes Complexas Carlos Felipe Saraiva Pinheiro
DETECÇÃO DE COMUNIDADES TAIA
Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção
Laboratório de Mídias Sociais
Redes Sociais e Sistemas Multiagentes
Spatial analysis of anthropogenic disturbance regimes and roadside shrubs in a fragmented agricultural landscape Peter G.Spooner; Ian D. Lunt; Sue V. Briggs.
Introdução a Análise de Redes Sociais de Informação
Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.
Transcrição da apresentação:

Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo Reis

Agenda  Introdução  Conceitos básicos  Análise estatística  Análise de estrutura de comunidade  Conclusões 2

Jazz  Gíria de origem desconhecida  Chicago, 1915  Gênero musical  Mistura de tradições africanas e européias  Comunidades afro-americanas  Swing, espontaneidade, improviso, individualidade  Bebop, cool jazz, hard bop, modal jazz, free jazz, latin jazz, post bop, soul jazz, jazz funk, smooth jazz, acid jazz, nu jazz, jazz rap, jazzcore,... 3

Jazzistas  Miles Davis  Louis Armstrong  John Coltrane  Ella Fitzgerald  Sarah Vaughan  Billie Holiday  Dizzie Gillespie ... 4

Objetivo do Trabalho  Estudar a rede de colaboração entre jazzistas  A nível de indivíduos  A nível de bandas  Analisar a estrutura de comunidade  Analisar a topologia da rede de colaboração 5

Conceitos Básicos  Redes sociais  “A social network is a set of people or groups each of which has connections of some kind to some or all of the others” (Jan Rupnik)  Comunidade  “Communities appear in networks where vertices join together in tight groups that have few connection between them” (Gleiser et al.)  Grau – quantidade de conexões de um dado nó  Distância média – média das quantidades mínimas de conexões entre cada par de nó  Clustering – subgrupos em um conjunto grande de dados que possuem similaridade de alguma categoria 6

Rede de Jazz  Banco de dados The Red Hot Jazz Archive  198 bandas  1275 nomes de músicos  Entre 1912 e 1940  Considerações:  Sem distinção temporal  1 artista com vários nomes  Henry Allen, Red Allen e Henry Red Allen  Desconhecidos são classificados como unknown. 7

Distribuição de Músicos  Pico entre 5 e 10 músicos  Bandas com até 171 músicos 8

Distribuição de Músicos 9

Rede de Colaboração  De indivíduos  Cada vértice é um músico  Dois vértices estão conectados se eles tocaram na mesma banda  Distância média = 2.79  De bandas  Cada vértice é uma banda  Dois vértices estão conectados se eles têm um músico em comum  Distância média =

ANÁLISE ESTATÍSTICA

Análise Estatística  Pontos de vista  Microscópico – músicos individuais  De maior granulação - bandas  Distribuição cumulativa de grau – P(k)  Grau de clustering - C k  Grau médio de vizinhos mais próximos - K nn 12

Distribuição Cumulativa de Grau – P(k) 13  Uma forma de apresentar a Distribuição de Grau  Fração de nós que têm grau maior ou igual a k

P(k) de músicos  Decaimento devagar em formato de lei de potência  Para valores de k até 170 (tamanho da maior banda)  Rápido decaimento  Acima de “Estes músicos funcionam como hubs e conectam muitas bandas ou eles simplesmente tocaram nas poucas bandas que incluíam o maior número de músicos?”

P(k) de bandas  Comportamento exponencial esticado  Sugere que as bandas são interconectadas por um número característico de links. 15

Grau Médio de Vizinhos Mais Próximos  Medida de correlação entre o grau de um nó e o grau dos seus vizinhos  Probabilidade condicional de que um nó de grau k se conecte a um nó de grau k’ 16

K nn - Indivíduos  K nn varia com k  Implica em correlação entre o grau dos vértices conectados  K nn cresce, quando k cresce  Assortative mixing? 17

K nn - Bandas  K nn flutua sobre um valor constante  Não existe correlação entre o grau dos vértices 18

Coeficiente de Clustering - C k  Fração dos vizinhos de um nó com grau k que estão conectados  Medida da probabilidade de que dois vizinhos de um nó também sejam vizinhos  Redes reais, particularmente redes sociais, tendem a ser altamente agrupadas 19

Coeficiente de Clustering - C k  Músicos são altamente agrupados  C k ≈ 1 para k até 30  Então decaimento devagar com oscilações  Bandas também são altamente agrupadas 20 Rede de músicosRede de bandas

Conclusões  Possível assortative mixing na rede de músicos  Nenhuma correlação na rede de bandas  Como saber se essa rede é realmente a rede de colaboração de músicos de jazz?  Pode existir melhores maneiras de construir essa rede? 21

ANÁLISE DE ESTRUTURA DE COMUNIDADE 22

Análise de Estrutura de Comunidade  Estrutura de comunidade  Propriedade de redes cujos nós se agrupam fortemente e cada grupo possui poucos laços entre si  Análise do comportamento dos indivíduos e grupos  Algoritmo de Girvan e Newman 23

Algoritmo de Girvan e Newman  Objetivo:  Detectar comunidades em uma rede social  Como:  Isolar comunidades altamente “clusterizadas”  Índices de centralidade  Importância relativa de uma aresta em um grafo 24

Algoritmo de Girvan e Newman  Edge betweenness  O número de caminhos mínimos entre pares de nós que atravessam aquela aresta 25 Aresta de mais alta edge betweenness

Algoritmo de Girvan e Newman Algoritmo Entrada: grafo G de uma rede de colaboração Saída: grafo G’ subdividido com comunidades isoladas 1:Para cada aresta A em grafo G faça Calcular edge betweenness de A 2:Remover a aresta M eb de G com maior edge betweenness 3:Para cada aresta B de G afetada pela remoção M eb faça Calcular edge betweenness de B 4:Repetir a partir do passo 2 até não sobrar arestas 26

Análise de Estrutura de Comunidade 27  Representação visual  Dendograma (árvore binária)  Bifurcações = Remoção de uma aresta  Folhas = Vértices do grafo

28 Communities in network of University Rivora i Virgili

Análise de Estrutura de Comunidade  Resultados  2 grandes ramos  Segregação racial  Assortative mixing 29 Músico Músico com k > 170 Raiz da árvore

Análise de Estrutura de Comunidade 30  Estrutura de comunidade simples  2 grandes comunidades  Segregação racial  Relação espacial  Local de gravação preferido

Análise de Estrutura de Comunidade  Análise Quantitativa  Distribuição cumulativa do tamanho da comunidade – P(s)  Comparação com rede de s da Universitat Rovira i Virgili 31

Análise de Estrutura de Comunidade  Conclusões  Assortative mixing na rede de músicos  Segregação racial entre os músicos  Divisão em comunidades tem correlação geográfica com o lugar de gravação  Formato de P(s) similar a uma rede de s 32 Garante que as redes criadas capturam ingredientes essenciais da rede de colaboração de músicos de jazz

Referências  Gleiser, P. e Danon, L., “Community Structure in Jazz”, Advances in Complex Systems, Vol. 6, n. 4,  Rupnik, J., “Finding Community Structure in Social Network Analysis – Overview”, Intl. Multiconference Information Society, Slovenia,  Pastor-Satorras, R., Vázquez, A. e Vespignani, A., “Dynamical and Correlation Properties of the Internet”, Physical Review Letters, Vol. 87, n. 25,  Guimerà, R. et al., “Self-similar community structure in organisations”, Physical Review E, Vol. 68, n. 6,  Girvan, M. e Newman, M. E. J., “Community structure in social and biological networks”, Proceedings of the National Academy of Sciences of the USA, Vol. 99,