A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo.

Apresentações semelhantes


Apresentação em tema: "Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo."— Transcrição da apresentação:

1 Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo Reis

2 Agenda  Introdução  Conceitos básicos  Análise estatística  Análise de estrutura de comunidade  Conclusões 2

3 Jazz  Gíria de origem desconhecida  Chicago, 1915  Gênero musical  Mistura de tradições africanas e européias  Comunidades afro-americanas  Swing, espontaneidade, improviso, individualidade  Bebop, cool jazz, hard bop, modal jazz, free jazz, latin jazz, post bop, soul jazz, jazz funk, smooth jazz, acid jazz, nu jazz, jazz rap, jazzcore,... 3

4 Jazzistas  Miles Davis  Louis Armstrong  John Coltrane  Ella Fitzgerald  Sarah Vaughan  Billie Holiday  Dizzie Gillespie ... 4

5 Objetivo do Trabalho  Estudar a rede de colaboração entre jazzistas  A nível de indivíduos  A nível de bandas  Analisar a estrutura de comunidade  Analisar a topologia da rede de colaboração 5

6 Conceitos Básicos  Redes sociais  “A social network is a set of people or groups each of which has connections of some kind to some or all of the others” (Jan Rupnik)  Comunidade  “Communities appear in networks where vertices join together in tight groups that have few connection between them” (Gleiser et al.)  Grau – quantidade de conexões de um dado nó  Distância média – média das quantidades mínimas de conexões entre cada par de nó  Clustering – subgrupos em um conjunto grande de dados que possuem similaridade de alguma categoria 6

7 Rede de Jazz  Banco de dados The Red Hot Jazz Archive  198 bandas  1275 nomes de músicos  Entre 1912 e 1940  Considerações:  Sem distinção temporal  1 artista com vários nomes  Henry Allen, Red Allen e Henry Red Allen  Desconhecidos são classificados como unknown. 7

8 Distribuição de Músicos  Pico entre 5 e 10 músicos  Bandas com até 171 músicos 8

9 Distribuição de Músicos 9

10 Rede de Colaboração  De indivíduos  Cada vértice é um músico  Dois vértices estão conectados se eles tocaram na mesma banda  Distância média = 2.79  De bandas  Cada vértice é uma banda  Dois vértices estão conectados se eles têm um músico em comum  Distância média = 2.26 10

11 ANÁLISE ESTATÍSTICA

12 Análise Estatística  Pontos de vista  Microscópico – músicos individuais  De maior granulação - bandas  Distribuição cumulativa de grau – P(k)  Grau de clustering - C k  Grau médio de vizinhos mais próximos - K nn 12

13 Distribuição Cumulativa de Grau – P(k) 13  Uma forma de apresentar a Distribuição de Grau  Fração de nós que têm grau maior ou igual a k

14 P(k) de músicos  Decaimento devagar em formato de lei de potência  Para valores de k até 170 (tamanho da maior banda)  Rápido decaimento  Acima de 170 14 “Estes músicos funcionam como hubs e conectam muitas bandas ou eles simplesmente tocaram nas poucas bandas que incluíam o maior número de músicos?”

15 P(k) de bandas  Comportamento exponencial esticado  Sugere que as bandas são interconectadas por um número característico de links. 15

16 Grau Médio de Vizinhos Mais Próximos  Medida de correlação entre o grau de um nó e o grau dos seus vizinhos  Probabilidade condicional de que um nó de grau k se conecte a um nó de grau k’ 16

17 K nn - Indivíduos  K nn varia com k  Implica em correlação entre o grau dos vértices conectados  K nn cresce, quando k cresce  Assortative mixing? 17

18 K nn - Bandas  K nn flutua sobre um valor constante  Não existe correlação entre o grau dos vértices 18

19 Coeficiente de Clustering - C k  Fração dos vizinhos de um nó com grau k que estão conectados  Medida da probabilidade de que dois vizinhos de um nó também sejam vizinhos  Redes reais, particularmente redes sociais, tendem a ser altamente agrupadas 19

20 Coeficiente de Clustering - C k  Músicos são altamente agrupados  C k ≈ 1 para k até 30  Então decaimento devagar com oscilações  Bandas também são altamente agrupadas 20 Rede de músicosRede de bandas

21 Conclusões  Possível assortative mixing na rede de músicos  Nenhuma correlação na rede de bandas  Como saber se essa rede é realmente a rede de colaboração de músicos de jazz?  Pode existir melhores maneiras de construir essa rede? 21

22 ANÁLISE DE ESTRUTURA DE COMUNIDADE 22

23 Análise de Estrutura de Comunidade  Estrutura de comunidade  Propriedade de redes cujos nós se agrupam fortemente e cada grupo possui poucos laços entre si  Análise do comportamento dos indivíduos e grupos  Algoritmo de Girvan e Newman 23

24 Algoritmo de Girvan e Newman  Objetivo:  Detectar comunidades em uma rede social  Como:  Isolar comunidades altamente “clusterizadas”  Índices de centralidade  Importância relativa de uma aresta em um grafo 24

25 Algoritmo de Girvan e Newman  Edge betweenness  O número de caminhos mínimos entre pares de nós que atravessam aquela aresta 25 Aresta de mais alta edge betweenness

26 Algoritmo de Girvan e Newman Algoritmo Entrada: grafo G de uma rede de colaboração Saída: grafo G’ subdividido com comunidades isoladas 1:Para cada aresta A em grafo G faça Calcular edge betweenness de A 2:Remover a aresta M eb de G com maior edge betweenness 3:Para cada aresta B de G afetada pela remoção M eb faça Calcular edge betweenness de B 4:Repetir a partir do passo 2 até não sobrar arestas 26

27 Análise de Estrutura de Comunidade 27  Representação visual  Dendograma (árvore binária)  Bifurcações = Remoção de uma aresta  Folhas = Vértices do grafo

28 28 Communities in e-mail network of University Rivora i Virgili

29 Análise de Estrutura de Comunidade  Resultados  2 grandes ramos  Segregação racial  Assortative mixing 29 Músico Músico com k > 170 Raiz da árvore

30 Análise de Estrutura de Comunidade 30  Estrutura de comunidade simples  2 grandes comunidades  Segregação racial  Relação espacial  Local de gravação preferido

31 Análise de Estrutura de Comunidade  Análise Quantitativa  Distribuição cumulativa do tamanho da comunidade – P(s)  Comparação com rede de e-mails da Universitat Rovira i Virgili 31

32 Análise de Estrutura de Comunidade  Conclusões  Assortative mixing na rede de músicos  Segregação racial entre os músicos  Divisão em comunidades tem correlação geográfica com o lugar de gravação  Formato de P(s) similar a uma rede de e-mails 32 Garante que as redes criadas capturam ingredientes essenciais da rede de colaboração de músicos de jazz

33 Referências  Gleiser, P. e Danon, L., “Community Structure in Jazz”, Advances in Complex Systems, Vol. 6, n. 4, 2003.  Rupnik, J., “Finding Community Structure in Social Network Analysis – Overview”, Intl. Multiconference Information Society, Slovenia, 2006.  Pastor-Satorras, R., Vázquez, A. e Vespignani, A., “Dynamical and Correlation Properties of the Internet”, Physical Review Letters, Vol. 87, n. 25, 2001.  Guimerà, R. et al., “Self-similar community structure in organisations”, Physical Review E, Vol. 68, n. 6, 2006.  Girvan, M. e Newman, M. E. J., “Community structure in social and biological networks”, Proceedings of the National Academy of Sciences of the USA, Vol. 99, 2002. 33


Carregar ppt "Community Structure in Jazz de Pablo M. Gleiser e Leon Danon Tópicos Avançados em Inteligência Artificial Prof. Ricardo Prudêncio apresentado por Bernardo."

Apresentações semelhantes


Anúncios Google