A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

20 de agosto de 2007 Instituto de Física de São Carlos Francisco Aparecido Rodrigues Orientador: Luciano da Fontoura Costa Caracterização, classificação.

Apresentações semelhantes


Apresentação em tema: "20 de agosto de 2007 Instituto de Física de São Carlos Francisco Aparecido Rodrigues Orientador: Luciano da Fontoura Costa Caracterização, classificação."— Transcrição da apresentação:

1 20 de agosto de 2007 Instituto de Física de São Carlos Francisco Aparecido Rodrigues Orientador: Luciano da Fontoura Costa Caracterização, classificação e análise de redes complexas

2 SUMÁRIOSUMÁRIO

3 SUMÁRIOSUMÁRIO

4 SUMÁRIOSUMÁRIO

5 SUMÁRIOSUMÁRIO

6

7 Sete Pontes de Konigsberg - Leonhard Euler (1736) É possível atravessar todas as pontes passando-se apenas uma vez por cada uma delas? O início... INTRODUÇÃOINTRODUÇÃO Leonhard Euler

8 INTRODUÇÃOINTRODUÇÃO Redes Complexas X Teoria dos Grafos 1.A teoria das redes complexas está relacionada com a modelagem de redes reais. 2.As redes não são estáticas, mas evoluem com o tempo. 3.As redes podem ser consideradas como objetos topológicos para simulações.

9 Paul Erdös Paul Erdös ( ) N vértices são conectados aleatoriamente de acordo com uma probabilidade fixa p INTRODUÇÃOINTRODUÇÃO Grafos aleatórios de Erdös-Rényi ( 1960) Grafos aleatórios de Erdös-Rényi ( 1960) Distribuição de Poisson

10 Watts and Strogatz, Nature 393, 440 (1998) Clustering: Indica a freqüência da ocorrência de ciclos de ordem 3. INTRODUÇÃOINTRODUÇÃO Modelo de Watts-Strogatz ( 1998 )

11 Vértices: documentos html Links: URL links R. Albert, H. Jeong, A-L Barabasi, Nature, (1999) P(k) ~ k - Albert-LazloBarabási INTRODUÇÃOINTRODUÇÃO Teia Mundial ( 1999 )

12 M Faloutsos, P Faloutsos, C Faloutsos - Comput. Commun. Rev, 1999 Vértices: computadore,roteadores, sistemas autônomos Links: conexões físicas INTRODUÇÃOINTRODUÇÃO Internet ( 1999)

13 Muitas redes reais têm uma estrutura similar: Redes livre de escala INTRODUÇÃOINTRODUÇÃO

14 Barabási & Albert, Science 286, 509 (1999) 1.Crescimento: um novo vértice é adicionado com m arestas. 2.Ligação preferencial: a probabilidade da ligação entre o novo vértice i e um vértice j na rede é dada por INTRODUÇÃOINTRODUÇÃO Modelo livre de escala ( 1999 ) P(k) ~ k 3

15 Propriedades: 1.Presença de hubs (vértices altamente conectados). 2.Heterogeneidade: rico fica mais rico. 3.Tolerantes à falhas aleatórias. INTRODUÇÃOINTRODUÇÃO Modelo livre de escala ( 1999)

16 INTRODUÇÃOINTRODUÇÃO Universalidade?

17 Li, Alderson, Willinger, 2005 INTRODUÇÃOINTRODUÇÃO Redes com diferentes topologias podem apresentar a mesma distribuição da conectividade!

18

19 Representação MEDIDASDEREDESMEDIDASDEREDES Matriz de adjacências: a ij = 1 se i está ligado com j e 0 caso contrário.

20 Grau, k Grau médio Distribuição das conexões, P(k) Medidas relacionadas à conectividade MEDIDASDEREDESMEDIDASDEREDES

21 Assortatividade r > 0: vértices com mesmo grau tendem a se ligar. r < 0: hubs tendem a se ligar com vértices pouco conectados. r = 0: não há correlação. Medidas relacionadas à conectividade MEDIDASDEREDESMEDIDASDEREDES

22 Medidas relacionadas aos ciclos Coeficiente de aglomeração Coeficiente de aglomeração médio MEDIDASDEREDESMEDIDASDEREDES

23 Menor caminho médio abcd and112 b1 12 c11 1 d221 a b c d Medidas relacionadas à distância D = = 16/(4(4*3)) = 4/3 l MEDIDASDEREDESMEDIDASDEREDES

24 Betweeness (i, u,j) : número de menores caminhos entre os vértices i e j que passam pelo vértice (ou aresta) u, (i; j) é o número total de menores caminhos entre i e j. Ponto de dominância central CPD=0CPD=1 Medidas relacionadas à distância MEDIDASDEREDESMEDIDASDEREDES

25 Grau hierárquico g = {1,15,22} k 0 (g) = 12; k 1 (g) = 12; k 2 (g) = 2. Medidas hierárquicas MEDIDASDEREDESMEDIDASDEREDES

26 Coeficiente de aglomeração hierárquico: Razão de convergência: Razão de divergência: dvd(g) = 1/cvd(g) Medidas hierárquicas MEDIDASDEREDESMEDIDASDEREDES

27 Desafio: Obter um método rápido e preciso! Detecção de comunidades MEDIDASDEREDESMEDIDASDEREDES

28 MEDIDASDEREDESMEDIDASDEREDES Maximização da modularidade 1. Inicia-se com a rede totalmente desconectada. 2. Vértices são conectados de forma a aumentar a modularidade 3. O processo termina quando a maior modularidade é encontrada

29 Medidas fractais, Medidas espectrais, Medidas de complexidade, Medidas de centralidade, Medidas de subgrafos,... Costa, Rodrigues, Travieso, Villas Boas. Advances in Physics 2007 Outras medidas MEDIDASDEREDESMEDIDASDEREDES

30

31 A caracterização e classificação é feita em termo de poucas medidas! M. E. J. Newman, SIAM, 2002 Método de classificação CLASSIFICAÇÃOCLASSIFICAÇÃO

32 CLASSIFICAÇÃOCLASSIFICAÇÃO

33 CLASSIFICAÇÃOCLASSIFICAÇÃO É construída uma matriz de atributos onde cada linha representa uma rede e cada coluna uma medida. Nessa matriz, é aplicado análise das variáveis canônicas. No espaço de características é aplicada a classificação bayesiana.

34 Procedimento: 1 - Para cada classe é construída uma matriz de dispersão e a matriz de soma dos quadrados dentro das classes, 2 – É construída a matriz de soma dos quadrados entre as classes, 3 – Diagonalize-se a matriz: 4 – Os autovalores dentro e entre são interpretados como a quantidade de variação associada a cada autovetor ou eixo de maior variação. CLASSIFICAÇÃOCLASSIFICAÇÃO Análise das variáveis canônicas

35 Critério de decisão: Classificação bayesiana CLASSIFICAÇÃOCLASSIFICAÇÃO Thomas Bayes ( )

36 Rede de transporte aéreo nos Estados Unidos (1997) Medidas: {,, l, st,,,, CPD, r } CLASSIFICAÇÃOCLASSIFICAÇÃO Resultados Costa, Rodrigues, Travieso, Villas Boas. Advances in Physics 2007

37 Rede de transcrição genética (E. coli) Medidas: {,, l, st,,,, CPD, r } Costa, Rodrigues, Travieso, Villas Boas. Advances in Physics 2007 CLASSIFICAÇÃOCLASSIFICAÇÃO Resultados

38 Interação de proteínas (Sacharomices cerevisiae) Medidas: {,, l, st,,,, CPD, r } Medidas: {,, l, st, r } CLASSIFICAÇÃOCLASSIFICAÇÃO Resultados Costa, Rodrigues, Travieso, Villas Boas. Advances in Physics 2007

39

40 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Evolução da Internet

41 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Modelagem da Internet 1.A cada passo um novo sistema autônomo i é adicionado à rede num posição geográfica (x,y) escolhida aleatoriamente dentro de uma caixa L X L. 2.São escolhidos m vizinhos geográficos mais próximos de i. Dentre eles, são escolhidos os r com maior grau e cada um deles é conectado a i com uma probabilidade. 3.São escolhidos aleatoriamente q sistemas autônomos, já presentes na rede, e conectados aos s sistemas autônomos de maior grau dentro de uma distância L/4, onde cada ligação é estabelecida com uma probabilidade. 4.O processo termina quando N sistemas autônomos tiverem sido adicionados à rede.

42 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Resultados 50 realizações do modelo Parâmetros: m= 40, r = 3, = 0,15, q = 2, s = 2, = 0,4

43 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Comparação com outros modelos Modelos: 1.Grafos aleatórios de Erdös e Rényi 2.Small World de Watts e Strogatz 3.Livre de escala de Barabási e Albert 4.Modelo geográfico 5.Livre de escala limitado de Amaral et al. 6.Livre de escala com ligação preferencial de Dorogovtsev et al. 7.Livre de escala não linear de Krapivisky et al. Base de dados National Laboratory of applied Network Research (NLANR) Rede: Topologia da Internet em 2 de abril de 1998 N = 3522 sistemas autônomos e 6324 conexões

44 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Resultados ER SW BA GEO LSF DMS Krapivsky ( = 0.5) Krapivsky ( = 1.3) Nosso Modelo

45 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Resultados ER SW BA GEO LSF DMS Krapivsky ( = 0.5) Krapivsky ( = 1.3) Nosso Modelo

46 MODELAGEMDAINTERNETMODELAGEMDAINTERNET Resultados ER SW BA GEO LSF DMS Krapivsky ( = 0.5) Krapivsky ( = 1.3) Nosso Modelo

47

48 Proteínas letais: quando removidas, causam a morte ou esterilidade de um organismo. H. Jeong, S. P. Mason, A.-L. Barabási and Z. N. Oltvai, Nature (2001) Highly connected proteins are more essential (lethal) than less connected proteins. Letalidade em redes de interação de proteínas ANÁLISEDALETALIDADEANÁLISEDALETALIDADE

49 ANÁLISEDALETALIDADEANÁLISEDALETALIDADE Domínios protéicos Piruvato kinase domínio regulador Domínio / de ligação de substratos Domínio / de ligação de nucleotídeos

50 Rede de interação de domínios protéicos ANÁLISEDALETALIDADEANÁLISEDALETALIDADE

51 Domínios letais em um sentido fraco: um domínio é letal se ele aparece em proteínas letais. Domínios letais em um sentido forte: um domínio é letal se ele aparece apenas em proteínas letais formadas de um único domínio. Hipóteses sobre a letalidade em domínios L. da F. Costa, F. A. Rodrigues and G. Travieso, APL (2007) ANÁLISEDALETALIDADEANÁLISEDALETALIDADE

52 Hipóteses sobre a letalidade em domínios ANÁLISEDALETALIDADEANÁLISEDALETALIDADE Letais-fraco Letais-forte

53 Distribuição cumulativa das conexões L. da F. Costa, F. A. Rodrigues and G. Travieso, APL (2007) ANÁLISEDALETALIDADEANÁLISEDALETALIDADE

54 Resultados ANÁLISEDALETALIDADEANÁLISEDALETALIDADE

55

56 VINHOSDEBORDEAUXVINHOSDEBORDEAUX Dados sobre os Chateaux 571 chateaux pertencentes a 8 distritos.

57 VINHOSDEBORDEAUXVINHOSDEBORDEAUX Atributos da produção 1.Castas das uvas 1.cabernet sauvignon, merlot, cabernet franc, petit verdot, semillon e sauvignon. 2.Área de cultivo 3.Densidade da plantação 4.Idade média das vinhas 5.Produção por hectare 6.Filtragem 7.Finning 8.Quantidade de garrafas produzidas 9.Tempo de fermentação

58 VINHOSDEBORDEAUXVINHOSDEBORDEAUX Construção da rede N chateaux possuem p atributos cada. N = 571 e p = 14

59 VINHOSDEBORDEAUXVINHOSDEBORDEAUX Classificação

60 VINHOSDEBORDEAUXVINHOSDEBORDEAUX Quais atributos influenciam na qualidade?

61 Conclusões e trabalhos futuros

62 CONCLUSÕESCONCLUSÕES Conclusões principais A utilização de métodos de estatística multivariada permite a identificação do modelo que melhor representa uma dada rede real. Utilização de poucas medidas pode fornecer resultados incompletos O modelo de Internet sugerido se mostrou mais preciso do que os outros modelos considerados. O crescimento da Internet é regulado por ligação preferencial, distância geográfica entre os sistemas autônomos e adição constante de ligações

63 CONCLUSÕESCONCLUSÕES Conclusões principais A correlação entre conectividade e letalidade é mais definida para os domínios protéicos. Os domínios são fundamentais na definição da letalidade e função das proteínas As propriedades de cultivo e produção de vinhos são fortemente influenciadas pelo território Vinhas mais antigas e maior tempo de fermentação resultam em melhores vinhos

64 CONCLUSÕESCONCLUSÕES Perspectivas: Utilização de técnicas de mineração de dados na classificação Mais modelos e mais medidas Taxonomia das redes complexas, influência das medidas na classificação. Aperfeiçoamento do modelo de Internet. Análise das funções protéicas no nível dos domínios. Consideração de outros atributos e outras regiões na análise dos produtores de vinhos.

65 REFERÊNCIASREFERÊNCIAS 1.Luciano da F. Costa, Francisco A. Rodrigues, Gonzalo Travieso and P. R. Villas Boas Characterization of complex networks: A survey of Measurements Advances in Physics, Volume 56 (1), , M. E. J. Newman, The structure and function of complex networks SIAM Review 45, (2003). 3.S. Boccaletti, V. Latora, Y.Moreno, M. Chavez and D.-U. Hwang Complex Networks: Structure and Dynamics Physics Reports, Physics Reports, 424 (4-5 ), Albert-László Barabási and Zoltán N. Oltvai Network Biology: Understanding the Cells's Functional Organization Nature Reviews Genetics 5, (2004). 5.Luciano da F. Costa, Francisco A. Rodrigues and Gonzalo Travieso Protein domain connectivity and essentiality Appl. Phys. Lett. 89, (2006). 6.F. A. Rodrigues, P. R. Villas Boas, G. Travieso, L. da F. Costa Seeking the best Internet Model Preprint: arXiv: v1 7.Francisco A. Rodrigues, Gonzalo Travieso e Luciano da F. CostaF. A. The complex network of Bordeaux wines, submetido.

66 ARTIGOSPUBLICADOSARTIGOSPUBLICADOS 1.Luciano da F. Costa, Francisco A. Rodrigues, Gonzalo Travieso and P. R. Villas Boas Characterization of complex networks: A survey of measurements Advances in Physics, Volume 56, pages , Issue 1, January Francisco A. Rodrigues, Gonzalo Travieso andLuciano da F. Costa Fast Community Identification by Hierarchical Growth International Journal of Modern Physics C, 18(6), June Luciano da F. Costa, Francisco A. Rodrigues and G. Travieso, Analyzing Trails in Complex Networks Physical Review E, aceito. 4.Luciano da F. Costa, Francisco A. Rodrigues and Gonzalo Travieso Protein domain connectivity and essentiality Applyes Physics Letters 89, (2006). 5.Francisco A. Rodrigues and Luciano da F. Costa Surviving opinions in Sznajd models on complex networks International Journal of Modern Physics C, 16(11), Gonzalo Travieso, Francisco A. Rodrigues, Carlos. A. Rugiero and Luciano da F. Costa Complex network modeling and simulation of distributed systems processing II TIDIA Workshop, November 7-9, São Paulo - Brazil.

67 ARTIGOSSUBMETIDOSARTIGOSSUBMETIDOS 1.Francisco A. Rodrigues, Paulino R. Villas Boas, Gonzalo Travieso and Luciano da F. Costa Seeking the best Internet Model Preprint: arXiv: v1 2.Francisco A. Rodrigues, Gonzalo Travieso e Luciano da F. Costa The complex network of Bordeaux wines. Submetido. 3. Paulino R. Villas-Boas, Francisco A. Rodrigues, Gonzalo Travieso, Luciano da F. Costa Chain motifs: The tails and handles of complex networks Preprint: arXiv: Paulino R. Villas Boas, Francisco A. Rodrigues, Gonzalo Travieso, Luciano da F. Costa Border trees of complex networks Preprint: arXiv: v1


Carregar ppt "20 de agosto de 2007 Instituto de Física de São Carlos Francisco Aparecido Rodrigues Orientador: Luciano da Fontoura Costa Caracterização, classificação."

Apresentações semelhantes


Anúncios Google