A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006. Embasamento Analítico.

Apresentações semelhantes


Apresentação em tema: "Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006. Embasamento Analítico."— Transcrição da apresentação:

1 Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, Embasamento Analítico 1 Monitoramento de Redes: Embasamento Analítico (2012.1)

2 Embasamento Analítico Probabilidade (Jain Cap. 12 – parte 1)Jain Cap. 12 – parte 1 Estatística (Jain Cap. 12 – parte 2; Cap. 13)Cap. 12 – parte 2Cap. 13 Álgebra Linear Teoria dos Grafos Métricas Medição e Modelagem 2 Monitoramento de Redes: Embasamento Analítico (2012.1)

3 Álgebra Linear 3 Monitoramento de Redes: Embasamento Analítico (2012.1)

4 Álgebra Linear Monitoramento de Redes: Embasamento Analítico (2012.1) 4

5 Operações com Vetores Monitoramento de Redes: Embasamento Analítico (2012.1) 5

6 Vetores Monitoramento de Redes: Embasamento Analítico (2012.1) 6

7 Ortogonalidade de Vetores Monitoramento de Redes: Embasamento Analítico (2012.1) 7

8 Matrizes Monitoramento de Redes: Embasamento Analítico (2012.1) 8

9 Funções Lineares e Matrizes Monitoramento de Redes: Embasamento Analítico (2012.1) 9

10 Autovetores e Autovalores Monitoramento de Redes: Embasamento Analítico (2012.1) 10

11 Álgebras Alternativas Monitoramento de Redes: Embasamento Analítico (2012.1) 11

12 Probabilidade 12 Monitoramento de Redes: Embasamento Analítico (2012.1)

13 Distribuições comumente encontradas na modelagem da Internet Monitoramento de Redes: Embasamento Analítico (2012.1) 13

14 Entropia Monitoramento de Redes: Embasamento Analítico (2012.1) 14

15 Entropia Conjunta Monitoramento de Redes: Embasamento Analítico (2012.1) 15

16 Entropia Monitoramento de Redes: Embasamento Analítico (2012.1) 16

17 Questões especiais na Internet Monitoramento de Redes: Embasamento Analítico (2012.1) 17 Processos estocásticos relevantes Caudas curtas (leves) e caudas longas (pesadas)

18 Processos estocásticos relevantes Monitoramento de Redes: Embasamento Analítico (2012.1) 18

19 Processos estocásticos relevantes Monitoramento de Redes: Embasamento Analítico (2012.1) 19

20 Caudas curtas e Caudas longas Monitoramento de Redes: Embasamento Analítico (2012.1) 20 Uma parte particularmente importante de uma distribuição é a sua cauda superior – a porção da distribuição que descreve a probabilidade de grandes valores. No caso de medições de redes, grandes valores podem dominar o desempenho do sistema. Portanto, presta-se uma atenção considerável ao formato da cauda superior da distribuição, significando a forma particular com que a cauda superior se aproxima do zero.

21 Caudas curtas Monitoramento de Redes: Embasamento Analítico (2012.1) 21

22 Caudas longas Monitoramento de Redes: Embasamento Analítico (2012.1) 22

23 Caudas pesadas Monitoramento de Redes: Embasamento Analítico (2012.1) 23

24 Distribuições com Caudas Curtas e com Caudas Longas Monitoramento de Redes: Embasamento Analítico (2012.1) 24 Caudas Curtas Caudas Longas

25 Distribuições com Caudas Curtas e com Caudas Longas Monitoramento de Redes: Embasamento Analítico (2012.1) 25

26 Estatística 26 Monitoramento de Redes: Embasamento Analítico (2012.1)

27 Questões especiais na Internet Monitoramento de Redes: Embasamento Analítico (2012.1) 27 Alta variabilidade Lei de Zipf

28 Alta Variabilidade Monitoramento de Redes: Embasamento Analítico (2012.1) 28 Os métodos estatísticos tradicionais focaram em situações nas quais os dados apresentam baixa ou moderada variabilidade. Ex.: assumem que os dados medidos seguem a distribuição Normal. Esta hipótese é garantida pelo Teorema do Limite Central que mostra que a soma de um número grande de fontes de variação apresentam uma distribuição Normal. Quando os dados seguem a distribuição Normal praticamente todas as observações estarão dentro de três desvios padrão a partir do valor médio.

29 Alta Variabilidade Monitoramento de Redes: Embasamento Analítico (2012.1) 29 Dados que apresentam alta variabilidade consistem de muitos pequenos valores misturados com poucos valores altos. A distribuição dos dados é dita distorcida (skewed) Apesar de muitos valores serem baixos, as poucas observações altas dominarão as estatísticas empíricas tais como a média e a variância que se tornam métricas não confiáveis. Uma melhor abordagem seria focar em quantis ou na distribuição empírica completa.

30 Lei de Zipf Monitoramento de Redes: Embasamento Analítico (2012.1) 30 Alta variabilidade é uma propriedade de dados numéricos. No entanto, distribuições de dados categóricos também podem ser distorcidas. A forma mais comum de apresentar este tipo de dados é a Lei de Zipf: modelo para a forma da distribuição de variáveis categóricas quando os valores dos dados são ordenados com probabilidade empírica (frequência) decrescente.

31 Lei de Zipf Monitoramento de Redes: Embasamento Analítico (2012.1) 31

32 Lei de Zipf Monitoramento de Redes: Embasamento Analítico (2012.1) 32

33 Grafos 33 Monitoramento de Redes: Embasamento Analítico (2012.1)

34 Grafos Monitoramento de Redes: Embasamento Analítico (2012.1) 34

35 Grafos direcionados ou não direcionados Monitoramento de Redes: Embasamento Analítico (2012.1) 35

36 Questões especiais na Internet Monitoramento de Redes: Embasamento Analítico (2012.1) 36 Caminhos e Arestas Modelos de Grafos Comumente Encontrados Grafos de Mundo Pequeno

37 Caminhos e Arestas Monitoramento de Redes: Embasamento Analítico (2012.1) 37 Frequentemente estaremos trabalhando com um conjunto de caminhos definidos sobre um grafo. Conjunto de caminhos entre todos os pares: define um único par, não necessariamente o mais curto, entre cada par de vértices.

38 Matriz de roteamento Monitoramento de Redes: Embasamento Analítico (2012.1) 38

39 Equação de Tomografia Monitoramento de Redes: Embasamento Analítico (2012.1) 39

40 Medições de Arestas e Caminhos Monitoramento de Redes: Embasamento Analítico (2012.1) 40

41 Uso de Outras Álgebras Monitoramento de Redes: Embasamento Analítico (2012.1) 41

42 Modelos de Grafos Comumente Encontrados Monitoramento de Redes: Embasamento Analítico (2012.1) 42 O grafo aleatório de Erdös-Rényi O grafo aleatório generalizado O grafo de conexões preferenciais

43 O grafo aleatório de Erdös-Rényi Monitoramento de Redes: Embasamento Analítico (2012.1) 43

44 Grafos de Mundo Pequeno Monitoramento de Redes: Embasamento Analítico (2012.1) 44

45 Métricas 45 Monitoramento de Redes: Embasamento Analítico (2012.1)

46 Métricas Uma métrica é uma quantidade que pode, em princípio, ser objetivamente medida. É preciso também especificar precisamente como as medições são realizadas e reportadas. Cada procedimento ou metodologia de se obter uma métrica é sujeita a erro. Ou seja, cada métrica reportada possui um nível associado de incerteza. É preciso portanto: Minimizar os erros e as incertezas Compreender e documentar suas fontes Quantificar da forma possível a quantidade de incerteza e de erro num conjunto de medições. 46 Monitoramento de Redes: Embasamento Analítico (2012.1)

47 Métricas: Amostragem Processo de coletar um subconjunto das medições possíveis ou executar apenas um subconjunto das medições. Amostrar o grafo de roteamento através da coleta de um conjunto de medições com o traceroute Captura de um pacote de cada conjunto de N pacotes que passam pelo ponto de medição. É usada quando precisamos caracterizar estatisticamente as medições mas não é necessária a medição de cada um dos pacotes. Ex.: caracterizar o comprimento médio do pacote. 47 Monitoramento de Redes: Embasamento Analítico (2012.1)

48 Métricas: Amostragem Amostragem tendenciosa: Processo de amostragem compartilha características comuns com as medições: Ex.: medições periódicas em intervalos fixos com a mesma frequência. Intrínseca: Um conjunto de medições com o traceroute de uma origem para diversos destinos, apresenta uma visão tendenciosa (em árvore) da topologia da rede. Condições não representativas: Medições numa rede de borda não são representativas quando se quer responder questões sobre a rede troncal. 48 Monitoramento de Redes: Embasamento Analítico (2012.1)

49 Métricas: Médias de Tempo e de Eventos Médias de tempo: média num dado intervalo de tempo. Estimativa: Médias de eventos: Medição em instantes de tempo particulares, normalmente relacionados a mudanças no estado do sistema. Amostragem aditiva aleatória: intervalo aleatório e independente entre amostragens (ex. Poisson). 49 Monitoramento de Redes: Embasamento Analítico (2012.1)

50 Medições e Modelagem 50 Monitoramento de Redes: Embasamento Analítico (2012.1)

51 Modelos de Dados Descritivos: Resumo compacto de um conjunto de medições. Representação idealizada: distribuição Normal. Construtivos: Descrição sucinta de um processo que dá origem a uma saída de interesse. superposição de um conjunto de fluxos com chegadas independentes, cada um consistindo de um número aleatório de pacotes. Todos os modelos são errados, mas alguns modelos são úteis [Box79] 51 Monitoramento de Redes: Embasamento Analítico (2012.1)

52 Construção de um Modelo de Dados Inicia com uma coleção de dados reais e talvez a descrição do sistema Escolha da idealização (problema da seleção do modelo) Seleção de valores para os parâmetros do sistema (problema da estimativa dos parâmetros) Validação do modelo: dados observados seriam provavelmente uma saída do modelo. 52 Monitoramento de Redes: Embasamento Analítico (2012.1)

53 Por que construir modelos? Provê um resumo compacto para um conjunto de medições. Expõe propriedades das medições que são importantes para problemas particulares de engenharia. Uso em simulações para gerar dados aleatórios mas realistas. 53 Monitoramento de Redes: Embasamento Analítico (2012.1)

54 Uso de Modelos Probabilísticos As propriedades dos dados são por definição quantidades observáveis. Mas, um modelo probabilístico pode conter hipóteses que não podem ser testadas operacionalmente nem serem observadas diretamente e, portanto, não podemos dizer que se aplicam aos dados reais. Um bom modelo deveria fornecer respostas úteis às questões para as quais é utilizado. 54 Monitoramento de Redes: Embasamento Analítico (2012.1)


Carregar ppt "Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006. Embasamento Analítico."

Apresentações semelhantes


Anúncios Google