A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores

Apresentações semelhantes


Apresentação em tema: "Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores"— Transcrição da apresentação:

1 Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores
Boa tarde, meu nome é Diogo. Nossa apresentação será sobre distribuições de caudas pesadas e aplicações em redes de computadores. Vou começar falando um pouco de porque estamos estudando este assunto, e logo depois explicarei a definição de caudas pesadas para finalmente dar alguns exemplos dessas distribuições juntamente com algumas variáveis que podem ser modeladas utilizando uma delas. Diogo de Carvalho Pedrosa Janine de Aguiar Loureiro Marcilia Andrade Campos

2 Motivação Crescimento da Internet Entender a natureza do tráfego
Melhorar o desempenho da rede Como todos sabem, a Internet cresceu de forma assustadora nos últimos anos, e continua crescendo. Para fazer com que ela funcione bem, é necessário entender a natureza do tráfego. Esse conhecimento ajuda no design, manutenção e controle da Internet. Ajudam a definir estratégias de cache, largura de banda etc.

3 Poisson x Tráfico Internet
Os estudos que vêm sendo feitos para caracterizar o tráfego, mostram claramente que o tráfego da Internet difere extremamente do tráfego de voz convencional. Numa rede de telefone o tempo entre as chamadas segue uma distribuição exponencial, o que faz com que o número de chamadas siga uma distribuição de Poisson. Esse gráfico que foi tirado de um artigo, mostra do lado direito o comportamento do tráfego de uma hora coletado de um link entre uma grande corporação e a Internet. Baseado nesse tráfego os autores simularam o comportamento de uma Poisson com a mesma média e a mesma variância dos dados coletados e mostraram que o gráfico da distribuição de Poisson tende a suavizar quando se aumenta a escala de tempo, o que não ocorre com os dados coletados. O tráfego da Internet possui uma grande variância em diversas escalas de tempo, o que é uma característica das distribuições de caudas pesada.

4 P(X > x) ~ x- x  , 0 < < 2
Caudas Pesadas P(X > x) ~ x x  , 0 < < 2 Variância infinita Valores grandes com probabilidade não desprezível x x-0.5 x-1 x-1.5 10 0.1 100 0.01 0.001 1000 0.0001 Existem diferentes definições para distribuições de caudas pesadas, essa é a mais comum. A probabilidade de uma Variável ser maior que um determinado x é aproximadamente x elevado a -alfa, com x tendendo a infinito e alfa variando entre 0 e 2. As principais características desse tipo de distribuição são: possuem variância infinita e apresentam probabilidades não desprezíveis para valores grandes, como podemos ver nessa tabela.

5 Distribuição de Pareto
Função de Densidade: onde Função de Distribuição Acumulada: Esperança Matemática: com Variância: A distribuição de Pareto foi criada para modelar a distribuição de renda numa população. Ela é sem dúvida, a mais importante das distribuições de caudas pesadas. Quase todas as variáveis que vamos citar são modeladas utilizando essa distribuição. K é o menor valor que x pode assumir. Olhando para f.d. acumulada dá para perceber que fixando o k e fazendo com que x tenda a infinito P(X>x) é aproximadamente x elevado a – alfa, o que é exatamente a definição que demos para caudas pesadas. Note que essa fórmula da esperança é apenas para valores de alfa maiores que 1, caso contrário a esperança vai para infinito. O mesmo acontece com a variância para alfa menor que 2, justamente uma das características das distribuições de caudas pesadas.

6 Distribuição de Pareto
Parâmetro K=10 = 1,0  = 0,5  = 0,1 Com esse gráfico dá pra se ter uma idéia de como se comporta uma distribuição de Pareto. Fixamos o K em 10 e fizemos x variar de 10 a 50. Cada linha dessa representa um valor diferente para o parâmetro alfa, onde a curva vermelha assume o maior valor para alfa. É dessa distância entre a cauda e o eixo do x que vem o nome caudas pesadas.

7 Exponencial x Pareto exponencial Pareto x  = 0,00033  = 1,1 K = 300
P(X > x) exponencial Pareto x  = 0,00033  = 1,1 K = 300 300 0,900 1,00 600 0,820 0,47 1500 0,610 0,17 3000 0,370 0,079 6000 0,135 0,037 10000 0,036 0,021 50000 10-8 0,0036 100000 10-17 0,0017 Essa tabela faz uma comparação entre as distribuições exponencial e Pareto. Por ela dá pra verificar facilmente o fato de distribuições de caudas pesadas terem probabilidades não desprezíveis para valores grandes.

8 Variáveis que seguem a distribuição de Pareto
Número de conexões numa rajada (burst) de uma seção FTP Tamanho das rajadas em bytes Tamanho dos arquivos no sistema Unix Tempo de CPU consumido por processos Unix Vou mostrar agora uma lista de variáveis que em alguns artigos que falam do assunto que seguem a distribuição de Pareto. Numa seção FTP as conexões ocorrem em rajadas. Chegam varias conexões juntas e depois ocorre um período de silêncio. O nº…. O tamanho delas em bytes também…

9 Distribuição do tamanho dos documentos na Web
Muitas variáveis que encontramos são da Web,o que é natural pois a Web gera mais tráfego na Internet que qualquer outra aplicação.

10 Tamanho dos arquivos na Web - Número de pedidos de arquivos
- Número de arquivos transferidos - Número de arquivos únicos Período off – período a estação não está recebendo dados Tamanho de uma conexão WWW Podemos quebrar essa variável em três outras. Em vez de falarmos dos arquivos de um modo geral, podemos nos referir a todos os arquivos que foram pedidos pelos usuários. Dentre estes que foram pedidos, somente os que realmente foram transferidos, por não estarem guardados no cache, e ainda o subconjunto dos artigos transferidos que só contenham uma cópia de cada, ou seja, tirando as duplicatas. Todas essas variáveis seguem a distribuição de Pareto. ...

11 Popularidade dos documentos em função de seus tamanhos
A popularidade dos documentos em função de seus tamanhos também segue a distribuição de Pareto. Nesse gráfico a gente percebe que os documentos mais acessados são os que possuem menor tamanho.

12 Distribuição de Weibull
Parâmetro  =1  = 0,1  = 0,4  = 0,7  = 1,0 (Exponencial) Enquanto a gente tava fazendo esse trabalho surgiu uma dúvida de se as distribuições de Weibull e a Log-normal eram distribuições de caudas pesada ou não, porque essas distribuições eram comentadas nos artigos, mas nenhum deles dizia propriamente que eram de caudas pesadas. Escrevemos para alguns dos autores para tirar a dúvida e descobrimos que elas são distribuições de cauda longa, ou seja, são distribuições que decrescem mais lentamente que as exponenciais, mas não chegam a se enquadrar na definição mais comum, que foi a que a gente deu.

13 Variável que segue a distribuição de Weibull
Período on – período de transmissão de arquivos Web Como dissemos anteriormente ...

14 Distribuição Lognormal
Parâmetro  =0  = 0,5  = 1,0  = 1,5 Com esse gráfico dá pra se ter uma idéia de como se comporta uma distribuição Lognormal.

15 Variável que segue a distribuição Lognormal
Tamanho de conexões TELNET em pacotes

16 Conclusões Importância das distribuições de caudas pesadas em redes de computadores. Tráfego auto-similar. Deu pra notar a importância das distribuições de caudas pesadas em redes de computadores. São justamente essas distribuições que fazem com que o tráfego seja auto-similar, ou seja, possua uma grande variância em diversas escalas de tempo, como a gente pode ver na primeira figura. Ele é formado de rajadas. É essa característica que dificulta a melhora do desempenho. Para conseguir armazenar essas rajadas o buffers deveriam ser enormes, porém quanto maior é o buffer, maiores serão as filas e maiores serão os atrasos.

17 Projeto AUTO-SIM Parceria da UFPE com a UFC. Objetivos: - Analisar
- Modelar - Controlar - Prever Esse é um projeto que já está em andamento, é de parceria da UFPE com a UFC, onde estão envolvidos muitos alunos de graduação. Tem como objetivos modelar e analisar o tráfego em redes de computadores a fim de poder controlar e prever congestionamentos na rede. Uma das coisas que se espera é conseguir atrair alunos para uma pos-graduação nessa área.

18 Bibliografia N. L. Johnson, S. Kotz, N. Balakrishnan, “Continuos Univariate Distributions”, volume 1, 1994. J. K. Patel, C. H. Kapadia, D. B. Owen, “Handbook of statistical distribuitions”, volume 20, 1976. M. A. Campos, J. L. C. Silva e P. R. F. Cunha, “Modelagem Estocástica de Tráfego de Redes de Alta Velocidade”. Jornada de Atualização de Informação, XXI SBC. M. E. Crovella, A. Bestravos, M. S. Taqqu, “Heavy-tailed Probability Distributions in the World Wide Web”, A Pratical Guide To Heavy Talis: Statistical Techniques and Applications, Birkhauser, Boston, 1998.

19 Bibliografia Carlos R. Cunha, Azer Bestavros e Mark E. Crovella, “Characteristics of WWW Client-based Traces”, Techinical ReportBU-CS , Boston University Computer Science Department, 1995. Vern Paxson e Sally Floyd, “Wide-Area Traffic: The Failure of Poisson Modeling”, IEEE/ACM Transactions on Networking, 3(3), pgs , junho de 1995. Vern Paxson e Sally Floyd, “Why we don´t Know How to Simulate The Internet”, Proceedings of the 1997 Winter Simulation Conference, Atlanta, GA, 1997. Walter Willinger e Vern Paxson, “Where the Mathematics meets the Internet”, Notices of American Mathematical Society, 45(8), pgs , setembro de 1998.


Carregar ppt "Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores"

Apresentações semelhantes


Anúncios Google