Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores

Slides:



Advertisements
Apresentações semelhantes
Filas M/M/1.
Advertisements

Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S Thiago Souto Maior.
Comunicação científica em Saúde Hooman Momen Instituto Oswaldo Cruz Fiocruz.
Marketing Digital.
Universidade Federal de Pernambuco
LOGO Sensitivity Analysis of Dependability in Redundant Computer Networks Almir Guimarães / Kádna Camboim / Rubens Matos
Estimação Não-Paramétrica
Modelos Probabilísticos Filas M/M/1, M/G/1
Estatística 8 - Distribuições de Probabilidade de Variáveis Aleatórias Contínuas Prof. Antonio Fernando Branco Costa Página.
SISTEMAS DISTRIBUÍDOS
Wesley Martins Teles, Li Weigang, Célia Ghedini Ralha
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Redes de Computadores 2 - Camada de Aplicação (HTTP) –
Modelando Analiticamente o MAC do Bluetooth
EFFICIENCY COMPARISON OF CHANNEL ALLOCATION SCHEMES FOR DIGITAL MOBILE COMMUNICATION NETWORK IEEE Transactions on Vehicular Technology, Vol.49, No. 3,
Geradores de Carga de Trabalho para Servidores Web
Avaliação de Desempenho Planejamento de Experimentos 2 Aula 3 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.
Conceitos Básicos de Informática REDES DE COMUNICAÇÃO: INTERNET
Internet: conceitos básicos
Variáveis Aleatórias Contínuas
Arquiteturas de Alto Desempenho
Aluno: Gabriel Angelo Nazário Orientadora: Andrea Iabrudi Tavares
Geração de random variates
INF-103: Avaliação de Desempenho
INFORMÁTICA BÁSICA EXTRANET INTERNET
TCP/IP CAMADA DE APLICAÇÃO SERVIÇOS
Profº Charles de Sá Graduado em Computação Profº Charles de Sá Graduado em Computação.
Modelagem de tráfego auto-similar
Monitoring the Impact of P2P Users on a Broadband Operator's Network H. J. Kolbe, O. Kettig and E. Golic. Germany IM'09 Proceedings of the 11th IFIP/IEEE.
Matheus dos Santos Lima
Introdução a Processos Estocásticos
Capítulo 3 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, Embasamento Analítico.
Distribuições Comuns de Variáveis Aleatórias Discretas
Referências. BAYLESS, L. A. What are the non-academic needs of distance learners? Blacksburg, VA. 2001, 408 f.. Thesis (PhD in Higher Education) – Department.
Entendendo o trade-off entre o custo do frete e o custo de estoque.
Uso de Sistemas Imunológicos Artificiais para Detecção de Falhas em Plantas da Indústria de Petróleo. Aluno: Alexandre Willig Quintino dos Santos Orientador:
SciELO: um modelo para publicação eletrônica de periódicos científicos
Viviane Cristina Oliveira Aureliano Börje Felipe Fernandes Karlsson
XXI Congresso da Sociedade Brasileira de Computação
105. Crescimento Lentamente Renovável (SLOWREN). O minimodelo para o crescimento lentamente renovável tem duas unidades em série como mostra a Figura.
315. Macro-economia (MACROEC)
207. Produção Líquida (NETPROD)
13/07/2007 Saulo Andrade Pessoa Simulação de Iluminação Volumétrica Apresentação de Andamento Computação Gráfica.
Probabilidade e Estatística Exemplo da Moeda Balanceada
TVDesigner Uma Ferramenta para Criação de Aplicações MHP Interativas para TV Digital Orientador: Prof. Ph.D. Carlos André Guimarães Ferraz Aluno: Djaci.
Computação Ubíqua Tecnologia dos Computadores 2010/2011 Carlos Anastácio N.º Gonçalo Amador N.º Luís Marques N.º
EXERCÍCIO DE REFERÊNCIAS BIBLIOGRÁFICAS
Avaliação de Desempenho UFABC Pós-graduação em Engenharia da Informação Professor: Carlos Alberto Kamienski ( ) Santo André, Fevereiro.
Projetando e Publicando Publicações Eletrônicas Interativas na World Wide Web Curso.
A Internet e Seu Impacto
ICORI Instalação e configuração de computadores em redes locais e Internet Pedro Amaro –
B ACKUP DISTRIBUÍDO Tecnologias envolvidas. A GENDA DHT – Distributed Hash Tables Segmentação de arquivos Segurança e compartilhamento de blocos Verificar.
Probabilidade e Estatística para Avaliação de Desempenho
DI-UFPE1 Sistemas CASE Visão Geral do Curso Alexandre M. L. de Vasconcelos.
Variáveis Observáveis Janine de Aguiar Loureiro Auto-Sim.
Um Sistema Peer-to- Peer para Armazenamento Distribuído de Arquivos Daniel Mauricio Sthor Lauro Luis Costa Lucas Nascimento Ferreira Departamento de Informática.
Análise de Estratégias de Green Computing em Grades Oportunistas.
Measurement, Modeling and Analysis of a Peer-to-Peer File- Sharing Workload Gummadi et al – SOSP´03 Tiago Alves Macambira.
Avaliação de Desempenho de Sistemas Introdução Paulo Adeodato Grupo de Inteligência Computacional Departamento de Informática Universidade Federal de Pernambuco.
Projeto AUTO-SIM Análise do Tráfego no Maple Diogo de Carvalho Pedrosa.
Avaliação de Desempenho de Sistemas Introdução
DISTRIBUIÇÕES DE PROBABILIDADE
Redes de Sensores sem Fio
Network Anomaly Detection Using Autonomous System Flow Aggregates Thienne Johnson and Loukas Lazos Department of Electrical and Computer Engineering University.
Comunicação Assíncrona em Equipes Distribuídas: Requisitos e Meios Utilizados Cleyton Carvalho da Trindade Universidade Federal de.
©2000 Paulo Adeodato Avaliação de Desempenho de Sistemas Introdução à Teoria das Filas Paulo Adeodato Departamento de Informática Universidade Federal.
©2000 Paulo Adeodato Avaliação de Desempenho de Sistemas Análise de Fila Única Paulo Adeodato Departamento de Informática Universidade Federal de Pernambuco.
Sistemas de Informação Inteligentes Aula 4 Nadilma Nunes
Texto Analisado INDICADORES DE DESEMPENHO PARA SISTEMAS CENTRALIZADOS DE CONTROLE DO TRÁFEGO URBANO EM TEMPO REAL XVII Congresso da ANPET Hamifrancy.
© 2000 Paulo Adeodato Avaliação de Desempenho de Sistemas Geração de Valores Aleatórios Paulo Adeodato Departamento de Informática Universidade Federal.
Transcrição da apresentação:

Distribuições de Caudas Pesadas e Aplicações em Redes de Computadores Boa tarde, meu nome é Diogo. Nossa apresentação será sobre distribuições de caudas pesadas e aplicações em redes de computadores. Vou começar falando um pouco de porque estamos estudando este assunto, e logo depois explicarei a definição de caudas pesadas para finalmente dar alguns exemplos dessas distribuições juntamente com algumas variáveis que podem ser modeladas utilizando uma delas. Diogo de Carvalho Pedrosa Janine de Aguiar Loureiro Marcilia Andrade Campos

Motivação Crescimento da Internet Entender a natureza do tráfego Melhorar o desempenho da rede Como todos sabem, a Internet cresceu de forma assustadora nos últimos anos, e continua crescendo. Para fazer com que ela funcione bem, é necessário entender a natureza do tráfego. Esse conhecimento ajuda no design, manutenção e controle da Internet. Ajudam a definir estratégias de cache, largura de banda etc.

Poisson x Tráfico Internet Os estudos que vêm sendo feitos para caracterizar o tráfego, mostram claramente que o tráfego da Internet difere extremamente do tráfego de voz convencional. Numa rede de telefone o tempo entre as chamadas segue uma distribuição exponencial, o que faz com que o número de chamadas siga uma distribuição de Poisson. Esse gráfico que foi tirado de um artigo, mostra do lado direito o comportamento do tráfego de uma hora coletado de um link entre uma grande corporação e a Internet. Baseado nesse tráfego os autores simularam o comportamento de uma Poisson com a mesma média e a mesma variância dos dados coletados e mostraram que o gráfico da distribuição de Poisson tende a suavizar quando se aumenta a escala de tempo, o que não ocorre com os dados coletados. O tráfego da Internet possui uma grande variância em diversas escalas de tempo, o que é uma característica das distribuições de caudas pesada.

P(X > x) ~ x- x  , 0 < < 2 Caudas Pesadas P(X > x) ~ x- x  , 0 < < 2 Variância infinita Valores grandes com probabilidade não desprezível x x-0.5 x-1 x-1.5 10 0.316228 0.1 0.031622 100 0.01 0.001 1000 0.0001 0.000032 Existem diferentes definições para distribuições de caudas pesadas, essa é a mais comum. A probabilidade de uma Variável ser maior que um determinado x é aproximadamente x elevado a -alfa, com x tendendo a infinito e alfa variando entre 0 e 2. As principais características desse tipo de distribuição são: possuem variância infinita e apresentam probabilidades não desprezíveis para valores grandes, como podemos ver nessa tabela.

Distribuição de Pareto Função de Densidade: onde Função de Distribuição Acumulada: Esperança Matemática: com Variância: A distribuição de Pareto foi criada para modelar a distribuição de renda numa população. Ela é sem dúvida, a mais importante das distribuições de caudas pesadas. Quase todas as variáveis que vamos citar são modeladas utilizando essa distribuição. K é o menor valor que x pode assumir. Olhando para f.d. acumulada dá para perceber que fixando o k e fazendo com que x tenda a infinito P(X>x) é aproximadamente x elevado a – alfa, o que é exatamente a definição que demos para caudas pesadas. Note que essa fórmula da esperança é apenas para valores de alfa maiores que 1, caso contrário a esperança vai para infinito. O mesmo acontece com a variância para alfa menor que 2, justamente uma das características das distribuições de caudas pesadas.

Distribuição de Pareto Parâmetro K=10 = 1,0  = 0,5  = 0,1 Com esse gráfico dá pra se ter uma idéia de como se comporta uma distribuição de Pareto. Fixamos o K em 10 e fizemos x variar de 10 a 50. Cada linha dessa representa um valor diferente para o parâmetro alfa, onde a curva vermelha assume o maior valor para alfa. É dessa distância entre a cauda e o eixo do x que vem o nome caudas pesadas.

Exponencial x Pareto exponencial Pareto x  = 0,00033  = 1,1 K = 300 P(X > x) exponencial Pareto x  = 0,00033  = 1,1 K = 300 300 0,900 1,00 600 0,820 0,47 1500 0,610 0,17 3000 0,370 0,079 6000 0,135 0,037 10000 0,036 0,021 50000 10-8 0,0036 100000 10-17 0,0017 Essa tabela faz uma comparação entre as distribuições exponencial e Pareto. Por ela dá pra verificar facilmente o fato de distribuições de caudas pesadas terem probabilidades não desprezíveis para valores grandes.

Variáveis que seguem a distribuição de Pareto Número de conexões numa rajada (burst) de uma seção FTP Tamanho das rajadas em bytes Tamanho dos arquivos no sistema Unix Tempo de CPU consumido por processos Unix Vou mostrar agora uma lista de variáveis que em alguns artigos que falam do assunto que seguem a distribuição de Pareto. Numa seção FTP as conexões ocorrem em rajadas. Chegam varias conexões juntas e depois ocorre um período de silêncio. O nº…. O tamanho delas em bytes também…

Distribuição do tamanho dos documentos na Web Muitas variáveis que encontramos são da Web,o que é natural pois a Web gera mais tráfego na Internet que qualquer outra aplicação.

Tamanho dos arquivos na Web - Número de pedidos de arquivos - Número de arquivos transferidos - Número de arquivos únicos Período off – período a estação não está recebendo dados Tamanho de uma conexão WWW Podemos quebrar essa variável em três outras. Em vez de falarmos dos arquivos de um modo geral, podemos nos referir a todos os arquivos que foram pedidos pelos usuários. Dentre estes que foram pedidos, somente os que realmente foram transferidos, por não estarem guardados no cache, e ainda o subconjunto dos artigos transferidos que só contenham uma cópia de cada, ou seja, tirando as duplicatas. Todas essas variáveis seguem a distribuição de Pareto. ...

Popularidade dos documentos em função de seus tamanhos A popularidade dos documentos em função de seus tamanhos também segue a distribuição de Pareto. Nesse gráfico a gente percebe que os documentos mais acessados são os que possuem menor tamanho.

Distribuição de Weibull Parâmetro  =1  = 0,1  = 0,4  = 0,7  = 1,0 (Exponencial) Enquanto a gente tava fazendo esse trabalho surgiu uma dúvida de se as distribuições de Weibull e a Log-normal eram distribuições de caudas pesada ou não, porque essas distribuições eram comentadas nos artigos, mas nenhum deles dizia propriamente que eram de caudas pesadas. Escrevemos para alguns dos autores para tirar a dúvida e descobrimos que elas são distribuições de cauda longa, ou seja, são distribuições que decrescem mais lentamente que as exponenciais, mas não chegam a se enquadrar na definição mais comum, que foi a que a gente deu.

Variável que segue a distribuição de Weibull Período on – período de transmissão de arquivos Web Como dissemos anteriormente ...

Distribuição Lognormal Parâmetro  =0  = 0,5  = 1,0  = 1,5 Com esse gráfico dá pra se ter uma idéia de como se comporta uma distribuição Lognormal.

Variável que segue a distribuição Lognormal Tamanho de conexões TELNET em pacotes

Conclusões Importância das distribuições de caudas pesadas em redes de computadores. Tráfego auto-similar. Deu pra notar a importância das distribuições de caudas pesadas em redes de computadores. São justamente essas distribuições que fazem com que o tráfego seja auto-similar, ou seja, possua uma grande variância em diversas escalas de tempo, como a gente pode ver na primeira figura. Ele é formado de rajadas. É essa característica que dificulta a melhora do desempenho. Para conseguir armazenar essas rajadas o buffers deveriam ser enormes, porém quanto maior é o buffer, maiores serão as filas e maiores serão os atrasos.

Projeto AUTO-SIM Parceria da UFPE com a UFC. Objetivos: - Analisar - Modelar - Controlar - Prever Esse é um projeto que já está em andamento, é de parceria da UFPE com a UFC, onde estão envolvidos muitos alunos de graduação. Tem como objetivos modelar e analisar o tráfego em redes de computadores a fim de poder controlar e prever congestionamentos na rede. Uma das coisas que se espera é conseguir atrair alunos para uma pos-graduação nessa área.

Bibliografia N. L. Johnson, S. Kotz, N. Balakrishnan, “Continuos Univariate Distributions”, volume 1, 1994. J. K. Patel, C. H. Kapadia, D. B. Owen, “Handbook of statistical distribuitions”, volume 20, 1976. M. A. Campos, J. L. C. Silva e P. R. F. Cunha, “Modelagem Estocástica de Tráfego de Redes de Alta Velocidade”. Jornada de Atualização de Informação, XXI SBC. http://www.dcc.ufmg.br/pos/html/espg98/anais/cristina/cristina.html. http://www.dcc.unicamp.br/~9772294/Research/Tese.html. M. E. Crovella, A. Bestravos, M. S. Taqqu, “Heavy-tailed Probability Distributions in the World Wide Web”, A Pratical Guide To Heavy Talis: Statistical Techniques and Applications, Birkhauser, Boston, 1998.

Bibliografia Carlos R. Cunha, Azer Bestavros e Mark E. Crovella, “Characteristics of WWW Client-based Traces”, Techinical ReportBU-CS-95-010, Boston University Computer Science Department, 1995. Vern Paxson e Sally Floyd, “Wide-Area Traffic: The Failure of Poisson Modeling”, IEEE/ACM Transactions on Networking, 3(3), pgs. 226-244, junho de 1995. Vern Paxson e Sally Floyd, “Why we don´t Know How to Simulate The Internet”, Proceedings of the 1997 Winter Simulation Conference, Atlanta, GA, 1997. Walter Willinger e Vern Paxson, “Where the Mathematics meets the Internet”, Notices of American Mathematical Society, 45(8), pgs. 961-970, setembro de 1998.