Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S Thiago Souto Maior
Roteiro Geração de tráfego Relação Paretto/Hurst Quantidade de fontes Teste R/S Relação R/S com Hurst Ferramentas Referências
Geração de Tráfego Utilizado o modelo On-Off Baseado em tempo de transmissão e tempo de espera Normalmente possui um tamanho fixo de pacote Esses tempos são regidos por uma distribuição de cauda pesada Paretto, Weibull, Lognormal...
Geração de Tráfego a partir da Paretto Relação entre o parâmetro α (shape) da Paretto e o parâmetro de Hurst, para geração de tráfego através do modelo On-Off
Precisão do parâmetro gerado Parâmetro de Hurst gerado a partir do modelo On-Off com a Paretto tem uma variação relativa à quantidade de fontes On-Off Quanto mais fontes menor a variabilidade 50 a 100 fontes Esforço computacional maior Variabilidade estaciona em valores pequenos 20 fontes já alcançam valores com variabilidade baixa
Extração do Parâmetro de Hurst através de dados de Vazão Utilização de Testes estatísticos R/S V/S Var[R/S] Quanto maior a massa de dados, melhor o resultado Quanto menor o intervalo de captura, mais preciso o resultado
Teste R/S Sejam h(1), h(2), h(3), …, h(n) dados de uma determinada série temporal Calcula-se a média desses dados Calcula-se os desvios da média Note que o conjunto “x” tem média zero
Teste R/S Calcula-se as somas dos desvios Considera-se o maior e o menor valor do conjunto Y R(n) = max(Y(1..n)) – min(Y(1..n)) Range
Teste R/S O valor do teste é calculado dividindo R(n) pelo desvio padrão (R(n)/s(n)) O resultado é chamado “Rescaled range”
Relação do R/S com Hurst Temos que numa série de variáveis randômicas com desvio padrão finito e sem dependências, a estatística R/S cresce proporcionalmente a n½ E[R/s] = cn½, sendo “c” uma constante Sendo assim: log(E[R/s]) = log(c) + (1/2) log(n) Se plotarmos log(E[R/s]) x log(n), teremos aproximadamente uma linha reta com inclinação de 0.5
Relação do R/S com Hurst O que Hurst achou foi Quando os dados possuem dependência, a inclinação da reta é sempre maior que 0.5 e obedecem à expressão E[R/s] = cnH, sendo “c” uma constante e “H” o parâmetro de Hurst log(E[R/s]) = log(c) + H log(n) Plotando num gráfico log(E[R/s]) x log(n), H seria a inclinação da reta correspondente ao gráfico
Relação de R/S com Hurst O gráfico deve ser feito em diversas escalas de “n” para provar a dependência em várias escalas O gráfico terá uma aparência de pontos esparsos (scattered plot) A reta construída para extrair o parâmetro de Hurst pode ser computada a partir de uma regressão linear com os pontos do gráfico
Ferramentas R Código em C Para calcular regressão linear Comando lm(x ~ y) Pode ser implementado o teste R/S Código em C http://www.csee.usf.edu/~christen/tools/rs.c
Referências Accurate and Fast Replication on the Generation of Fractal Network Traffic Using Alternative Probability Models, Stenio Fernandes, Carlos Kamienski & Djamel Sadok Hurst, http://gummy-stuff.org/hurst.htm