A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia.

Apresentações semelhantes


Apresentação em tema: "Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia."— Transcrição da apresentação:

1 Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia Andrade Campos Prof. Paulo Roberto Freire Cunha Julho 2001 XXI Congresso da Sociedade Brasileira de Computação Jorge Luiz

2 Conteúdo ä Motivação ä Redes de Alta Velocidade e Aplicações ä Evolução das tecnologias e aplicações multimídia ä Requisitos para transmissão de conteúdos multimídia ä Serviços para redes multimídia ä Conceitos Básicos ä Processo estocástico ä Momentos de um processo estocástico ä média ä variância ä covariância ä correlação Jorge Luiz

3 Conteúdo - (cont.) ä Visão Geral sobre Modelagem de Tráfego ä O que se deve medir ä Fontes de tráfego ä Qual o objetivo da modelagem ä Modelos para Modelar Tráfego ä Modelos tradicionais ä Modelos de series temporais ä Distribuições de caudas pesadas ä Modelo auto-similar Jorge Luiz

4 Referências ä D.L.Jagerman et al., “Stochastic Modeling of Traffic Process”, ä M.E.Crovella et al.,”Self-Similarity in World Wide Web Traffic: Evidences and Possibles Causes”, ä V. Paxson and S. Floyd, “Wide-Area Traffic: The Failure of Poisson Modeling”, papers.html ä W. Willinger et al.,”Self-Similarity and Heavy Tails: Structural Modeling of Network Traffic”, ä Z. Sahinoglu and S. Tekinay, “On Multimedia Networks: Self- Similar Traffic and Network Performance”, 1999, IEEE Comm. Magazine. Jorge Luiz

5 1 a Parte Motivação Jorge Luiz

6 Situação 1: Suponha um sistema onde os usuários disputam o acesso a um recurso cuja a capacidade é finita. Ex. o uso de uma canal de comunicação. ä O ferramental para análise e modelagem deste problema pode ser a Teoria das Filas. ä Medidas de desempenho como o comprimento da fila ou o tempo de espera dos objetos (bytes, pacotes, etc) na fila podem ser estimadas para alocação e compartilhamento eficiente do recurso. Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes

7 Situação 2: Suponha que se tenha medidas diárias sobre o tráfego na Internet. O objetivo é prever o número de acessos para os próximos 6 meses. ä A modelagem estocástica para este tipo de problema pode ser Séries Temporais e a Teoria Bayesiana. Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes

8 Para que usar modelagem de tráfego: ä Planejamento e dimensionamento de redes ä Análise de desempenho de redes ä Congestionamento de redes ä Análise de perda de pacotes ä Estudo do comportamento dos usuários Geralmente, dados coletados e avaliados fornecem a base para os modelos analíticos. Os dados, então, representam o comportamento do tráfego da rede. Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes

9 A partir das propriedades observadas nos dados empíricos é desenvolvido um modelo ou uma expressão matemática. O modelo matemático serve como uma aproximação do que acontece na realidade. O modelo matemático pode ser usado para analisar o desempenho da rede, como tamanho da fila, atraso na fila, probabilidade de perda, etc. Por exemplo, analisando as perdas de informação que podem ocorrer em um sistema de transmissão de áudio e vídeo unicast. Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes

10 Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes Camera/ Microfone Codificador controle de taxa Adaptador de Rede A / D to network Adaptador de Rede D / A Decodificador controle de erro Monitor/ Caixa de som from network Sistema de áudio e vídeo unicast Elementos de um sistema de comunicação para transferência multimídia

11 ä Antes ä Os usuários da rede trabalhavam com aplicações tradicionais (transferência de dados) que demandavam um serviço com baixas taxas de erro. ä Hoje ä Aplicações multimídia que exigem um nível mínimo de QoS (garantia de um mínimo de banda passante e baixos níveis de retardo e variação de atraso). ä Os serviços fornecidos pela rede podem ser determinístico (com garantia absoluta de retardo máximo, vazão e taxa máxima de perdas) ou probabilístico (com garantia relativa em função de uma modelagem estocástica da fonte geradora do tráfego). Jorge Luiz Motivação da Análise e Modelagem de Tráfego em Redes

12 ä Fontes de Tráfego ou Classes de Tráfego ä ATM Forum ä Para SG -> CBR e VBR ä Para ME -> UBR e ABR ä IETF ä Para ME -> rajadas ä CBR = Constant Bit Rate ä VBR = Variable Bit Rate ä UBR = Unspecified Bit Rate ä ABR = Available Bit Rate ä ATM = Asynchronous Transfer Mode ä IETF = Internet Engineering Task Force Jorge Luiz

13 Motivação da Análise e Modelagem de Tráfego em Redes ä O tráfego em rajadas apresenta períodos ativos, durante os quais há geração de tráfego, intercalados por períodos de inatividade. Parâmetros para caracterizar esse tipo de tráfego incluem a duração média dos períodos de atividade e a explosividade da fonte (razão entre a taxa de pico e a taxa média de utilização. ä O tráfego CBR é constante. A taxa média é igual a sua taxa de pico. ä O tráfego VBR apresenta variações na taxa de transmissão ao longo do tempo. Parâmetros com a média e a variância da taxa de transmissão caracterizam o comportamento desse tipo de tráfego. Jorge Luiz

14 2 a Parte Redes de Alta Velocidade e Aplicações Jorge Luiz

15 Redes de Alta Velocidade e Aplicações ä O que está mudando? ä As tecnologias de redes de alta velocidade estão sendo desenvolvidas em resposta a uma série de mudanças na área de: ä Computação ä Comunicação de dados ä Telecomunicações ä Aplicações Jorge Luiz

16 Redes de Alta Velocidade e Aplicações ä Evolução da Computação ä O desempenho dos processadores está dobrando a cada ano ä Memória de massa: disk array ä Sistemas gráficos que usam tecnologias avançadas possibilitando altas taxas de transferência (na ordem de gigabit por segundo) ä Sofware - o incremento na potência de processamento tem possibilitado o uso de novas aplicações. Ex: aplicações que fazem o reconhecimento de voz em tempo real. Jorge Luiz

17 Redes de Alta Velocidade e Aplicações ä Evolução da Comunicação de Dados ä Capacidade de interligar sistemas de comunicação com tecnologias diferentes de forma transparente para os usuários (internetworking). ä Novas aplicações interativas interconectadas via rede como conferências multimídia. ä Melhorias nos protocolos de interconexão de redes ä Uso de tecnologias que permitem garantir a qualidade e o desempenho dos serviços de comunicação. Jorge Luiz

18 Redes de Alta Velocidade e Aplicações ä Evolução das Telecomunicações ä Perfil da demanda está mudando: nos USA o tráfego de voz cresce a uma taxa de 3% enquanto o de dados cresce mais de 20%. ä As companhias estão diversificando seus serviços (TV a cabo, RDSI, etc) ä Vantagens da integração de todos serviços em uma única rede de telecomunicações e capacidade de oferecer novos serviços aos usuários. ä Já existe uma infra-estrutura digital que pode ser usada tanto para voz como para dados. Jorge Luiz

19 Redes de Alta Velocidade e Aplicações ä Evolução das Aplicações ä Educação a distância ä Entretenimento ä Vídeo conferência ä Biblioteca virtual ä Telemedicina ä Vídeo sob demanda ä HDTV Jorge Luiz

20 Redes de Alta Velocidade e Aplicações ä Resumindo ä Evolução conjunta das áreas de computação, comunicação de dados e telecomunicações. ä São pressionadas para oferecer tecnologias que suportam taxas de Gigabits por segundo e suporte às aplicações multimídia, integrando o tráfego de dados, voz e imagem de forma estática ou interativa. Jorge Luiz

21 Redes de Alta Velocidade e Aplicações ä Para se transmitir arquivos multimídia é importante que os serviços providos pela rede sejam confrontados com os requisitos dos conteúdos multimídia. ä Requisitos para transmissão de conteúdos multimídia ä Requisitos de largura de banda. Depende da qualidade do áudio e vídeo. ä Áudio com qualidade fone requer 64 Kbps ä Com qualidade CD requer 1,4 Mbps ä HDTV não comprimido requer 200 Mbps. Jorge Luiz

22 Redes de Alta Velocidade e Aplicações ä Requisitos para transmissão de conteúdos multimídia ä Fatores de sincronização requeridos para áudio e vídeo ä Retardo deve ser menor que 100 ms. ä Jitter e skew devem ser menores que 10 ms. ä Em vídeo, a sincronização dos lábios deve ser menor que 80 ms. ä Transmissão com qualidade fone, a taxa de erro de bits é cerca de 1%. Para qualidade CD a taxa deve ser melhor (0,1%). ä Fatores que influenciam a sincronização ä retardo ä jitter ä skew ä taxa de bits ä taxa de erro de bits Jorge Luiz

23 Redes de Alta Velocidade e Aplicações ä Tecnologias e Serviços de Redes Multimídia ä Serviços de redes WAN ä comutação de circuitos ä comutação de pacotes ä Internet ä Serviços de redes LAN ä Ethernet ä redes em anel ä ATM Jorge Luiz

24 Redes de Alta Velocidade e Aplicações ä Serviços de Redes WAN - Comutação de circuitos ä Requer pouca complexidade de processamento nos seus nós e suporta taxa bit constante ä Características ä estabelecimento de conexão fim-a-fim ä impossibilidade de estabelecer conexão qdo não existem circuitos disponíveis ä tarifação baseada na distância e no tempo de conexão Jorge Luiz

25 Redes de Alta Velocidade e Aplicações ä Serviços de Redes WAN - Comutação de circuitos ä Analógico ä Serviço telefônico atual - provê conexões até 56 Kbps. Para transmissões multimídia de baixa qualidade. ä Linhas privadas analógicas. ä Digital ä RDSI (BRI E PRI) - Rede Digital de Serviços Integrados ä Basic Rate Interface - de 128 Kbps a 192 Kbps. Para transmissões de voz digitalizada e vídeo conferência de baixa qualidade. ä Primary Rate Interface - 1,54 a 2 Mbps. Para vídeo com qualidade VCR. ä Linhas privadas digitais - T1, T2, T3 e T4. Inicia em 1,544 Mbps (T1) e vai até 274 Mbps (T4). T1 transporta vídeo com qualidade VCR e T4 pode transportar HDTV. Jorge Luiz

26 Redes de Alta Velocidade e Aplicações ä Serviços de Redes WAN - Comutação de pacotes ä Requer maior complexidade de processamento nos seus nós, mas oferece, em contrapartida, suporte ao tráfego inconstante, ou seja, com taxa de bit variável. ä Características ä pacotes de tamanho variável ä conexões lógicas multiplexando uma única conexão física ä aloca banda de transmissão sob demanda ä técnica tipo store-and-foward ä tarifação baseada no tráfego e no tempo Jorge Luiz

27 Redes de Alta Velocidade e Aplicações ä Serviços de Redes WAN - Comutação de pacotes ä X.25 - não é apropriado a transmissão multimídia em tempo real. Produz delay e jitter em excesso. ä Frame Relay - minimiza o retardo, pois não controla fluxo fim-a-fim e nem corrige erros. Até 1,544 Mbps. ä SMDS - serviço não orientado à conexão. Opera com taxas de 1,54 a 155 Mbps (com ATM) ä ADSL - (velox) - Usa fibra ótica. Prover taxa de até 1,544 Mbps, se o assinante estiver a menos de 5,5 km. Acesso a Internet e vídeo sob demanda. Jorge Luiz

28 Redes de Alta Velocidade e Aplicações ä Internet ä O protocolo TCP/IP não foi projetado para transmitir tráfego multimídia. O IP é um protocolo não confiável, best effort e não orientado à conexão. O TCP é orientado à conexão e, por isso, usa excessivos reconhecimentos e retransmissões de segmentos. ä Para suprir essas deficiências, foram criados outros protocolos para a Internet. ä RTP - protocolo de aplicação para transmissão multimídia em tempo real. ä RSVP - configura e controla recursos oferecidos pela rede, tais como largura de banda e buffers. Jorge Luiz

29 Redes de Alta Velocidade e Aplicações ä Internet ä Para superar os problemas encontrados na Internet, existem 2 pesquisas: ä Internet2 ä NGI (Next Generation Internet) Jorge Luiz

30 Redes de Alta Velocidade e Aplicações ä Vantagens da comutação de circuitos ä Inexistência de congestionamento ä Adequado para aplicações com taxa de transmissão fixa e alto índice de utilização ä Suporta aplicações sensíveis a atrasos, como a voz ä Vantagens da comutação de pacotes ä Utilização otimizada do meio de transmissão ä Adequado para aplicações com taxa de transmissão variável ä no caso de falha de nó ou enlace, permite o uso de rota alternativa Jorge Luiz

31 Redes de Alta Velocidade e Aplicações ä Redes Locais ä Não foram projetadas para transportar multimídia ä Ethernet, Fast Ethernet e Gigabit Ethernet ä Redes em anel - FDDI ä ATM ä Concebida para suportar tráfego multimídia, inclusive em tempo real ä Princípio da comutação de células (53 bytes) ä Células comutadas em hardware  baixo retardo ä Taxas de transmissão de 34 a 155 Mbps ä Com fibra ótica a taxa chega a 622 Mbps Jorge Luiz

32 3 a Parte Noções Básicas de Processos Estocásticos Jorge Luiz

33 Noções Básicas de Processos Estocásticos Suponham as seguintes variáveis: ä Tempo de CPU consumido por programas ä Número de pacotes no buffer de um roteador ä Número total de bytes enviados por dia ä Evolução do percentual médio de utilização da rede a cada segundo ä Intervalo de tempo entre pacotes recebidos ä Tempo de resposta de um servidor ATENÇÂO: o período (tempo) onde as variáveis são mensuradas tem uma grande importância no comportamento delas. Cada uma das variáveis acima são variáveis aleatórias que variam no tempo. Jorge Luiz

34 Noções Básicas de Processos Estocásticos ä O termo estocástico vem do grego. Significa conjecturar, supor, advinhar. Podemos imaginar que um Processo Estocástico é um processo sobre o qual só podemos ter palpites sobre o comportamento, mas jamais certezas. ä Processo estocástico é uma coleção de variáveis aleatórias indexadas pelo tempo. Representa-se por { X(t), t  T } ou então {X t, t  T} ä Espaço de parâmetros e de estados (T e E). ä O espaço de estados “E” representa o conjunto de todos possíveis valores que as variáveis podem assumir. Jorge Luiz

35 Noções Básicas de Processos Estocásticos ä Processos com parâmetro discreto e contínuo ä Processos com espaço de estado discreto e contínuo Para que serve? ä A finalidade do estudo dos processos estocásticos é compreender o comportamento da trajetória de um sistema com objetivo de fazer previsões e/ou controlar o futuro do sistema. Jorge Luiz

36 Noções Básicas de Processos Estocásticos Jorge Luiz TuTu t T u = tempo consumido de CPU por processos durante um dia T = { t  R  0  t  24 }, E = { x  R  x  0 } 0 24

37 Noções Básicas de Processos Estocásticos Jorge Luiz NpNp t N p = número de pacotes no buffer de um roteador durante um dia T = { t  R  0  t  24 }, E = { 0,1,...,n } 0 24

38 Noções Básicas de Processos Estocásticos Jorge Luiz NpNp t N b = número de total de bytes enviados por dia durante um ano T = { t  R  t = 1,2,...,365 }, E = { 0,1,...,n }

39 Noções Básicas de Processos Estocásticos Jorge Luiz EmEm t E m = evolução do percentual médio de utilização da rede a cada segundo durante uma hora T = { t  R  t = 1,2,...,3600}, E = { x  R  x  0 }

40 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico Pode ser considerado como uma média ponderada dos valores possíveis de x 1,..., x n. Se todos valores possíveis forem igualmente prováveis, então Se X discreto e tomar apenas um número finito de valores, então É interessante encontrar um conjunto de medidas que ressaltem as características dominantes da variável.

41 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico A variância mede a dispersão de uma v.a. em relação à sua média. Grandes valores de  2 implicam grande dispersão em relação à média. Pequenos valores implicam forte concentração da distribuição na vizinhança da média. A variância amostral é dada por:

42 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico

43 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico O primeiro momento de duas variáveis, X e Y, que nos dá uma medida de sua interdependência, é  (X,Y) = E[(X - m X )(Y - m Y )]. É chamado covariância de X e Y. Processo estocástico estacionário As funções de distribuição conjunta de um processo estacionário são iguais, ou seja, as funções de distribuição são invariantes sob mudanças da origem do tempo.

44 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico Suponha {X t }, t=0,1,2,... é um processo estocástico estacionário. Um processo estacionário tem média estacionária  = E[X t ], variância finita e estacionária  2 = E[(X t -  ) 2 ] e função de auto- covariância  k = E[(X t -  )(X t+k -  )], que depende somente de k e não de t. Isto é, para esse processo, a média e variância independem do tempo e a covariância da diferença dos tempos. Auto-covariância amostral é dada por

45 Noções Básicas de Processos Estocásticos Jorge Luiz Momentos de um Processo Estocástico Observe que  0 =  2. A função de auto-correlação de X t no atraso k é denotada como  k. Por definição a autocorrelação amostral é  k =  k /  0. Valores positivos de  mostram que X t+k tende a crescer com o crescimento de X t, enquanto valores negativos mostram que X t+k tende a decrescer. Um valor de  próximo de zero indica ausência de relação entre X t e X t+k. Valores próximos de +1 e -1 indicam auto grau de relação entre as variáveis.

46 4 a Parte Visão Geral sobre Modelagem de Tráfego Jorge Luiz

47 Visão Geral sobre Modelagem de Tráfego ä Ferramenta de maior utilização -> Teoria das Filas ä tráfego oferecido a uma fila ä efetua-se medidas de desempenho, através de metodologias analíticas ou simulações. ä O tráfego simples consiste: ä de chegadas de entidades (células, pacotes, etc.) ä formam um fluxo caracterizado por uma sequência de observações nos instantes de tempo...,t n-1, t n, t n+1,... Jorge Luiz

48 Visão Geral sobre Modelagem de Tráfego ä Processos que modelam chegadas de entidades discretas podem ser matematicamente descritos como processos pontuais compostos por uma seqüência de instantes de chegada t 0 = 0, t 1, t 2,..., t n, medidos a partir da origem zero. ä Descrições equivalentes de processo pontuais ä Processo de contagem ä Processo de intervalos entre chegadas Jorge Luiz

49 Visão Geral sobre Modelagem de Tráfego ä Processo de contagem {X t }  t=0 é um processo estocástico de valores inteiros não negativos e contínuo no tempo, onde X t é o número de chegadas no intervalo de tempo (0, t]. ä Processo de intervalos entre chegadas é uma seqüência aleatória não negativa {A n }  n=1, onde A n = t n - t n-1 é a duração do intervalo de tempo que separa a n-ésima chegada da anterior. Jorge Luiz

50 Visão Geral sobre Modelagem de Tráfego ä As observações podem descrever: ä intervalos de tempo entre chegadas sucessivas de comandos -> mostra o comportamento do usuário ä intervalos de tempo entre chegadas de pacotes ou os tamanhos dos pacotes -> mostra o comportamento da aplicação ä os Xt i normalmente tem uma fdp (função de distribuição de probabilidade) conhecida. Jorge Luiz

51 Visão Geral sobre Modelagem de Tráfego ä O que se deve mensurar: ä Telnet ä Intervalo de tempo entre chegadas de sessões (em segundos) ä ajusta-se a uma distribuição exponencial - f(x)= e - x ä Duração de cada sessão (entre o login e logout) ä distribuição log-normal ä Intervalo de tempo entre chegadas de pacotes ä distribuição de Pareto ä Tamanho do pacote (em bytes) ä nenhuma distribuição conhecida Jorge Luiz

52 Visão Geral sobre Modelagem de Tráfego Jorge Luiz  =3 f(x)= e - x

53 Visão Geral sobre Modelagem de Tráfego Jorge Luiz  =0.9 k=2,3,4,5 f(x)= .k  /x  +1, x=k,...,  )

54 Visão Geral sobre Modelagem de Tráfego ä O que se deve mensurar: ä FTP ä Chegadas de sessões FTP (num intervalo de 1 hora) ä ajusta-se a uma distribuição Poisson ä Número de arquivos transferidos numa sessão FTP ä nenhuma distribuição conhecida ä Tamanho de cada item de uma sessão FTP ä distribuição log-normal Jorge Luiz

55 Visão Geral sobre Modelagem de Tráfego Jorge Luiz  =2  =1

56 Visão Geral sobre Modelagem de Tráfego ä O que se deve mensurar: ä Tráfego de vídeo VBR ä Teleconferência - não tem mudanças de cenas ou corte e movimento moderado ä Intervalo de tempo entre frames é constante - 33 milisegundos para NTSC (30 frames/s) e 40 milisegundos para PAL-M (25 frames/s) ä Vídeo MPEG - fluxo mais explosivo - frequentes mudanças de cena e movimentos. Deve-se levar em consideração: ä Duração da cena ä Três tipos de frames codificados: Intra-coded(I), Predicition(P) e Bidirectional(B) -> Tamanho dos três tipos de frame. Jorge Luiz

57 Visão Geral sobre Modelagem de Tráfego ä O que modelar: ä Tráfego WWW - gerado pelos browsers ä Crovella provou que segue o modelo auto-similar ä Intervalo de tempo médio entre solicitações - depende da popularidade do site e do número de usuários. Site da NCSA tem solicitações/dia. Para um usuário, o número médio de solicitações é 5,75 em 1/2 hora. Poisson. ä Tamanho do documento transferido - Ajusta-se a uma distribuição de Pareto com 0,40    0,63 e   21 kbytes. Grau de variação do tamanho do doc. é muito grande. Variedade de documentos (HTML, images(gif, jpeg, bitmap), postscript, audio(wav, etc.) e vídeo(MPEG) Jorge Luiz

58 Visão Geral sobre Modelagem de Tráfego ä O que modelar: ä Tráfego WWW - gerado pelos browsers ä Crovella provou que segue o modelo auto-similar ä Intervalo de tempo médio entre solicitações - depende da popularidade do site e do número de usuários. Site da NCSA tem solicitações/dia. Para um usuário, o número médio de solicitações é 5,75 em 1/2 hora. Poisson. ä Tamanho do documento transferido - Ajusta-se a uma distribuição de Pareto com 0,40    0,63 e   21 kbytes. Grau de variação do tamanho do doc. é muito grande. Variedade de documentos (HTML, images(gif, jpeg, bitmap), postscript, audio(wav, etc.) e vídeo(MPEG) Jorge Luiz

59 Visão Geral sobre Modelagem de Tráfego ä Como obter os traces de dados: ä tcpdump ä ntop ä Existem traces prontos na Internet. ä Simuladores de rede ä NS (Network Simulator) ä OPNET ä Analisadores de tráfego ä NetSpec ä HP LAN Analyzer Jorge Luiz

60 5 a Parte Modelos para Modelar Tráfego Jorge Luiz

61 Modelos Tradicionais ä Processos de Renovação ä Variáveis são independentes e identicamente distribuídas (IID) - as observações no tempo t não dependem de observações do passado ou do futuro. ä Característica -> inexistência de uma função de autocorrelação ä Processos de renovação mais usados em modelagem de tráfego ä Poisson ä Bernoulli Jorge Luiz

62 Modelos Tradicionais POISSON ä Um processo de Poisson descreve o número de chegadas de entidades observadas no intervalo de tempo (0,t]. Tem a seguinte fdp: ä O n-ésimo tempo A n entre duas chegadas sucessivas é descrito por uma distribuição exponencial: Jorge Luiz

63 Modelos Tradicionais BERNOULLI ä As chegadas podem acontecer em algum slot de tempo. A probabilidade de uma chegada em um slot de tempo é p, independente das outras chegadas. A probabilidade que aconteçam k chegadas em n slots de tempo é dada por: Jorge Luiz

64 Modelos Tradicionais ä Processos de Renovação ä Possíveis aplicações ä Chegada de usuários para utilizar alguma facilidade (aplicação) do computador ä Chegada de pacotes em um nó da rede, desde que o tráfego observado não apresente autocorrelação. ä Fluxo de comandos digitados pelo usuário, desde que não se observe dependência proveniente do passado. ä Supõem que o tráfego não é correlacionado ä Na realidade o tráfego é correlacionado, contradizendo a suposição da independência da V.A. Jorge Luiz

65 Modelos Tradicionais Processos de Markov Jorge Luiz

66 Modelos Tradicionais Processos Markovianos ä Descreve dependências entre os X t. ä A probabilidade (p ij ) do próximo estado observado X n+1 =j depende somente do estado atual X n =i. ä p ij independe do tempo que o processo permaneceu no seu estado atual. ä Para definir a probabilidade da cadeia estar em um dado estado no presente basta olhar onde ela estava no instante imediatamente anterior. Esta propriedade é chamada de Propriedade Markoviana. Jorge Luiz

67 Modelos Tradicionais Processos Markovianos Um bêbado deseja se deslocar de um ponto A para um ponto B. Chamemos de X t a posição do bêbado no instante t. Para simplificar, suponhamos que o bêbado só possa se deslocar uma posição para trás e para frente ou então permanecer na mesma posição que ele estava no instante anterior, com a mesma probabilidade Jorge Luiz

68 Modelos Tradicionais Jorge Luiz AB

69 Modelos Tradicionais Jorge Luiz AB

70 Modelos Tradicionais Jorge Luiz AB

71 Modelos Tradicionais Jorge Luiz AB

72 Modelos Tradicionais Jorge Luiz AB

73 Modelos Tradicionais Jorge Luiz AB

74 Modelos Tradicionais Jorge Luiz AB

75 Modelos Tradicionais Jorge Luiz AB

76 Modelos Tradicionais Jorge Luiz AB

77 Modelos Tradicionais Jorge Luiz AB

78 Modelos Tradicionais Jorge Luiz AB

79 Modelos Tradicionais Jorge Luiz AB

80 Modelos Tradicionais Jorge Luiz AB

81 Modelos Tradicionais ä Depois de doze passos o bêbado está no estado 2. Seja X n a posição do bêbado no instante n. Lembre- se que E = {A,1,2,3,4,5,6,7,8,B} e T  Z +. Observe que P( X 13 = 3 | X 12 = 2 ) = 1/2 P( X 13 = 5 | X 12 = 2 ) = 0 ä A propriedade Markoviana não é uma propriedade válida para todos os processos e aqueles que a possuem são ditos Markovianos. Jorge Luiz

82 Modelos Tradicionais Exemplo - mudança do estado de uma rede ä Considere uma rede que pode estar em um de dois estados: UP e DOWN. ä Considere o conjunto E = {0,1} para representar os estados dessa rede: 0 corresponde a DOWN e 1 a UP. ä O estado dessa rede é observado a cada hora. T = {0,1,2,...}  Desta forma temos uma cadeia estocástica {X n }, onde X n é o estado da rede na n-ésima hora de observação. Jorge Luiz

83 Modelos Tradicionais ä Considere ainda que: ä Se a rede estiver no estado UP a probabilidade dela falhar na próxima hora é dada por  ; ä Se a rede estiver no estado DOWN a probabilidade de se consertar a falha na próxima hora é  ; ä Probabilidades de transição: p 00 = P(X n+1 = 0 | X n = 0) = 1 -  p 01 = P(X n+1 = 1 | X n = 0) =  p 10 = P(X n+1 = 0 | X n = 1) =  p 11 = P(X n+1 = 1 | X n = 1) 1 -  Jorge Luiz

84 Modelos Tradicionais Diagrama de transição P Jorge Luiz 10  1 -   1 - 

85 Modelos Tradicionais ä A matriz de transição P é dada por: Jorge Luiz 1 -    1 -  = P down na hora n up na hora n down na hora n+1 up na hora n+1

86 Modelos Tradicionais ä Modelos de Tráfego usando Cadeias de Markov ä Possíveis aplicações ä Comportamento do usuário no terminal. A próxima ação é determinada pela ação anterior. ä Falha / mudança do estado da Rede ou do sistema. Jorge Luiz

87 Modelos Modelos Estocásticos Lineares (Séries Temporais) Jorge Luiz

88 Modelos Estocásticos Lineares ä Série Temporal é a classe de fenômenos cujo processo de observação e a conseqüente quantificação numérica gera uma seqüência de dados distribuídos no tempo. Na maioria das séries, as observações são tomadas em intervalos de tempo discretos e eqüidistantes. ä Uma série temporal discreta pode ser representada por X T = { x 1, x 2,..., x T }, sendo que cada observação discreta x t está associada a um instante de tempo distinto. Jorge Luiz

89 Modelos Estocásticos Lineares ä O objetivo inicial da análise de séries temporais é a realização de inferências sobre as propriedades ou características básicas do mecanismo gerador do processo estocástico das observações da série. A partir das observações da série é possível construir um modelo matemático que represente a realidade de forma simplificada. ä Após a construção do modelo, é possível utilizá- lo para testar hipóteses e realizar a previsão de valores futuros da série. Jorge Luiz

90 Modelos Estocásticos Lineares ä Considerando um conjunto de observações de uma série temporal coletadas até o instante t e de um modelo que represente esses fenômenos, a previsão do valor da série no tempo t + h pode ser obtida. Jorge Luiz t+ht

91 Modelos Estocásticos Lineares ä Método de previsão é um conjunto de procedimentos usados no desenvolvimento de um determinado prognóstico. Se baseia na suposição de que observações passadas contém todas informações sobre o padrão de comportamento da série e esse padrão é recorrente no tempo. ä O propósito dos métodos de provisão consiste em distinguir o padrão de qualquer ruído que possa estar contido nas observações e então usar para prever os valores futuros. Jorge Luiz

92 Modelos Estocásticos Lineares Método de previsão Jorge Luiz Univariados Funções de Transferência Multivariados Univariados Decomposição Simples de previsão Avançados

93 Modelos Estocásticos Lineares Método de Decomposição ä Identifica componentes (não observáveis) individuais presentes no padrão básico da série histórica de dados e a partir daí extrapola o futuro. ä X t = f(S t, T t, C t, E t ) ä S t é a componente sazonal para o período t ä representa as flutuações da série de acordo com algum fator de sazonalidade. ä C t é a componente de ciclo para o período t ä comportamento similar ao sazonal, embora tenha comprimento maior Jorge Luiz

94 Modelos Estocásticos Lineares Método de Decomposição ä T t é a componente de tendência para o período t ä representa o aumento ou declínio gradual nos valores das observações. ä E t é a componente aleatória no período t ä É determinada pela identificação e remoção das componentes anteriores. Jorge Luiz

95 Modelos Estocásticos Lineares Método Simples de Previsão ä Considera como previsão para o período futuro a média das observações passadas recentes. ä Método da Média Móvel - mais conhecido ä O termo média móvel é usado porque à medida que a próxima observação se torna disponível, a média das observações é recalculada, incluindo essa observação no conjunto das observações e desprezando a observação mais antiga.

96 Modelos Estocásticos Lineares Método Avançados de Previsão ä Os modelos mais conhecidos são: ä AR(p) - Autoregressivo Linear de ordem p ä MA(q) - Médias Móveis de ordem q ä ARMA(p,q) - Autoregressivo e de Médias Móveis ä ARIMA(p,d,q) - Autoregressivo integrado e de Médias Móveis ä Box e Jenkins ä Esses modelos obtém a previsão de algum valor futuro da série temporal pela combinação dos valores reais passados e/ou dos erros ocorridos. Jorge Luiz

97 Modelos Estocásticos Lineares Modelo Autoregresssivo - AR(p) ä É dado pela equação: onde x t corresponde à observação da série no tempo t, ou seja, x t é a soma ponderada dos p valores anteriores mais o ruído aleatório ou ruído branco;  p corresponde ao parâmetro do modelo AR de ordem p;  t representa o erro de eventos aleatórios que não podem ser explicados pelo modelo. Jorge Luiz

98 Modelos Estocásticos Lineares Modelo de Médias Móveis - MA(q) ä É dado pela equação: onde  t representa o erro dos eventos aleatórios que nâo podem ser explicados pelo modelo;  q corresponde ao parâmetro do modelo MA de ordem q; Essa equação é similar à equação anterior, exceto pelo fato de que o valor previsto para a observação depende dos valores dos erros observados em cada período passado, ao invés das próprias observações. Jorge Luiz

99 Modelos Estocásticos Lineares Modelo Autoregressivo e de Médias Móveis - ARMA(p,q) ä É dado pela equação: os modelos ARMA relacionam os valores futuros com as observações passadas, assim como também com os erros passados apurados entre os valores reais e os previstos. Jorge Luiz

100 Modelos Estocásticos Lineares Modelo Autoregressivo Integrados - ARIMA(p,d,q) ä É dado pela equação: sendo w t = x t - x t-d ; onde  p e  q são os parâmetros do processo ARMA de ordem p e q;  t representa o erro dos eventos aleatórios que nâo podem ser explicados pelo modelo; d eqüivale ao grau de homogeneidade não-estacionária. Jorge Luiz

101 Modelos Estocásticos Lineares Método de BOX e JENKINS ä Consiste na busca de um modelo ARIMA que represente o processo estocástico gerador da série temporal, a partir de um modelo ARMA aplicável na descrição de séries temporais estacionárias, estendendo esse conceito para séries temporais não estacionarias. Jorge Luiz

102 Modelos Distribuição de Caudas Pesadas Jorge Luiz

103 Distribuição de Caudas Pesadas Jorge Luiz Cálculo x -  para  = 0.5, 1, 1.5 Para  fixo, a medida que x cresce, a função não tende a zero. Quanto menor o valor de , mais vagarosamente a função tende a zero.

104 Distribuição de Caudas Pesadas Características ä V.A. que tem distribuição de caudas pesadas apresentam uma grande variabilidade nos valores observados. A média é muito afetada pelos valores extremos. ä A variância ou o desvio padrão é muito grande. Uma distribuição de cauda pesada tem grande infinita. ä Se o fenômeno observado apresenta grande variabilidade em diversas escalas de tempo, a distrib. de probabilidade tem que ter caudas pesadas. Jorge Luiz

105 Distribuição de Caudas Pesadas Forma ä A v.a. X segue uma distribuição de cauda pesada se: ä Por ex., a distribuição normal N(0,1) não tem caudas pesadas. P( N(0,1)>3 )  0. ä Uma distribuição de caudas pesadas apresenta probabilidades diferentes de 0 para valores grandes de x. Jorge Luiz

106 Distribuição de Caudas Pesadas Jorge Luiz  =0.9 k=2,3,4,5 f(x)= .k  /x  +1, x=k,...,  )

107 Distribuição de Caudas Pesadas Distribuição de Pareto A função de distribuição acumulada é: Jorge Luiz

108 Distribuição de Caudas Pesadas Variáveis encontradas no estudo do comportamento das redes que seguem uma distribuição de caudas pesadas: ä tempo de transmissão de arquivos; ä tamanho de arquivos disponíveis nos servidores Web; ä Tempo entre chegadas de pacotes em roteadores da Internet; ä número de sites visitados; Jorge Luiz

109 Modelos Modelo Auto-Similar Jorge Luiz

110 Modelo Auto-Similar Jorge Luiz Conjuntos Cantor com 5 níveis de recursão

111 Modelo Auto-Similar S 0 = [0,1] S 1 = [0,1/3] U [2/3,1] s 2 = [0,1/9] U [2/9,1/3] U [2/3,7/9] U [8/9,1] Duas propriedades do fenômeno auto-similar: ä o conjunto mantém um padrão na sua estrutura, mesmo em escalas pequenas ä A estrutura se repete. Uma estrutura auto-similar contém pequenas réplicas de si mesma. Jorge Luiz

112 Modelo Auto-Similar ä Seja {X t } um processo estocástico estacionário ä média estacionária:  = E[X t ] ä variância finita e estacionária: v = E[(X t -  ) 2 ] ä auto-covariância estacionária:  k = E[(X t -  )(X t+k -  )] ä Se k=0, então v =  0 ä auto-correlação no atraso k é  k. Por definição  k =  k /  0 Jorge Luiz

113 Modelo Auto-Similar ä Dividir {X t } em blocos não superpostos de tamanho m. ä É criar uma novas séries de tempo ou séries amostrais de X t ä Seja X j (m) é a media amostra X jm-m X jm, então X j (m) = ( X jm-m X jm) ) / m ä Se o processo é um ruído branco, então os X jm- m X jm serão mutuamente não correlacionados, i.e.,  k = 0 e v m = vm -1 ä No caso que  k  0 e  k=-    k < , a variância da média da amostra v m decai para zero proporcionalmente a m -1, i.e., v m  vcm -1 Jorge Luiz

114 Modelo Auto-Similar ä O processo de Markov e as séries temporais conhecidas (AR,MA,ARMA) tem um v m decaindo dessa forma. ä Existem processos em v m decai mais lentamente, i.e., a uma taxa menor que m -1. Por ex. v m poderia decair proporcionalmente a m - , para algum   (0,1). ä Se v m é proporcional a m - , então  k=-    k é proporcional a m 1- , i.e.,  k=-    k  Cm 1-  ä Como  < 1, implica que  k=-    k   e que a auto- correlação decai lentamente de uma forma não totalizável. Jorge Luiz

115 Modelo Auto-Similar Jorge Luiz Decaimento rápido da auto-correlação

116 Modelo Auto-Similar Jorge Luiz Decaimento mais lento da auto-correlação

117 Modelo Auto-Similar Dependências de Curto e Longo Alcance ä Um processo {X t } é dito ter dependência de curto alcance, se  k=-    k < . Sua função de auto- correlação decai exponencialmente e os {X j (m) } tendem a um ruído puro qdo m  . ä Um processo {X t } é dito ter dependência de longo alcance, se  k=-    k  . Sua função de auto- correlação decai mais lentamente (hiperbolicamente) e os {X j (m) } não formam um ruído puro. Jorge Luiz

118 Modelo Auto-Similar Processo Auto-Similar (definição) ä Um processo {X t } é dito ser exatamente auto-similar de segunda ordem, se  k (m) =  k,  m e k, i.e., a estrutura da correlação é preservada em diferentes escalas de tempo. ä Um processo {X t } é dito ser assintoticamente auto- similar se  k (m)   k, para m e k grande. ä Exemplo de processos auto-similar: FBm Jorge Luiz

119 Modelo Auto-Similar Como identificar um Processo Auto-Similar ä O parâmetro H (Hurst) é um indicador de auto- similaridade. ä É uma medida que verifica a “persistência”do processo em um longo período. ä Processo que tem LRD: 0,5 < H < 1 ä Como estimar H ä estatística R/S ä baseado na análise do pediograma ä estimador de Abry-Veit Jorge Luiz

120 FIM Jorge Luiz Muito obrigado


Carregar ppt "Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia."

Apresentações semelhantes


Anúncios Google