A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Modelagem e avaliação da indisponibilidade do serviço devido ao tempo de resposta longo WPerformance (SBC) – Campo Grande/Julho 2006 Magnos Martinello**,

Apresentações semelhantes


Apresentação em tema: "Modelagem e avaliação da indisponibilidade do serviço devido ao tempo de resposta longo WPerformance (SBC) – Campo Grande/Julho 2006 Magnos Martinello**,"— Transcrição da apresentação:

1 Modelagem e avaliação da indisponibilidade do serviço devido ao tempo de resposta longo WPerformance (SBC) – Campo Grande/Julho 2006 Magnos Martinello**, Mohamed Kaâniche*, Karama Kanoun* e Carlos A. Melchor* **UFES

2 2 Introdução Servidores bem gerenciados atingem uma disponibilidade de 99% a 99.9% (de 8 a 80 horas de indisponibilidade por ano) Indisponibilidade do serviço web pode custar milhões dependendo da importância e da duração * No caso da Amazon, cada hora pode custar $200.000 * * Patterson et all, Recovery Oriented Computing – ROC project, 2002.

3 3 Introdução É difícil acessar o site de um grande jornal depois de uma notícia extremamente impactante Esses períodos são usualmente mais importantes para o provedor Indisponibilidade não planejada custa mais caro do que indisponibilidade planejada * * E. A. Brewer, Lessons from Giant-Scale Services, IEEE Internet Computing 2001.

4 4 Múltiplos fatores causam indisponibilidade Quanto a localização Falhas no host do usuário Falhas na Internet Falhas nos provedores de serviço Quanto aos tipos Falhas de hardware e software Performance: perda de pacotes, sobrecarga de servidores, etc; Ponto de vista do usuário Serviço é percebido como degradado ou indisponível se o tempo de resposta é longo comparado com sua expectativa Tempo de resposta longo desencoraja usuários Tempo de resposta longo representa uma causa considerável de indisponibilidade do serviço ? Causas de indisponibilidade do serviço

5 5 Definição da medida usando recompensa Avaliação da medida baseada em teoria de filas Sistema mono servidor Sistema multi servidor Conclusão e perspectivas Plano

6 6 Probabilidade que o serviço seja provido dentre de um delay aceitável (d), com uma qualidade de serviço (Φ), ambos especificados à priori P[ R Φ Supondo que desejamos que 90% das requisições tenham um tempo de resposta (R) inferior a 5 segundos, então Φ =0.9 e d=5. Indisponibilidade do serviço devido ao tempo de resposta longo

7 7 Definição formal Serviço disponível (A) i K 1 Serviço indisponível (UA) Ω Partição dos estados do serviço em dois grupos Ω : conjunto dos estados p i : probabilidade que o serviço esteja no estado i Cada estado recebe uma recompensa (denotada por r i )

8 8 Avaliação da medida Passo 1 : Avaliar a distribuição do tempo de resposta a fim de determinar o threshold K Passo 2 : Avaliar UA a partir da probabilidade de ocupação dos estados p i Visto que a recompensa r i = 1, i=0…K

9 9 i Sistema mono servidor Distribuição de probabilidade do tempo de resposta condicional P[R(i) < d] = Soma de i+1 V.A. i.i.d μ K Distribuição de probabilidade do tempo de resposta : Erlang UA para um sistema mono servidor fila infinita (M/M/1) fila finita de tamanho b (M/M/1/b) onde ρ denota a carga ou utilização

10 10 Probabilidade do tempo de resposta Número de requisições P [R(i) < d] μ=12.5 μ=25 μ=50 μ=75 Délai (d)=1 Taxa de serviço (μ) K=7 K=18 K=40 K=63 K = threshold Qualidade de serviço (Φ=0.9)

11 11 Efeitos da carga em UA μKρ=0.9ρ=0.8ρ=0.7 12.574.3e-011.6e-015.7e-02 25181.3e-011.4e-021.1e-03 50401.3e-021.0e-044.4e-07 75631.2e-036.2e-071.2e-10 Taxa de serviço (μ) Threshold (K) Carga (ρ)

12 12 Aproximação de UA Simplificar o procedimento de avaliação de UA Interessante eliminar a etapa intermediária Expressar UA diretamente em função de parâmetros conhecidos tais como taxa de serviço (μ) e delay aceitável (d)

13 13 Aproximação de K a partir de P[R(i) < d] Número de requisições P [R(ud) < d] μd=12.5 μd=25 μd=50 μd=75 Délai(d)=1 Taxa de serviço(μ) P[R(K = ud) < d] ~ 0.5 P[R(Existe um K = ????) < d] ~ θ

14 14 Aproximação de UA De fato, após vários testes, obtivemos Onde α é uma constante configurável Por exemplo, para Φ=0.9 -> α =1.35

15 15 Aproximação de UA = 0.95 0.9 0.8 0.6 Aproximação μd UA= K+1 K d - d ( = 1.35 for = 0.9)

16 16 Definição da medida usando recompensa Avaliação da medida baseada em teoria de filas Sistema mono servidor Sistema multi servidor Conclusão e perspectivas Plano

17 17 Sistema multi servidor μ K i μ μ 1 c i < c nova chegada é processada imediatamente Tempo de resposta é exponencialmente distribuído com taxa μ i c nova chegada deve esperar (i-c+1) serviços terminarem Tempo de resposta é a soma (convolução) de uma V.A. Erlangiana com uma V.A. exponencial As provas das expressões analíticas fechadas e a implementação em maple são apresentadas no artigo.

18 18 Distribuição do tempo de resposta P[R(i) d] Φ=0.9 μd=75 c = 1c = 5c = 2c = 3c = 4

19 19 Indisponibilidade do serviço (UA por ano) Configuration # servers, c μ ρ = 0.8 ρ = 0.9 ρ = 0.95 A 1212.505 s32 h; 28 mins B 62501 s15 h; 17 mins C 3500011 h; 07 mins D 2750010 h; 16 mins E 11500009 h; 04 mins Taxa de serviço agregada cμ = 150 requisições / seg

20 20 Indisponibilidade do serviço (UA por ano) c μ = 25 μ = 50 μ = 75 149 d; 07 h; 22 mins4 d; 20 h; 29 mins 10 h; 16 mins 2 6 d; 07 h; 24 mins 01 h; 09 mins0 3 15 h; 51 mins00 4 01 h; 38 mins00 5 07 mins00 = 0.9

21 21 Conclusão Abordagem baseada em modelagem analítica Expressões analíticas fechadas em sistemas mono e multi- servidor Distribuição do tempo de resposta Indisponibilidade devido ao tempo de resposta longo Resultados Para cargas relativamente pesadas ( ρ 0.7), UA mostrou-se desprezível Sistemas com pouca capacidade de serviço sujeitos a cargas pesadas ( ρ 0.9) são potenciais candidatos à indisponibilidade devido ao tempo de resposta longo Capacidade agregada equivalente: UA mono servidor < UA multi-server

22 22 Perspectivas Indisponibilidade devido ao tempo de resposta Visão de uma única fila Análise assume que todos os servidores estão disponíveis Indisponibilidade de serviço fim-a-fim Medições ativas na internet Analisar a dispersão de pares de pacotes Usar o modelo analítico para verificar indisponibilidade no gargalo do caminho

23 23 Tempo de resposta longo como fonte de indisponibilidade Derivar a distribuição do tempo de resposta não é trivial É importante ressaltar o fato que a abordagem não distingue explicitamente as causas que conduzem a um tempo de resposta longo. Entretanto, a abordagem permite avaliar quantitativamente os efeitos do tempo de resposta longo na indisponibilidade do serviço. Avaliação quantitativa


Carregar ppt "Modelagem e avaliação da indisponibilidade do serviço devido ao tempo de resposta longo WPerformance (SBC) – Campo Grande/Julho 2006 Magnos Martinello**,"

Apresentações semelhantes


Anúncios Google