A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Restrições Lineares sobre os Reais/Racionais Muitos problemas podem ser modelados através de variáveis reais (ou racionais), denominadas variáveis de.

Apresentações semelhantes


Apresentação em tema: "1 Restrições Lineares sobre os Reais/Racionais Muitos problemas podem ser modelados através de variáveis reais (ou racionais), denominadas variáveis de."— Transcrição da apresentação:

1 1 Restrições Lineares sobre os Reais/Racionais Muitos problemas podem ser modelados através de variáveis reais (ou racionais), denominadas variáveis de decisão. Todas as restrições sobre essas variáveis são lineares. Geralmente pretendem-se soluções que optimizem uma função (linear) objectivo - optimização condicionada Exemplos: gestão da produção redes de distribuição

2 2 Gestão da Produção Dados: a)Um conjunto de itens P 1,..., P n que se pretende produzir b)Um conjunto de recursos R 1,..., R m disponíveis para os produzir c)Uma matriz A, cujos elementos a ij representam a quantidade do recurso i necessário para produzir uma unidade do item j d)Um vector C, cujos elementos c j representam o lucro obtido por cada unidade do item j produzido e)Um vector B, cujos elementos b i representam a quantidade máxima do recurso i que pode ser utilizado Objectivo: Determinar a quantidade a produzir de cada item j

3 3 Gestão da Produção Gestão 0: Restrições Base Designando por X i a quantidade do item P i produzido, o problema, a não sobre-utilização dos recursos existentes é modelada por a 11 X 1 + a 12 X a 1n X n =< b 1... a m1 X 1 + a m2 X a mn X n =< b m Por exemplo, sendo necessárias 3 minutos de uma máquina para fabricar 1 sapato e 4 horas para 1 bota, representando por S e B o número de sapatos e botas e estando a máquina disponível 4 horas temos 3 S + 4 B =< 240

4 4 Gestão da Produção Gestão 1: Satisfação (de um dado lucro) Para modelar que um dado lucro L é atingido, adiciona-se ao modelo anterior a restrição c 1 X 1 + c 2 X c n X n >= L Por exemplo, se se obtem um lucro de 4(5) por cada sapato (bota) vendido, pretender que o lucro seja pelo menos de 3000 é modelada pela restrição Max L = 3 S + 4 B Gestão 2: Optimização (do lucro obtido) Para modelar a maximização do lucro obtido, adiciona-se ao modelo inicial a função objectivo L (a maximizar) Max L = c 1 X 1 + c 2 X c n X n

5 5 Gestão da Produção (Dual) Dados: a)Um conjunto de itens P 1,..., P n que se pretende produzir b)Um conjunto de recursos R 1,..., R m disponíveis para os produzir c)Uma matriz A, cujos elementos a ij representam a quantidade do recurso i necessário para produzir uma unidade do produto j d)Um vector C, cujos elementos c j representam o custo mínimo por cada unidade do item j produzido e)Um vector B, cujos elementos b j representam a quantidade do recurso j a utilizar Objectivo: Determinar os custos por recurso adequados

6 6 Gestão da Produção (Dual) Gestão 0d: Restrições Base Designando por Y j o custo incorrido por cada unidade do recurso j gasto, as restrições que impõe um custo mínimo por unidade de item i produzido são modeladas por a 11 Y 1 + a 21 Y a m1 Y m >= c 1 a 12 Y 1 + a 22 Y a m2 Y m >= c 2... a 1m Y 1 + a 2m Y a mn Y m >= c n

7 7 Gestão da Produção (Dual) Gestão 1d: Satisfação (de um dado custo total) A garantia de que o custo total do plano de produção não excede um valor V é modelada, por adição ao modelo da restrição b 1 Y 1 + b 2 Y b m Y m =< V Gestão 2d: Optimização (do custo total) Para modelar a minimização dos custo total do plano de produção, adiciona-se a função objectivo V (a minimizar) Min V = b 1 Y 1 + b 2 Y b m Y m

8 8 Redes de Distribuição Dados: a)Um conjunto de nós P 1,..., P n, dos quais P 1 é emissor e P n o receptor b)Uma matriz M, cujos elementos m i,j representam a capacidade da ligação (em bits/seg) entre os nós i e j c)Uma matriz C, cujos elementos c i,j representam o custo (em /bit) da transmissão entre os nós i e j; Objectivo: Avaliar o fluxo de informação que a rede é capaz de transmitir entre os nós emissor (P 1 ) e receptor (P n ).

9 9 Redes de Distribuição Restrições Base: Designando por X i,j a quantidade de informação debitada entre os nós i e j, as restrições de capacidade são X 1,1 =< m 1,1 % Em geral m i,i = 0... X m,n =< m m,n As restrições de igualdade de fluxo de entrada e saída em todos os k nós (excepto nos nós P 1 e P n ) são modeladas por X 1,2 +X 2,2 +X 3, X n,2 = X 2,1 +X 2, X 2,n X 1,3 +X 2,3 +X 3, X n,3 = X 3,1 +X 3, X 3,n... X 1,k +X 2,k +X 3,k +...+X n,k = X k,1 +X k, X k,n

10 10 Redes de Distribuição Redes 1: Satisfação (de um fluxo F entre P 1 e P n ) A verificação de que é possível transmitir um determinado fluxo de informação F entre os nós emissor (P 1 ) e receptor (P n ) é modelada pela adição da restrição X 1,2 +X 1,3 +X 1, X 1,n >= F (ou X 1,n +X 2,n +X 3,n +...+X n-1,,n >= F ) Redes 2: Optimização (do custo total) Para modelar o máximo fluxo de informação que a rede é capaz de transmitir entre os nós P 1 e P n, adiciona-se a função objectivo F (a minimizar) Max F = X 1,2 +X 1,3 +X 1, X 1,n

11 11 Formalização Os problemas de satisfação de restrições lineares sobre variáveis (de decisão) X i reais (ou racionais, se todos os parâmetros a ij são números racionais) têm a forma a 11 X 1 + a 12 X a 1n X n ρ 1 b 1 a 21 X 1 + a 22 X a 2n X n ρ 2 b 2... a m1 X 1 + a m2 X a mn X n ρ m b m em que ρ 1.. ρ m são quaisquer do conjunto {, =,,, } Se se pretender a optimização das variáveis de decisão, inclui-se a optimização de uma função (linear) objectivo F Opt F = c 1 X 1 + c 2 X c n X n em que Opt pode ser um de {Max, Min, Sup, Inf}.

12 12 Interpretação Geométrica Dado um espaço com n dimensões, a restrição a i1 X 1 + a i2 X a in X n = b i define uma região admissível, correspondente aos pontos de um hiper-plano desse espaço. Como casos particulares temos um espaço tridimensional (n=3), em que o hiper-plano corresponde ao plano usual, e um espaço bidimensional (ou vulgar plano, n=2) em que o hiper-plano se reduz a uma recta. A restrição define uma região admissível que corresponde a todos os pontos do espaço n-dimensional, excepto os pontos do hiper-plano

13 13 Interpretação Geométrica As restrições e definem regiões admissíveis do tipo semi-hiper-espaço limitado pelo correspondente hiper- plano, incluído na região admissível. Com n=3 temos um semi-espaço e com n=2 um semi-plano. As restrições definem regiões admissíveis semelhantes, mas excluindo a fronteira. O conjunto de restrições define, num espaço a n dimensões, um hiper-poliedro (poliedro com n=3 e polígono com n=2) correspondente à intersecção das m regiões admissíveis (m+n com não negatividade). Algumas faces do hiper-poliedro pertencem ({, ) à região admissível e outras não ( ). Devem ainda ser considerados hiper-planos de exclusão ().

14 14 Interpretação Geométrica Com exclusão das restrições, a região admissível é convexa. Em problemas de optimização a função C = c 1 X 1 + c 2 X c n X n define uma família de hiper-planos paralelos (um para cada valor de C). O supremo e o ínfimo dessa função na região admissível corresponde a um (hiper-)vértice do hiper-poliedro, o último ponto em que um hiper-plano da função objectivo toca a região admissível quando se desloca para valores crescentes (Sup) ou decrescentes (Inf) de C.

15 15 Interpretação Geométrica Se esse vértice pertencer à região admissível ele corresponde igualmente ao seu Max ou Min Caso contrário (i.e. se foi excluído por alguma restrição >, < ou ) não existem Max/Min mas apenas Sup/Inf. No caso em que o vértice de óptimo pertence a uma aresta ou um lado do hiper-poliedro paralelos à família de hiper-planos de optimização, haverá em geral mais do que um ponto óptimo, já que a função objectivo tem o mesmo valor em todos os pontos dessas arestas e lados.

16 16 Exemplo (2 dimensões) max X1 + X2 Suj.2 X1 + X2 8 X1 + X2 3 X1 - X2 -5 X2 0 X2X2 x1x1 2 X1 + X2 8 X1 - X2 -5 X1 0 X1 + X2 3 X1 + X2 = k

17 17 Complexidade Potencial Apesar de o espaço de pesquisa ser infinito, o problema de satisfação reduz-se à verificação de que as restrições definem um hiper-poliedro não vazio. Assim, pelo menos um dos vértice definidos pelos hiper- planos de fronteira das restrições (excepto restrições ) deve pertencer à região admissível. Como n restrições de igualdade num espaço n-dimensional definem univocamente um ponto (solução de um sistema de n equações a n incógnitas), no pior caso, ter-se-á de verificar a pertença à região admissível de C m n pontos. Na prática, o número de vértices a testar é muito inferior. No pior caso, a complexidade do problema de satisfação é idêntica a um problema de optimização.

18 18 Formas Resolvidas Apesar de os problemas poderem ser resolvidos na forma de geração e teste dos vários vértices, existem algoritmos que os resolvem de uma forma mais eficiente. Em particular, estaremos interessados em algoritmos que resolvam as restrições de uma forma simbólica (algébrica) Através de um conjunto de manipulações algébricas, transforma-se o problema inicial numa Forma Resolvida. Esta transformação é possível se e apenas se o conjunto de restrições inicial fôr satisfazível. Vamos abordar estas formas resolvidas para sistemas de restrições com riqueza de expressão crescente.

19 19 Restrições Não-Estritas / Variáveis Não-negativas As restrições de desigualdade podem ser substituidas por restrições de igualdade através da adição de variáveis de desvio (slacks), igualmente não negativas a i1 X a in X n b i a i1 X a in X n + S i = b i a i1 X a in X n b i a i1 X a in X n - S i = b i A existência de uma forma resolvida para estes sistemas de restrições é justificada pelo seguinte Lema 1: Todo o sistema de m equações a m+n incógnitas não negativas, é satisfazível sse admitir uma solução em que n variáveis são nulas. Demonstração (Lema 1) Se existe uma solução então o sistema é satisfazível.

20 20 Lema 1 (exemplo) Um exemplo permite perceber melhor os passos desta demonstração. Considere-se o sistema de 2 equações a 4 incógnitas (isto é, m=2 e n+1=2) (S1)3X 1 –2X 2 + X 3 - X 4 = 4 X 1 + X 2 -2X 3 + X 4 = 2 que admite a solução não negativa =. Fazendo X 4 = 1- δ obtemos o sistema S2 (S2)3X 1 –2X 2 + X 3 = 5 - δ X 1 + X 2 -2X 3 = 1 + δ Para toda a solução deste sistema existe uma solução de S1. Pela hipótese de indução todo o sistema de m equações a m+n incógnitas (isto é, 2 equações a 3 incógnitas) tem uma solução com n variáveis nulas.

21 21 Lema 1 (exemplo) Este é o caso de S2 que admite de facto a solução. Assim o sistema S2 tem um sistema equivalente (S5)X 1 = 11/7 + 3/7 X 2 – 1/7 δ X 3 = 2/7 + 5/7 X 2 – 4/7 δ Assumindo X 2 = 0, considere-se o sistema (S6)X 1 = 11/7 – 1/7 δ X 3 = 2/7 – 4/7 δ Para qualquer solução de S6 existe uma solução do sistema inicial S1. Para δ =1/2, X 3 anula-se, obtendo-se outra solução de S6 ( ) a que corresponde a solução, de S1 que, como se pretendia, tem n+1=2 variáveis nulas.

22 22 Lema 1 (1) A demonstração é feita por indução em n. Sendo o caso n=0 trivial, falta demonstrar o passo de indução, ou seja, se qualquer sistema de m equações a n variáveis não negativas tem uma solução com n variáveis nulas, então qualquer sistema de m equações a n+1 variáveis não negativas tem uma solução com n+1 variáveis nulas. Consideremos um sistema satisfazível com m+n+1 variáveis (S1) a i,1 X a i,m+n X m+n +a i,m+n+1 X m+n+1 = b i i: 1..m Se o sistema é satisfazível, existe uma solução X i = w i ( 0 para i: 1..m+n+1). Substituindo X m+n+1 por X m+n+1 = w m+n+1 -δ (S2) a i,1 X a i,m+n X m+n = c i +a i,m+n+1 δ (c i =b i -a i,m+n+1 w m+n+1 ) Uma solução deste sistema com δ =0 é uma solução do sistema S1 com X m+n+1 = w m+n+1. Assim, o sistema (S3) a i,1 X a i,m+n X m+n = c i é satisfazível (admite a solução inicial X i = w i )

23 23 Lema 1 (2) Ora tendo este sistema, satisfazível, m equações e m+n variáveis, pela hipótese de indução, deve ter uma solução com n variáveis nulas. Sem perda de generalidade, considere-se que são as últimas n variáveis que se anulam, nessa solução, isto é, que existe uma solução X i = d i 0 para i: 1..m e X m+j = 0 para j : 1, n Desta forma, o sistema S3 pode reescrever-se na forma (S4) X i = d i + c i,m+1 X m c i,m+n X m+n Algebricamente, S4 é obtido de S3 por combinação linear das suas linhas. Aplicando a mesma combinação linear, não a S3 mas a S2, obtemos o sistema (S5) X i = d i + c i,m+1 X m c i,m+n X m+n + c i,m+n+1 δ Sendo obtido por uma combinação linear de S2, S5 é equivalente a S2. Assim, qualquer solução de S5 com δ =0 é uma solução do sistema inicial (S1), com X m+n+1 = w m+n+1.

24 24 Lema 1 (3) Se considerarmos apenas as soluções com as n variáveis X m+j (j: 1..n) nulas o sistema S5 pode ser reescrito como (S6) X i = d i + c i,m+n+1 δ Assim, qualquer solução deste sistema S5, corresponde a uma solução do sistema S1 em que X i = d i + c i,m+n+1 δ i : 1..m; X m+j = 0 j : 1..n; e X m+n+1 = w i -δ Desta forma o sistema S1 inicial de m equações a m+n+1 variáveis tem uma solução com n variáveis nulas (todas as variáveis X m+j com j: 1..n). Se algum dos d i s ou se w i fôr nulo, então basta fazer δ=0 para obter uma solução de S1 com n+1 variáveis nulas: as anteriores mais X i (i: 1..m) ou X m+n+1.

25 25 Lema 1 (4) X i = d i + c i,m+n+1 δ i : 1..m; X m+n+1 = w i -δ No caso mais geral, em que os d i s e w i são estritamente positivos, pode obter-se uma nova solução para um valor de δ > 0 e que garanta d i + c i,m+n+1 δ i = 0para um i : 1..m; ou δ m+n+1 = w i No menor destes valores δ i, S6 tem uma solução com uma variável nula. Mas então o sistema S1 tem uma solução com n+1 variáveis nulas: para além da variável correspondente de S6, todas as variáveis X m+j (j: 1..n) são nulas, o que prova o teorema.

26 26 Forma Resolvida SF0 Definição: Dado um sistema de equações de m equações a m+n incógnitas (S1) a i,1 X a i,m+n X m+n = b i (i: 1..m) a sua forma resolvida SF0 tem a forma (SF0) X i = d i + c i,m+1 X m c i,m+n X m+n sendo d i 0 i: 1..m As variáveis no lado esquerdo são as variáveis básicas, sendo as outras as não básicas (as variáveis básicas podem ser quaisquer e não as primeiras m variáveis como são apresentadas para simplificar a notação). O lema anterior permite justificar o seguinte teorema.

27 27 Forma Resolvida SF0 Teorema: Um sistema de equações de m equações a m+n variáveis não-negativas é satisfazível sse se puder rescrever na forma SF0. Demonstração Se se pode reescrever na forma resolvida SF0, então o sistema admite a solução não negativa,. Dado o sistema satisfazível (S1) a i,1 X a i,m+n X m+n = b i (i: 1..m) o lema anterior garante uma solução, que permite a forma SF0 (SF0)X i = d i + c i,m+1 X m c i,m+n X m+n com d i 0 para i: 1..m através de uma combinação linear das suas equações.

28 28 Interpretação Geométrica 2 X1 + X2 8 X1 + X2 3 X1 - X2 -5 X1, X2 0 2 X1 + X2 + X3 = 8 X1 + X2 - X4 = 3 X1 - X2 - X5 = -5 X2 = 0 X2 X1X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 - X2 X4 = -3 + X1 + X2 X5 = 5 + X1 - X2 x1 = 1 - x3/3 + x5/3 x2 = 6 - x3/3 - 2 x5/3 x4 = x3/3 - X5/3 X1 = 5 - X3 - X4 X2 = -2 + X3 + 2 X4 X5 = X3 - 3 X4 X2 = X1 - X2 X4 = 5 - X1 - X3 X5 = X1 + X3 X1 =-1 + X4/2 + X5/2 X2 = 4 + X4/2 - X5/2 X3 = X4/2 - X5/2 X2 = 5 + X1 - X5 X3 = X1 + X5 X4 = X1 - X5 X1 = 3 - X2 + X4 X3 = 2 + X2 - 2 X4 X5 = X2 + X4

29 29 Restrições Racionais Como atrás demonstrado, um conjunto de m restrições lineares de igualdade (equações) envolvendo m+n variáveis, não negativas, é satisfazível sse se puder colocar na forma SF0 Definição: Dado um sistema de equações de m equações a m+n incógnitas (S1) a i,1 X a i,m+n X m+n = b i (i: 1..m) a sua forma resolvida SF0 tem a forma (SF0) X i = d i + c i,m+1 X m c i,m+n X m+n sendo d i 0 i: 1..m

30 30 Restrições Racionais A questão que se coloca agora é como garantir a passagem eficiente de um conjunto de restrições lineares sobre variáveis não negativas para essa forma resolvida SF0. Por outro lado, se se pretender a integração dum resolvedor de restrições simbólicos num sistema de programação em lógica (CLP) esse resolvedor deve ser incremental. Há que definir um procedimento para efectuar essa transformação incremental. Esse procedimento é esencialmente baseado no algoritmo SIMPLEX.

31 31 Interpretação Geométrica Dado um espaço com n dimensões, a restrição a 1 X 1 + a 2 X a n X n = b define uma região admissível, correspondente aos pontos de um hiper-plano desse espaço. Igualmente num espaço com n dimensões, a restrição a 1 X 1 + a 2 X a n X n =< b que se pode reescrever-se com a adição de uma variável, não negativa, extra a 1 X 1 + a 2 X a n X n + a n+1 X n+1 = b define uma região admissível, correspondente aos pontos de um hiper-semiespaço desse espaço nD.

32 32 Interpretação Geométrica Como casos particulares temos um espaço tridimensional (n=3), em que o hiper-plano corresponde ao plano usual, e um hiper-semiespaço corresponde a um semiespaço 3D. Num espaço bidimensional (n=2), um hiper-plano corresponde a uma recta e um hiper-semiespaço corresponde a um semi-plano. Com efeito, a restrição a 1 X 1 + a 2 X 2 = b pode reescrever-se como X 2 = a X 1 + c correspondendo a uma recta intersectando o eixo X 2 no ponto c e com inclinação ( X 2 / X 1 ) igual ao valor a. X2X2 X1X1 3X 1 + 5X 2 = 15 X 2 = -3/5 X 1 + 3

33 33 Interpretação Geométrica Num espaço bidimensional uma restrição com 3 variáveis pode reescrever-se como X 2 = a X 1 + (c + k X 3 ) Por exemplo: Desta forma, a variável X 3 pode ser vista como uma variável de desvio. O seu valor nulo corresponde à recta (desvio nulo) e o seu valor positivo/negativo a um dos semiplanos definidos pela recta. X 2 = -3/5 X 1 + (3-2X 3 ) 3X 1 + 5X X 3 = 15 X2 X1X1 X3 < 0 X3 > 0 3X1+5X2 = 15 3X 1 + 5X 2 = X 3

34 34 Interpretação Geométrica Ainda num espaço a 2 dimensões, m equações a m+2 variáveis não negativas podem ser reescritas de forma a que m variáveis sejam definidas em função das outras 2, que só aparecem numa das equações. Ilustrando para o caso m=2, o método de eliminação de Gauss garante que as equações a 11 X 1 + a 12 X 2 + a 13 X 3 + a 14 X 4 = b 1 a 21 X 1 + a 22 X 2 + a 23 X 3 + a 24 X 4 = b 2 podem reescrever-se como X 3 = c 11 X 1 + c 12 X 2 + c 1 X 4 = c 21 X 1 + c 22 X 2 + c 2

35 35 Interpretação Geométrica Mas um sistema X 3 = c 11 X 1 + c 12 X 2 + c 1 X 4 = c 21 X 1 + c 22 X 2 + c 2 pode ainda reescrever-se como c 11 X 1 + c 12 X 2 = c 1 - X 3 c 21 X 1 + c 22 X 2 = c 2 - X 4 Assim, para satisfazer ambas as restrições um ponto tem de estar na intersecção dos semiplanos definidos pelos desvios X 3 >= 0 e X 4 >= 0

36 36 Interpretação Geométrica Exemplo: ou : R1: -X 1 + 3X 2 9 R2: X 1 + X 2 11 R1: -X 1 + 3X 2 + X 3 = 9 R2: X 1 + X 2 + X 4 = 11 -X 1 + 3X 2 = 9 - X 3 X 1 + X 2 = 11 - X 4 -X 1 + 3X 2 = 9 X 1 + X 2 = 11 X 3 >=0 X 4 >=0

37 37 Interpretação Geométrica Num espaço a 2 dimensões, as 2 rectas que limitam 2 restrições =< intersectam-se num ponto, que constitui um vértice da região admissível, isto é, da região onde existem pontos que satisfazem as duas restrições. É fácil de generalizar este resultados para dimensões maiores que 2. Com n=3, os 3 planos que limitam 3 restrições =< intersectam-se num ponto, que constitui um vértice da região admissível. Em geral, num espaço a n dimensões, os n hiper-planos que limitam n restrições =< intersectam-se num ponto, que constitui um vértice da região admissível.

38 38 Interpretação Geométrica Num espaço a n dimensões, K restrições =< definem uma região admissível que tem de satisfazer todas os conjuntos de n restrições. Isto é, a região admissível é a intersecção de todas as sub-regiões admissíveis definidas pelos conjuntos de n restrições. Tal região é um espaço convexo com a forma de um hiper-poliedro. Num espaço a 2 (3) dimensões K restrições =< definem um polígono (poliedro), que é a intersecção de todas as sub- regiões admissíveis para todos os conjuntos de 2 (3) restrições.

39 39 Interpretação Geométrica Dadas R3: 2X1 + X2 8 ; R4: X1 + X2 3 ; R5: X1 - X2 -5, a região admissível é constituída pela intersecção das sub-regiões definidas pelos conjuntos de restrições {R3, R4}, {R3, R5} e {R4, R5}. X2X2 X1 2 X1 + X2 + X3 = 8 X1 - X2 - X5 = -5 X1 + X2 - X4 = 3

40 40 Na realidade, pretendendo-se a não-negatividade de X1 e X2, deverão ser consideradas mais 2 restrições R1: X1 0 e R2: X2 0 A região admissível é constituída pela intersecção das sub-regiões definidas pelos 10 conjuntos de restrições {R1, R2}, a {R4, R5}. Interpretação Geométrica X2 = 0 X2X2 2 X1 + X2 = 8 X1 - X2 = -5 X1 = 0 X1 + X2 = 3 X1

41 41 Cada uma das rectas correspondentes a uma restrição pode ser identificada pelo anulamento da correspondente variável de desvio. Interpretação Geométrica X2 = 0 X2 X1X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 2 X1 + X2 = 8 X1 - X2 = -5 X1 + X2 = 3 2X1 + X2 8 2 X1 + X2 + X3 = 8 X1 - X2 -5 X1 - X2 - X5 = -5 X1 + X2 3 X1 + X2 - X4 = 3

42 42 Ora como cada restrição é limitada pelo anulamento de uma das variáveis de desvio, o ponto de intersecção de rectas correspondentes a duas restrições é obtido pelo anulamento das respectivas variáveis de desvio. Por outro lado, as m equações a m+2 variáveis podem ser reescritas de forma a que m variáveis (as variáveis básicas) venham definidas em relação às outras duas. Considerando essas duas (não-básicas) como variáveis de desvio, o seu anulamento determina o valor das outras variáveis no ponto de intersecção das rectas correspondentes a essas variáveis de desvio. Interpretação Geométrica

43 43 Por exemplo, dadas as restrições anteriores R3: 2X1 + X2 8 ; R4: X1 + X2 3 ; R5: X1 - X2 -5 e reescrevendo-as como R3: 2X1 + X2+ X3 = 8 ; R4: X1 + X2 -X4 = 3 ; R5: X1 - X2 -X5 = -5 considerando a base { X1, X2 e X4 } elas podem ser reescritas como X1 = 1 - X3/3 + X5/3 X2 = 6 - X3/3 - 2 X5/3 X4 = X3/3 - X5/3 sendo X1 =1, X2 = 6 e X4 =4 o ponto onde se intersectam as restrições R3 e R5 (isto é, com desvios X3 e X5 nulos). Interpretação Geométrica

44 44 Havendo m restrições e m+2 variáveis, o número de potenciais vértices da região admissível é o número de combinações de m+2 variáveis 2 a 2, isto é, (m+2)*(m+1)/2. No caso que temos vindo a exemplificar, m=3 donde o número de potenciais vértices é 10. Na realidade, nem todos os pontos resultantes da intersecção das rectas estão dentro da região admissível. Um vértice não está na região admissível se no ponto correspondente, algumas das variáveis tomarem valores negativos. Interpretação Geométrica

45 45 Interpretação Geométrica 2 X1 + X2 8 X1 + X2 3 X1 - X2 -5 X1, X2 0 2 X1 + X2 + X3 = 8 X1 + X2 - X4 = 3 X1 - X2 - X5 = -5 X2 = 0 X2 X1X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 - X2 X4 = -3 + X1 + X2 X5 = 5 + X1 - X2 x1 = 1 - x3/3 + x5/3 x2 = 6 - x3/3 - 2 x5/3 x4 = x3/3 - X5/3 X1 = 5 - X3 - X4 X2 = -2 + X3 + 2 X4 X5 = X3 - 3 X4 X2 = X1 - X3 X4 = 5 - X1 - X3 X5 = X1 + X3 X1 =-1 + X4/2 + X5/2 X2 = 4 + X4/2 - X5/2 X3 = X4/2 - X5/2 X2 = 5 + X1 - X5 X3 = X1 + X5 X4 = X1 - X5 X1 = 3 - X2 + X4 X3 = 2 + X2 - 2 X4 X5 = X2 + X4

46 46 A existência de soluções para o conjunto de restrições equivale a que a região admissível seja não vazia. Um problema em que nenhum vértice seja admissível é um problema sem solução. Por exemplo, se nas restrições anteriores se trocarem o sinal das restrições R3 e R4, o novo sistema R3: 2X1 + X2 8 R3: 2X1 + X2 -X3 = 8 R4: X1 + X2 3 ou R4: X1 + X2 +X4 = 3 R5: X1 - X2 -5R5: X1 - X2 -X5 = -5 corresponde a um problema que é impossível e não tem qualquer solução. Interpretação Geométrica

47 47 Interpretação Geométrica 2 X1 + X2 8 X1 + X2 3 X1 - X2 -5 X1, X2 0 2 X1 + X2 - X3 = 8 X1 + X2 + X4 = 3 X1 - X2 - X5 = -5 X2 = 0 X2 X1X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 + X2 X4 = 3 - X1 - X2 X5 = 5 + X1 - X2 x1 = 1 + x3/3 + x5/3 x2 = 6 + x3/3 - 2 x5/3 x4 = x3/3 + x5/3 X1 = 5 + X3 + X4 X2 = -2 - X3 - 2 X4 X5 = X3 + 3 X4 X2 = X1 + X3 X4 = -5 + X1 - X3 X5 = X1 - X3 X1 = -1 - X4/2 + X5/2 X2 = 4 - X4/2 - X5/2 X3 = X4/2 + X5/2 X2 = 5 + X1 - X5 X3 = X1 - X5 X4 = X1 + X5 X1 = 3 - X2 - X4 X3 = -2 - X2 - 2 X4 X5 = X2 - X4

48 48 Para avaliar a satisfazibilidade de um problema basta pois verificar que pelo menos um dos potenciais vértices corresponde a uma solução. Mas isso corresponde a colocar o sistema de restrições na forma SF0. Por exemplo, o vértice admissível X1 = 1 - X3/3 + X5/3 X2 = 6 - X3/3 - 2 X5/3 X4 = X3/3 - X5/3 Corresponde à reescrita na forma SF0 do sistema inicial 2 X1 + X2 82 X1 + X2 - X3 = 8 X1 + X2 3 ou X1 + X2 + X4 = 3 X1 - X2 -5 X1 - X2 - X5 = -5 Passagem para a Forma Resolvida SF0

49 49 Para colocar um sistema de m restrições de igualdade a m+n variáveis (possivelmente proveniente de um sistema de m restrições de desigualdade ou ) na forma SF0, basta 1.Escolher m variáveis como variáveis básicas 2.Reescrever o sistema nessa base 3.Verificar se os coeficentes livres (valor das variáveis básicas quando as não básicas se anulam) são não negativos O problema desta abordagem é a existência de um número muito elevado ( ) de possibilidades de escolha da base. Passagem para a Forma Resolvida SF0 m+n m C

50 50 Há pois que definir uma estratégia para determinar quais as variáveis que devem entrar na base. Essa estratégia é fácil de entender se se pretender não apenas verificar a satisfação de um conjunto de restrições, mas ainda a optimização de uma função objectivo, que tal como as restrições seja linear. Assim, assumamos que, dado um conjunto de m restrições de igualdade nas variáveis X 1 a X m+n,, colocado na forma SF0, se pretende adicionalmente maximizar (o caso da minimização é semelhante) uma função F = c 1 X 1 + c 2 X C m+n X m+n Optimização em SF0

51 51 max F = c 1 X 1 + c 2 X C m+n X m+n Sem perda de generalidade, consideremos que as primeiras m variáveis X 1 a X m são as variáveis básicas, isto é, que as restrições foram reescritas na forma SF0 X 1 = d 1 + c 11 X m c 1n X m+n... X m = d m + c m1 X m c mn X m+n Substituindo na função F as variáveis básicas pelas suas expressões nas não básicas obtemos max F = k + k 1 X m+1 + k 2 X m k n X m+n Optimização em SF0

52 52 max F = k + k 1 X m+1 + k 2 X m k n X m+n Esta expressão mostra que no vértice definido pelas variáveis básicas (com as não-básicas nulas) a função a maximizar tem o valor k. Mostra ainda que, se todos os coeficientes K i forem negativos, não se pode obter maiores valores de F. No caso de haver coeficientes K i positivos, um aumento da variável correspondente aumenta o valor da função F. Quanto maior o coeficiente, maior o aumento da função objectivo por aumento unitário da variável. Optimização em SF0

53 53 max F = k + k 1 X m+1 + k 2 X m k n X m+n Numa perspectiva de optimização, dada uma certa base admissível, para a qual existam valores K i positivos, o valor da função objectivo pode ser melhorado (ser maior que k) tornando positiva as correspondentes variáveis não básicas. Mas para mantermos o sistema na forma SF0, se se desanula uma variável não-básica, essa situação deverá ser compensada anulando uma das variáveis básica. Assim, a estratégia de optimização a seguir é a de, partindo de uma base admissível, proceder a um conjunto de mudanças de base até se poder reescrever a função objectivo com coeficientes não negativos. Optimização em SF0

54 54 Obviamente, uma mudança de base, envolve a escolha de a)uma variável não básica para entrar na base, e b)uma variável básica para sair da base, A escolha da variável de entrada pode seguir a heurística delineada atrás: A variável de entrada é aquela a que corresponde na função objectivo o coeficiente mais positivo (maximização) ou mais negativo (minimização). Uma vez escolhida a variável de entrada, ela deverá aumentar tanto quanto possível. No entanto, na forma SF0 corrente, um aumento dessa variável poderá conduzir à diminuição das variáveis básicas. Optimização em SF0

55 55 Com efeito, tome-se a forma SF0 abaixo e, sem perda de generalidade, considere-se X m+1 como variável de entrada. maxF = k + k 1 X m+1 + k 2 X m k n X m+n suj.X i = d i + c i1 X m c in X m+n i:1..m Mantendo as outras variáveis não básicas nulas, as equações reescrevem-se como X i = d i + c i1 X m+1 i:1..m Assim, sendo d i 0, um aumento de X m+1 anula as variáveis básicas (em que c i1 < 0), quando tomar o valor d i /|c i1 |. Como se pretende anular uma variável básica, mantendo as outras não negativas, a escolha da variável de saída recai na variável básica Xi para a qual seja menor o valor d i /|c i1 |. Optimização em SF0

56 56 Resumindo, a maximização da função objectivo de um sistema de m igualdades a m+n variáveis envolve a escrita do sistema e da função objectivo na forma SF0 maxF = k + k 1 X m+1 + k 2 X m k n X m+n suj.X i = d i + c i1 X m c in X m+n i:1..m e a execução do seguinte algoritmo Enquanto a função objectivo tiver coeficientes positivos mudar a base escolhendo como variável de entrada a variável não básica X j com coeficiente k j mais positivo na função objectivo como variável de saída a variável básica i com c ij < 0 e menor valor d i /|c ij | na respectiva restrição Optimização em SF0

57 57 Este algoritmo de optimização pressupõe que, no início, o conjunto de restrições foi reescrito na forma SFO, que era exactamente o objectivo que nos levou a abordar o problema da optimização! Na realidade, a colocação na forma SF0 não levanta qualquer problema quando as m restrições de igualdade a m+n variáveis provêm de um conjunto de m restrições de desigualdade a i 1 X 1 + a i 2 X a i n X n =< b i i: 1..m Em que todos os b i são não negativos. Neste caso basta escolher as variáveis X 1 a X n para variáveis não básicas, pois o seu anulamento satisfaz as restrições! Optimização em SF0

58 58 Exemplo. Interpretação Geométrica Max X 1 + 2X 2 R1: -X 1 + 3X 2 9 R2: X 1 + X 2 11 R3: 2X 1 + X 2 18 X 1,X 2 0

59 59 Do ponto de vista geométrico, e como visto atrás, cada forma SF0 corresponde a um vértice da região admissível. Assim, ao trocar uma variável básica por outra não básica este algoritmo vai percorrendo vários vértices da região admissível, com valores crescentes da função objectivo. Por apenas trocarem uma variável, dois vértices consecutivos estão unidos por uma aresta do hiper-poliedro que representa a região admissível. Interpretação Geométrica

60 60 Exemplo. Interpretação Geométrica Max X 1 + 2X 2 -X 1 + 3X 2 + X 3 = 9 X 1 + X 2 + X 4 = 11 2X 1 + X 2 + X 5 = 18 X 1,X 2 0 Max X 1 + 2X 2 X 3 = 9 + X 1 - 3X 2 9/3 X 4 = 11 - X 1 - X 2 11/1 X 5 = X 1 - X 2 18/1 entra X 2, sai X 3

61 61 Max 6 + 5X 1 /3 - 2X 3 /3 X 2 = 3 + X 1 /3 - X 3 /3 9 X 4 = 8 - 4X 1 /3 + X 3 /3 6 X 5 = X 1 /3 + X 3 /3 45/7 entra X 1, sai X 4 Exemplo. Interpretação Geométrica Max X 1 + 2X 2 X 3 = 9 + X 1 - 3X 2 9/3 X 4 = 11 - X 1 - X 2 11/1 X 5 = X 1 - X 2 18/1 entra X 2, sai X 3

62 62 Max 6 + 5X 1 /3 - 2X 3 /3 X 2 = 3 + X 1 /3 - X 3 /3 X 4 = 8 - 4X 1 /3 + X 3 /3 X 5 = X 1 /3 + X 3 /3 entra X 1, sai X 4 Exemplo. Interpretação Geométrica Max 16 - X 3 /4 - 5X 4 /4 X 1 = 6 + X 3 /4 - 3X 4 /4 X 2 = 5 + X 3 /12- X 4 /4 X 5 = 1 -7X 3 /12+ 7X 4 /4 óptimo encontrado

63 63 Podemos ver agora como é que o algoritmo de optimização pode ser utilizado para colocar o sistema inicial na forma SFO, quando o anulamento das variáveis de decisão não constitui uma solução admissivel. Se essa é a situação, então temos uma (ou mais) restrição R i na forma X i = d i + c i1 X m c in X m+n em que o d i < 0. Nesta situação, podemos introduzir uma variável artificial não negativa, Z i, na restrição fazendo X i = Z i + d i + c i1 X m c in X m+n Passagem para a Forma Resolvida SF0

64 64 X i = Z i + d i + c i1 X m c in X m+n Como é óbvio, a restrição assim modificada e a inicial serão equivalentes sse Z i = 0. Reescrevendo a restrição modificada como Z i = - d i + c i1 X m c in X m+n - X i Obtem-se uma restrição que já se encontra na forma SF0, já que -d i > 0. Assim sendo, como uma solução admissível do sistema modificado é uma solução do sistema inicial se Z i = 0, tudo o que é necessário fazer é, no sistema modificado, minimizar Z i. Passagem para a Forma Resolvida SF0

65 65 Em geral, dado um conjunto m de restrições de igualdade a m+n variáveis, a passagem à forma SF0 pode fazer-se nos seguintes passos 1.Escolhem-se m variáveis para variáveis básicas, e reescreve-se o sistema isolando as variáveis básicas X i = d i + c i1 X m c in X m+n 2.Se todos os d i forem não negativos, o sistema está na forma SFO. Caso contrário, introduzem-se variáveis artificiais nas restrições adequadas, reescrevendo-as em Z i = - d i + c i1 X m c in X m+n - X i 3.Finalmente minimiza-se a soma das variáveis artificiais. Passagem para a Forma Resolvida SF0

66 66 Naturalmente, se o mínimo fôr 0, no ponto de mínimo todas as variáveis artificiais são nulas. Em princípio, as variáveis artificiais são não-básicas, e o sistema toma a forma X i = d i + c i1 X m c in X m+n +e i1 Z e iq Z q Em que os d i s são não negativos. O sistema inicial é equivalente ao modificados com as variáveis artificiais nulas. Assim o sistema inicial é equivalente ao sistema que se obtem eliminando no anterior os termos nas variáveis artificiais, e que já está na forma SF0 porque todos os d i s são não negativos. X i = d i + c i1 X m c in X m+n Passagem para a Forma Resolvida SF0

67 67 Na realidade alguma(s) das variáveis artificiais podem não ser não básicas obtendo-se restrições reescritas como Z q = 0 + c i1 X m c in X m+n +e i1 Z e iq-1 Z q-1 Neste caso, pode simplesmente trocar-se a variável Z i com um qualquer dos Xs não básicos obtendo-se, por exemplo X m+1 = 0 + c i1 X m c in X m+n +e i1 Z e iq Z q em que c ij = -c ij /c i1, e il = -e il /c i1 e e ik = -1/c i1. A substituição de Zq por Xm+1 nas outras restrições não vai afectar os termos livres (d i s) nelas existentes que serão simplesmente somados com 0. Passagem para a Forma Resolvida SF0

68 68 Ao introduzir-se uma variável artificial introduz-se uma nova dimensão no problema. Por exemplo se o problema inicial tinha duas dimensões, X e Y, pode considerar-se a nova variável como a 3ª dimensão, Z. O problema inicial, pode considerar-se a intersecção do problema estendido com o espaço inicial. Por exemplo, em 2D, o problema inicial é a intersecção do problema estendido (3D) com o plano X-Y. Embora para o problema inicial X i =0 não seja solução, no problema estendido, o ponto X i =0, Z > 0 é uma solução. A minimização de Z vai induzir um percurso no hiper- poliedro até atingir o espaço inicial (em 2D, o plano X-Y). Interpretação Geométrica

69 69 Exemplo Interpretação Geométrica -X 1 + 3X 2 + X 3 = 9 X 1 + X 2 + X 4 = 11 2X 1 + X 2 + X 5 = 18 X 1 + 2X 2 - X 6 = 12 -X 1 + 3X 2 9 X 1 + X X 1 + X 2 18 X 1 + 2X 2 12 X i 0 X 3 = 9 + X 1 - 3X 2 X 4 = 11 - X 1 - X 2 X 5 = 18 -2X 1 - X 2 X 6 = X 1 + 2X 2

70 70 Exemplo Interpretação Geométrica min Z 1 = 12 - X 1 - 2X 2 + X 6 X 3 = 9 + X 1 - 3X 2 X 4 = 11 - X 1 - X 2 X 5 = 18 -2X 1 - X 2 Z 1 = 12 - X 1 - 2X 2 + X 6 X 3 = 9 + X 1 - 3X 2 X 4 = 11 - X 1 - X 2 X 5 = 18 -2X 1 - X 2 X 6 = X 1 + 2X 2 + Z 1 Projecção no plano X 1 -X 2 do ponto =

71 71 Exemplo Interpretação Geométrica min 6 - 5X 1 /3 + 2X 2 /3 + X 6 X 2 = 3 + X 1 /3 - 3X 3 /3 X 4 = 8 - 4X 1 /3 + 3X 3 /3 X 5 = X 1 /3 + X 3 /3 Z 1 = 6 - 5X 1 /3 + 2X 3 /3 + X 6 min Z 1 = 12 - X 1 - 2X 2 + X 6 X 3 = 9 + X 1 - 3X 2 X 4 = 11 - X 1 - X 2 X 5 = 18 -2X 1 - X 2 Z 1 = 12 - X 1 - 2X 2 + X 6 Projecção no plano X 1 -X 2 do ponto =

72 72 Exemplo Interpretação Geométrica min Z 1 X 1 = 18/5 + 2X 3 /5 + 3X 6 /6 -3Z 1 /5 X 2 = 21/5 - X 3 /5 + X 6 /5 - Z 1 /5 X 4 = 16/5 - X 3 /5 - 4X 6 /5 +4Z 1 /5 X 5 = 33/5 - 3X 3 /5 - 7X 6 /5 +7Z 1 /5 min 6 - 5X 1 /3 + 2X 2 /3 + X 6 X 2 = 3 + X 1 /3 - 3X 3 /3 X 4 = 8 - 4X 1 /3 + 3X 3 /3 X 5 = X 1 /3 + X 3 /3 Z 1 = 6 - 5X 1 /3 + 2X 3 /3 + X 6 18/5 21/5 O ponto já está no plano X 1 -X 2


Carregar ppt "1 Restrições Lineares sobre os Reais/Racionais Muitos problemas podem ser modelados através de variáveis reais (ou racionais), denominadas variáveis de."

Apresentações semelhantes


Anúncios Google