Restrições Lineares sobre os Reais/Racionais

Restrições Lineares sobre os Reais/Racionais
Muitos problemas podem ser modelados através de variáveis reais (ou racionais), denominadas variáveis de decisão. Todas as restrições sobre essas variáveis são lineares. Geralmente pretendem-se soluções que optimizem uma função (linear) objectivo - optimização condicionada Exemplos: gestão da produção redes de distribuição

Gestão da Produção Dados:
Um conjunto de itens P1, ..., Pn que se pretende produzir Um conjunto de recursos R1, ..., Rm disponíveis para os produzir Uma matriz A, cujos elementos aij representam a quantidade do recurso i necessário para produzir uma unidade do item j Um vector C, cujos elementos cj representam o lucro obtido por cada unidade do item j produzido Um vector B, cujos elementos bi representam a quantidade máxima do recurso i que pode ser utilizado Objectivo: Determinar a quantidade a produzir de cada item j

Gestão da Produção Gestão 0: Restrições Base
Designando por Xi a quantidade do item Pi produzido, o problema, a não sobre-utilização dos recursos existentes é modelada por a11 X1 + a12 X a1n Xn =< b1 ... am1 X1 + am2 X amn Xn =< bm Por exemplo, sendo necessárias 3 minutos de uma máquina para fabricar 1 sapato e 4 horas para 1 bota, representando por S e B o número de sapatos e botas e estando a máquina disponível 4 horas temos 3 S + 4 B =< 240

Gestão da Produção Gestão 1: Satisfação (de um dado lucro)
Para modelar que um dado lucro L é atingido, adiciona-se ao modelo anterior a restrição c1 X1 + c2 X cn Xn >= L Por exemplo, se se obtem um lucro de 4(5) € por cada sapato (bota) vendido, pretender que o lucro seja pelo menos de 3000€ é modelada pela restrição Max L = 3 S + 4 B Gestão 2: Optimização (do lucro obtido) Para modelar a maximização do lucro obtido, adiciona-se ao modelo inicial a função objectivo L (a maximizar) Max L = c1 X1 + c2 X cn Xn

Gestão da Produção (Dual)
Dados: Um conjunto de itens P1, ..., Pn que se pretende produzir Um conjunto de recursos R1, ..., Rm disponíveis para os produzir Uma matriz A, cujos elementos aij representam a quantidade do recurso i necessário para produzir uma unidade do produto j Um vector C, cujos elementos cj representam o custo mínimo por cada unidade do item j produzido Um vector B, cujos elementos bj representam a quantidade do recurso j a utilizar Objectivo: Determinar os custos por recurso adequados

Restrições Base Designando por Yj o custo incorrido por cada unidade do recurso j gasto, as restrições que impõe um custo mínimo por unidade de item i produzido são modeladas por a11 Y1 + a21 Y am1 Ym >= c1 a12 Y1 + a22 Y am2 Ym >= c2 ... a1m Y1 + a2m Y amn Ym >= cn

Gestão 1d: Satisfação (de um dado custo total) A garantia de que o custo total do plano de produção não excede um valor V é modelada, por adição ao modelo da restrição b1 Y1 + b2 Y bm Ym =< V Gestão 2d: Optimização (do custo total) Para modelar a minimização dos custo total do plano de produção, adiciona-se a função objectivo V (a minimizar) Min V = b1 Y1 + b2 Y bm Ym

Redes de Distribuição Dados:
Um conjunto de nós P1, ..., Pn , dos quais P1 é emissor e Pn o receptor Uma matriz M, cujos elementos mi,j representam a capacidade da ligação (em bits/seg) entre os nós i e j Uma matriz C, cujos elementos ci,j representam o custo (em €/bit) da transmissão entre os nós i e j; Objectivo: Avaliar o fluxo de informação que a rede é capaz de transmitir entre os nós emissor (P1) e receptor (Pn).

Redes de Distribuição Restrições Base:
Designando por Xi,j a quantidade de informação debitada entre os nós i e j, as restrições de capacidade são X1,1 =< m1,1 % Em geral mi,i = 0 ... Xm,n =< mm,n As restrições de igualdade de fluxo de entrada e saída em todos os k nós (excepto nos nós P1 e Pn) são modeladas por X1,2+X2,2+X3,2+...+Xn,2 = X2,1+X2, X2,n X1,3+X2,3+X3,3+...+Xn,3 = X3,1+X3, X3,n X1,k+X2,k+X3,k+...+Xn,k = Xk,1+Xk, Xk,n

Redes de Distribuição Redes 1: Satisfação (de um fluxo F entre P1 e Pn) A verificação de que é possível transmitir um determinado fluxo de informação F entre os nós emissor (P1) e receptor (Pn) é modelada pela adição da restrição X1,2+X1,3+X1,4+...+X1,n >= F (ou X1,n+X2,n+X3,n+...+Xn-1,,n >= F ) Redes 2: Optimização (do custo total) Para modelar o máximo fluxo de informação que a rede é capaz de transmitir entre os nós P1 e Pn, adiciona-se a função objectivo F (a minimizar) Max F = X1,2+X1,3+X1,4+...+X1,n

Formalização Os problemas de satisfação de restrições lineares sobre variáveis (de decisão) Xi reais (ou racionais, se todos os parâmetros aij são números racionais) têm a forma a11 X1 + a12 X a1n Xn ρ1 b1 a21 X1 + a22 X a2n Xn ρ2 b2 ... am1 X1 + am2 X amn Xn ρm bm em que ρ1..ρm são quaisquer do conjunto {≤, =, ≥, <, >, ≠ } Se se pretender a optimização das variáveis de decisão, inclui-se a optimização de uma função (linear) objectivo F Opt F = c1 X1 + c2 X cn Xn em que Opt pode ser um de {Max, Min, Sup, Inf}.

Interpretação Geométrica
Dado um espaço com n dimensões, a restrição ai1 X1 + ai2 X ain Xn = bi define uma região admissível, correspondente aos pontos de um hiper-plano desse espaço. Como casos particulares temos um espaço tridimensional (n=3), em que o hiper-plano corresponde ao plano usual, e um espaço bidimensional (ou vulgar plano, n=2) em que o hiper-plano se reduz a uma recta. A restrição ≠ define uma região admissível que corresponde a todos os pontos do espaço n-dimensional, excepto os pontos do hiper-plano

As restrições ≤ e ≥ definem regiões admissíveis do tipo semi-hiper-espaço limitado pelo correspondente hiper-plano, incluído na região admissível. Com n=3 temos um semi-espaço e com n=2 um semi-plano. As restrições < e > definem regiões admissíveis semelhantes, mas excluindo a fronteira. O conjunto de restrições define, num espaço a n dimensões, um hiper-poliedro (poliedro com n=3 e polígono com n=2) correspondente à intersecção das m regiões admissíveis (m+n com não negatividade). Algumas faces do hiper-poliedro pertencem ({≤, ≥) à região admissível e outras não (<, >). Devem ainda ser considerados hiper-planos de exclusão (≠).

Com exclusão das restrições ≠, a região admissível é convexa. Em problemas de optimização a função C = c1 X1 + c2 X cn Xn define uma família de hiper-planos paralelos (um para cada valor de C). O supremo e o ínfimo dessa função na região admissível corresponde a um (hiper-)vértice do hiper-poliedro, o “último” ponto em que um hiper-plano da função objectivo “toca” a região admissível quando se desloca para valores crescentes (Sup) ou decrescentes (Inf) de C.

Se esse vértice pertencer à região admissível ele corresponde igualmente ao seu Max ou Min Caso contrário (i.e. se foi excluído por alguma restrição >, < ou ≠) não existem Max/Min mas apenas Sup/Inf. No caso em que o vértice de óptimo pertence a uma aresta ou um lado do hiper-poliedro paralelos à família de hiper-planos de optimização, haverá em geral mais do que um ponto óptimo, já que a função objectivo tem o mesmo valor em todos os pontos dessas arestas e lados.

Exemplo (2 dimensões) X2 max X1 + X2 Suj. 2 X1 + X2 ≤ 8 X1 + X2 ≥ 3
X1 + X2 = k max X1 + X2 Suj. 2 X1 + X2 ≤ 8 X1 + X2 ≥ 3 X1 - X2 ≥ -5

Complexidade Potencial
Apesar de o espaço de pesquisa ser infinito, o problema de satisfação reduz-se à verificação de que as restrições definem um hiper-poliedro não vazio. Assim, pelo menos um dos vértice definidos pelos hiper-planos de fronteira das restrições (excepto restrições ≠) deve pertencer à região admissível. Como n restrições de igualdade num espaço n-dimensional definem univocamente um ponto (solução de um sistema de n equações a n incógnitas), no pior caso, ter-se-á de verificar a pertença à região admissível de Cmn pontos. Na prática, o número de vértices a testar é muito inferior. No pior caso, a complexidade do problema de satisfação é idêntica a um problema de optimização.

Formas Resolvidas Apesar de os problemas poderem ser resolvidos na forma de geração e teste dos vários vértices, existem algoritmos que os resolvem de uma forma mais eficiente. Em particular, estaremos interessados em algoritmos que resolvam as restrições de uma forma simbólica (algébrica) Através de um conjunto de manipulações algébricas, transforma-se o problema inicial numa Forma Resolvida. Esta transformação é possível se e apenas se o conjunto de restrições inicial fôr satisfazível. Vamos abordar estas formas resolvidas para sistemas de restrições com riqueza de expressão crescente.

Restrições Não-Estritas / Variáveis Não-negativas
As restrições de desigualdade podem ser substituidas por restrições de igualdade através da adição de variáveis de desvio (slacks), igualmente não negativas ai1 X ain Xn ≤ bi  ai1 X ain Xn + Si = bi ai1 X ain Xn ≥ bi  ai1 X ain Xn - Si = bi A existência de uma forma resolvida para estes sistemas de restrições é justificada pelo seguinte Lema 1: Todo o sistema de m equações a m+n incógnitas não negativas, é satisfazível sse admitir uma solução em que n variáveis são nulas. Demonstração (Lema 1)  Se existe uma solução então o sistema é satisfazível.

Lema 1 (exemplo) Um exemplo permite perceber melhor os passos desta demonstração. Considere-se o sistema de 2 equações a 4 incógnitas (isto é, m=2 e n+1=2) (S1) 3X1–2X2+ X3- X4 = 4 X1+ X2-2X3+ X4 = 2 que admite a solução não negativa <X1,X2,X3,X4> = <2,1,1,1>. Fazendo X4 = 1- δ obtemos o sistema S2 (S2) 3X1–2X2+ X3 = 5 - δ X1+ X2-2X3 = 1 + δ Para toda a solução <w1,w2,w3> deste sistema existe uma solução <w1,w2,w3,1> de S1. Pela hipótese de indução todo o sistema de m equações a m+n incógnitas (isto é, 2 equações a 3 incógnitas) tem uma solução com n variáveis nulas.

Lema 1 (exemplo) Este é o caso de S2 que admite de facto a solução < 11/7, 0, 2/7>. Assim o sistema S2 tem um sistema equivalente (S5) X1 = 11/7 + 3/7 X2 – 1/7 δ X3 = 2/7 + 5/7 X2 – 4/7 δ Assumindo X2 = 0, considere-se o sistema (S6) X1 = 11/7 – 1/7 δ X3 = 2/7 – 4/7 δ Para qualquer solução <s1, s3> de S6 <s1, s3> existe uma solução <s1, 0, s3, 1-δ > do sistema inicial S1. Para δ =1/2, X3 anula-se, obtendo-se outra solução de S6 (<3/2,0>) a que corresponde a solução, <3/2, 0, 0, 1/2> de S1 que, como se pretendia, tem n+1=2 variáveis nulas.

Lema 1  (1)  A demonstração é feita por indução em n. Sendo o caso n=0 trivial, falta demonstrar o passo de indução, ou seja, se qualquer sistema de m equações a n variáveis não negativas tem uma solução com n variáveis nulas, então qualquer sistema de m equações a n+1 variáveis não negativas tem uma solução com n+1 variáveis nulas. Consideremos um sistema satisfazível com m+n+1 variáveis (S1) ai,1X1+..+ai,m+nXm+n+ai,m+n+1Xm+n+1 = bi i: 1..m Se o sistema é satisfazível, existe uma solução Xi = wi (≥ 0 para i: 1..m+n+1). Substituindo Xm+n+1 por Xm+n+1= wm+n+1-δ (S2) ai,1X1+...+ai,m+nXm+n = ci+ai,m+n+1δ (ci=bi-ai,m+n+1wm+n+1) Uma solução deste sistema com δ=0 é uma solução do sistema S1 com Xm+n+1 = wm+n+1. Assim, o sistema (S3) ai,1X1+...+ai,m+nXm+n = ci é satisfazível (admite a solução inicial Xi = wi )

Lema 1  (2) Ora tendo este sistema, satisfazível, m equações e m+n variáveis, pela hipótese de indução, deve ter uma solução com n variáveis nulas. Sem perda de generalidade, considere-se que são as últimas n variáveis que se anulam, nessa solução, isto é, que existe uma solução Xi = di ≥ 0 para i: 1..m e Xm+j = 0 para j : 1, n Desta forma, o sistema S3 pode reescrever-se na forma (S4) Xi = di + ci,m+1 Xm ci,m+n Xm+n Algebricamente, S4 é obtido de S3 por combinação linear das suas linhas. Aplicando a mesma combinação linear, não a S3 mas a S2, obtemos o sistema (S5) Xi = di + ci,m+1Xm ci,m+nXm+n + ci,m+n+1δ Sendo obtido por uma combinação linear de S2, S5 é equivalente a S2. Assim, qualquer solução de S5 com δ=0 é uma solução do sistema inicial (S1), com Xm+n+1 = wm+n+1.

Lema 1  (3) Se considerarmos apenas as soluções com as n variáveis Xm+j (j: 1..n) nulas o sistema S5 pode ser reescrito como (S6) Xi = di + ci,m+n+1 δ Assim, qualquer solução deste sistema S5, corresponde a uma solução do sistema S1 em que Xi = di + ci,m+n+1 δ i : 1..m; Xm+j = j : 1..n; e Xm+n+1 = wi-δ Desta forma o sistema S1 inicial de m equações a m+n+1 variáveis tem uma solução com n variáveis nulas (todas as variáveis Xm+j com j: 1..n). Se algum dos dis ou se wi fôr nulo, então basta fazer δ=0 para obter uma solução de S1 com n+1 variáveis nulas: as anteriores mais Xi (i: 1..m) ou Xm+n+1.

Lema 1  (4) Xi = di + ci,m+n+1 δ i : 1..m; Xm+n+1 = wi-δ
No caso mais geral, em que os dis e wi são estritamente positivos, pode obter-se uma nova solução para um valor de δ > 0 e que garanta di + ci,m+n+1 δi = 0 para um i : 1..m; ou δm+n+1 = wi No menor destes valores δi, S6 tem uma solução com uma variável nula. Mas então o sistema S1 tem uma solução com n+1 variáveis nulas: para além da variável correspondente de S6, todas as variáveis Xm+j (j: 1..n) são nulas, o que prova o teorema .

Forma Resolvida SF0 Definição: Dado um sistema de equações de m equações a m+n incógnitas (S1) ai,1 X1+...+ai,m+n Xm+n = bi (i: 1..m) a sua forma resolvida SF0 tem a forma (SF0) Xi = di + ci,m+1 Xm ci,m+n Xm+n sendo di ≥ 0 i: 1..m As variáveis no lado esquerdo são as variáveis básicas, sendo as outras as não básicas (as variáveis básicas podem ser quaisquer e não as primeiras m variáveis como são apresentadas para simplificar a notação). O lema anterior permite justificar o seguinte teorema.

Forma Resolvida SF0 Teorema: Um sistema de equações de m equações a m+n variáveis não-negativas é satisfazível sse se puder rescrever na forma SF0. Demonstração  Se se pode reescrever na forma resolvida SF0, então o sistema admite a solução não negativa, <d1, d2, ..., dm,0,..,0>.  Dado o sistema satisfazível (S1) ai,1 X1+...+ai,m+n Xm+n = bi (i: 1..m) o lema anterior garante uma solução <s1,s2, ...,sm,0,..,0>, que permite a forma SF0 (SF0) Xi = di + ci,m+1 Xm ci,m+n Xm+n com di ≥ 0 para i: 1..m através de uma combinação linear das suas equações.

X2 = 0 X2 X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 - X2 X4 = X1 + X2 X5 = X1 - X2 x1 = x3/ x5/3 x2 = 6 - x3/ x5/3 x4 = x3/3 - X5/3 X1 = X X4 X2 = X3 + 2 X4 X5 = X3 - 3 X4 X2 = X1 - X2 X4 = X1 - X3 X5 = X1 + X3 X1 = X4/2 + X5/2 X2 = X4/2 - X5/2 X3 = X4/2 - X5/2 X2 = X1 - X5 X3 = X1 + X5 X4 = X1 - X5 X1 = X X4 X3 = X2 - 2 X4 X5 = X X4 2 X1 + X2 ≤ 8 X1 + X2 ≥ 3 X1 - X2 ≥ -5 X1 , X2 ≥ 0 2 X1 + X2 + X3 = 8 X1 + X2 - X4 = 3 X1 - X2 - X5 = -5

Restrições Racionais Como atrás demonstrado, um conjunto de m restrições lineares de igualdade (equações) envolvendo m+n variáveis, não negativas, é satisfazível sse se puder colocar na forma SF0 Definição: Dado um sistema de equações de m equações a m+n incógnitas (S1) ai,1 X1+...+ai,m+n Xm+n = bi (i: 1..m) a sua forma resolvida SF0 tem a forma (SF0) Xi = di + ci,m+1 Xm ci,m+n Xm+n sendo di ≥ 0 i: 1..m

Restrições Racionais A questão que se coloca agora é como garantir a passagem eficiente de um conjunto de restrições lineares sobre variáveis não negativas para essa forma resolvida SF0. Por outro lado, se se pretender a integração dum resolvedor de restrições simbólicos num sistema de programação em lógica (CLP) esse resolvedor deve ser incremental. Há que definir um procedimento para efectuar essa transformação incremental. Esse procedimento é esencialmente baseado no algoritmo SIMPLEX.

Dado um espaço com n dimensões, a restrição a1 X1 + a2 X an Xn = b define uma região admissível, correspondente aos pontos de um hiper-plano desse espaço. Igualmente num espaço com n dimensões, a restrição a1 X1 + a2 X an Xn =< b que se pode reescrever-se com a adição de uma variável, não negativa, extra a1 X1 + a2 X an Xn + an+1 Xn+1 = b define uma região admissível, correspondente aos pontos de um hiper-semiespaço desse espaço nD.

Como casos particulares temos um espaço tridimensional (n=3), em que o hiper-plano corresponde ao plano usual, e um hiper-semiespaço corresponde a um semiespaço 3D. Num espaço bidimensional (n=2), um hiper-plano corresponde a uma recta e um hiper-semiespaço corresponde a um semi-plano. Com efeito, a restrição a1 X1 + a2 X2 = b pode reescrever-se como X2 = a X1 + c correspondendo a uma recta intersectando o eixo X2 no ponto c e com inclinação (X2/X1) igual ao valor a. X2 X1 3X1 + 5X2 = 15 X2 = -3/5 X1 + 3

Num espaço bidimensional uma restrição com 3 variáveis pode reescrever-se como X2 = a X1 + (c + k X3) Por exemplo: Desta forma, a variável X3 pode ser vista como uma variável de desvio. O seu valor nulo corresponde à recta (desvio nulo) e o seu valor positivo/negativo a um dos semiplanos definidos pela recta. X2 X1 X3 < 0 X3 > 0 3X1+5X2 = 15 3X1 + 5X2 + 10X3 = 15 3X1 + 5X2 = X3 X2 = -3/5 X1 + (3-2X3)

Ainda num espaço a 2 dimensões, m equações a m+2 variáveis não negativas podem ser reescritas de forma a que m variáveis sejam definidas em função das outras 2, que só aparecem numa das equações. Ilustrando para o caso m=2, o método de eliminação de Gauss garante que as equações a11 X1 + a12 X2 + a13 X3 + a14 X4 = b1 a21 X1 + a22 X2 + a23 X3 + a24 X4 = b2 podem reescrever-se como X3 = c11 X1 + c12 X2 + c1 X4 = c21 X1 + c22 X2 + c2

Mas um sistema X3 = c11 X1 + c12 X2 + c1 X4 = c21 X1 + c22 X2 + c2 pode ainda reescrever-se como c11 X1 + c12 X2 = c1 - X3 c21 X1 + c22 X2 = c2 - X4 Assim, para satisfazer ambas as restrições um ponto tem de estar na intersecção dos semiplanos definidos pelos desvios X3 >= 0 e X4 >= 0

Exemplo: ou : R1: -X1 + 3X2 ≤ 9 R2: X1 + X2 ≤ 11 R1: -X1 + 3X2 + X3 = 9 R2: X1 + X2 + X4 = 11 -X1 + 3X2 = 9 X1 + X2 = 11 X3 >=0 X4 >=0 -X1 + 3X2 = 9 - X3 X1 + X2 = 11 - X4

Num espaço a 2 dimensões, as 2 rectas que limitam 2 restrições =< intersectam-se num ponto, que constitui um vértice da região “admissível”, isto é, da região onde existem pontos que satisfazem as duas restrições. É fácil de generalizar este resultados para dimensões maiores que 2. Com n=3, os 3 planos que limitam 3 restrições =< intersectam-se num ponto, que constitui um vértice da região “admissível”. Em geral, num espaço a n dimensões, os n hiper-planos que limitam n restrições =< intersectam-se num ponto, que constitui um vértice da região “admissível”.

Num espaço a n dimensões, K restrições =< definem uma região admissível que tem de satisfazer todas os conjuntos de n restrições. Isto é, a região admissível é a intersecção de todas as sub-regiões admissíveis definidas pelos conjuntos de n restrições. Tal região é um espaço convexo com a forma de um hiper-poliedro. Num espaço a 2 (3) dimensões K restrições =< definem um polígono (poliedro), que é a intersecção de todas as sub- regiões admissíveis para todos os conjuntos de 2 (3) restrições.

Dadas R3: 2X1 + X2 ≤ 8 ; R4: X1 + X2 ≥ 3 ; R5: X1 - X2 ≥ -5, a região admissível é constituída pela intersecção das sub-regiões definidas pelos conjuntos de restrições {R3, R4}, {R3, R5} e {R4, R5}. X2 X1 - X2 - X5 = -5 2 X1 + X2 + X3 = 8 X1 + X2 - X4 = 3 X1

Na realidade, pretendendo-se a não-negatividade de X1 e X2, deverão ser consideradas mais 2 restrições R1: X1 ≥ 0 e R2: X2 ≥ 0 A região admissível é constituída pela intersecção das sub-regiões definidas pelos 10 conjuntos de restrições {R1, R2}, a {R4, R5}. X2 X1 - X2 = -5 X1 = 0 2 X1 + X2 = 8 X1 X1 + X2 = 3 X2 = 0

Cada uma das rectas correspondentes a uma restrição pode ser identificada pelo anulamento da correspondente variável de desvio. X2 2X1 + X2 ≤ 8 2 X1 + X2 + X3 = 8 X1 - X2 ≥ -5 X1 - X2 - X5 = -5 X1 - X2 = -5 X5 = 0 2 X1 + X2 = 8 X1 = 0 X3 = 0 X4 = 0 X1 X1 + X2 = 3 X2 = 0 X1 + X2 ≥ 3 X1 + X2 - X4 = 3

Ora como cada restrição é limitada pelo anulamento de uma das variáveis de desvio, o ponto de intersecção de rectas correspondentes a duas restrições é obtido pelo anulamento das respectivas variáveis de desvio. Por outro lado, as m equações a m+2 variáveis podem ser reescritas de forma a que m variáveis (as variáveis básicas) venham definidas em relação às outras duas. Considerando essas duas (não-básicas) como variáveis de desvio, o seu anulamento determina o valor das outras variáveis no ponto de intersecção das rectas correspondentes a essas variáveis de desvio.

Por exemplo, dadas as restrições anteriores R3: 2X1 + X2 ≤ 8 ; R4: X1 + X2 ≥ 3 ; R5: X1 - X2 ≥ -5 e reescrevendo-as como R3: 2X1 + X2+ X3 = 8 ; R4: X1 + X2 -X4 = 3 ; R5: X1 - X2 -X5 = -5 considerando a base {X1, X2 e X4} elas podem ser reescritas como X1 = X3/ X5/3 X2 = X3/ X5/3 X4 = X3/ X5/3 sendo X1 =1, X2 = 6 e X4 =4 o ponto onde se intersectam as restrições R3 e R5 (isto é, com desvios X3 e X5 nulos).

Havendo m restrições e m+2 variáveis, o número de potenciais vértices da região admissível é o número de combinações de m+2 variáveis 2 a 2, isto é, (m+2)*(m+1)/2. No caso que temos vindo a exemplificar, m=3 donde o número de potenciais vértices é 10. Na realidade, nem todos os pontos resultantes da intersecção das rectas estão dentro da região admissível. Um vértice não está na região admissível se no ponto correspondente, algumas das variáveis tomarem valores negativos.

2 X1 + X2 ≤ 8 X1 + X2 ≥ 3 X1 - X2 ≥ -5 X1 , X2 ≥ 0 2 X1 + X2 + X3 = 8 X1 + X2 - X4 = 3 X1 - X2 - X5 = -5 X2 = 0 X2 X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 - X2 X4 = X1 + X2 X5 = X1 - X2 x1 = x3/ x5/3 x2 = 6 - x3/ x5/3 x4 = x3/3 - X5/3 X1 = X X4 X2 = X3 + 2 X4 X5 = X3 - 3 X4 X2 = X1 - X3 X4 = X1 - X3 X5 = X1 + X3 X1 = X4/2 + X5/2 X2 = X4/2 - X5/2 X3 = X4/2 - X5/2 X2 = X1 - X5 X3 = X1 + X5 X4 = X1 - X5 X1 = X X4 X3 = X2 - 2 X4 X5 = X X4

A existência de soluções para o conjunto de restrições equivale a que a região admissível seja não vazia. Um problema em que nenhum vértice seja admissível é um problema sem solução. Por exemplo, se nas restrições anteriores se trocarem o sinal das restrições R3 e R4, o novo sistema R3’: 2X1 + X2 ≥ 8 R3’: 2X1 + X2 -X3 = 8 R4’: X1 + X2 ≤ ou R4’: X1 + X2 +X4 = 3 R5: X1 - X2 ≥ -5 R5: X1 - X2 -X5 = -5 corresponde a um problema que é impossível e não tem qualquer solução.

2 X1 + X2 ≥ 8 X1 + X2 ≤ 3 X1 - X2 ≥ -5 X1 , X2 ≥ 0 2 X1 + X2 - X3 = 8 X1 + X2 + X4 = 3 X1 - X2 - X5 = -5 X2 = 0 X2 X1 X3 = 0 X5 = 0 X1 = 0 X4 = 0 X3 = X1 + X2 X4 = X1 - X2 X5 = X1 - X2 x1 = x3/ x5/3 x2 = x3/ x5/3 x4 = x3/3 + x5/3 X1 = X X4 X2 = X X4 X5 = X3 + 3 X4 X2 = X1 + X3 X4 = X1 - X3 X5 = X1 - X3 X1 = X4/2 + X5/2 X2 = X4/2 - X5/2 X3 = X4/2 + X5/2 X2 = X1 - X5 X3 = X1 - X5 X4 = X1 + X5 X1 = X X4 X3 = X2 - 2 X4 X5 = X2 - X4

Passagem para a Forma Resolvida SF0
Para avaliar a satisfazibilidade de um problema basta pois verificar que pelo menos um dos potenciais vértices corresponde a uma solução. Mas isso corresponde a colocar o sistema de restrições na forma SF0. Por exemplo, o vértice admissível X1 = X3/ X5/3 X2 = X3/3 - 2 X5/3 X4 = X3/ X5/3 Corresponde à reescrita na forma SF0 do sistema inicial 2 X1 + X2 ≥ 8 2 X1 + X2 - X3 = 8 X1 + X2 ≤ ou X1 + X2 + X4 = 3 X1 - X2 ≥ -5 X1 - X2 - X5 = -5

Para colocar um sistema de m restrições de igualdade a m+n variáveis (possivelmente proveniente de um sistema de m restrições de desigualdade ≤ ou ≥ ) na forma SF0, basta Escolher m variáveis como variáveis básicas Reescrever o sistema nessa base Verificar se os coeficentes livres (valor das variáveis básicas quando as não básicas se anulam) são não negativos O problema desta abordagem é a existência de um número muito elevado ( ) de possibilidades de escolha da base. m+n m C

Optimização em SF0 Há pois que definir uma estratégia para determinar quais as variáveis que devem entrar na base. Essa estratégia é fácil de entender se se pretender não apenas verificar a satisfação de um conjunto de restrições, mas ainda a optimização de uma função objectivo, que tal como as restrições seja linear. Assim, assumamos que, dado um conjunto de m restrições de igualdade nas variáveis X1 a Xm+n,, colocado na forma SF0, se pretende adicionalmente maximizar (o caso da minimização é semelhante) uma função F = c1 X1 + c2 X Cm+n Xm+n

Optimização em SF0 max F = c1 X1 + c2 X2 + ... + Cm+n Xm+n
Sem perda de generalidade, consideremos que as primeiras m variáveis X1 a Xm são as variáveis básicas, isto é, que as restrições foram reescritas na forma SF0 X1 = d1+ c11 Xm c1n Xm+n ... Xm = dm+ cm1 Xm cmn Xm+n Substituindo na função F as variáveis básicas pelas suas expressões nas não básicas obtemos max F = k + k1 Xm+1 + k2 Xm kn Xm+n

max F = k + k1 Xm+1 + k2 Xm+2 + ... + kn Xm+n
Optimização em SF0 max F = k + k1 Xm+1 + k2 Xm kn Xm+n Esta expressão mostra que no vértice definido pelas variáveis básicas (com as não-básicas nulas) a função a maximizar tem o valor k. Mostra ainda que, se todos os coeficientes Ki forem negativos, não se pode obter maiores valores de F. No caso de haver coeficientes Ki positivos, um aumento da variável correspondente aumenta o valor da função F. Quanto maior o coeficiente, maior o aumento da função objectivo por aumento unitário da variável.

max F = k + k1 Xm+1 + k2 Xm+2 + ... + kn Xm+n
Optimização em SF0 max F = k + k1 Xm+1 + k2 Xm kn Xm+n Numa perspectiva de optimização, dada uma certa base admissível, para a qual existam valores Ki positivos, o valor da função objectivo pode ser melhorado (ser maior que k) tornando positiva as correspondentes variáveis não básicas. Mas para mantermos o sistema na forma SF0, se se “desanula” uma variável não-básica, essa situação deverá ser compensada anulando uma das variáveis básica. Assim, a estratégia de optimização a seguir é a de, partindo de uma base admissível, proceder a um conjunto de mudanças de base até se poder reescrever a função objectivo com coeficientes não negativos.

Optimização em SF0 Obviamente, uma mudança de base, envolve a escolha de uma variável não básica para entrar na base, e uma variável básica para sair da base, A escolha da variável de entrada pode seguir a heurística delineada atrás: A variável de entrada é aquela a que corresponde na função objectivo o coeficiente mais positivo (maximização) ou mais negativo (minimização). Uma vez escolhida a variável de entrada, ela deverá aumentar tanto quanto possível. No entanto, na forma SF0 corrente, um aumento dessa variável poderá conduzir à diminuição das variáveis básicas.

Optimização em SF0 Com efeito, tome-se a forma SF0 abaixo e, sem perda de generalidade, considere-se Xm+1 como variável de entrada. max F = k + k1 Xm+1 + k2 Xm kn Xm+n suj. Xi = di + ci1 Xm cin Xm+n i:1..m Mantendo as outras variáveis não básicas nulas, as equações reescrevem-se como Xi = di + ci1 Xm i:1..m Assim, sendo di ≥ 0, um aumento de Xm+1 anula as variáveis básicas (em que ci1< 0), quando tomar o valor di/|ci1|. Como se pretende anular uma variável básica, mantendo as outras não negativas, a escolha da variável de saída recai na variável básica Xi para a qual seja menor o valor di/|ci1|.

Optimização em SF0 Resumindo, a maximização da função objectivo de um sistema de m igualdades a m+n variáveis envolve a escrita do sistema e da função objectivo na forma SF0 max F = k + k1 Xm+1 + k2 Xm kn Xm+n suj. Xi = di+ ci1 Xm cin Xm+n i:1..m e a execução do seguinte algoritmo Enquanto a função objectivo tiver coeficientes positivos mudar a base escolhendo como variável de entrada a variável não básica Xj com coeficiente kj mais positivo na função objectivo como variável de saída a variável básica i com cij < 0 e menor valor di/|cij| na respectiva restrição

ai1 X1 + ai2 X2 + ... + ain Xn =< bi i: 1..m
Optimização em SF0 Este algoritmo de optimização pressupõe que, no início, o conjunto de restrições foi reescrito na forma SFO, que era exactamente o objectivo que nos levou a abordar o problema da optimização! Na realidade, a colocação na forma SF0 não levanta qualquer problema quando as m restrições de igualdade a m+n variáveis provêm de um conjunto de m restrições de desigualdade ai1 X1 + ai2 X ain Xn =< bi i: 1..m Em que todos os bi são não negativos. Neste caso basta escolher as variáveis X1 a Xn para variáveis não básicas, pois o seu anulamento satisfaz as restrições!

Exemplo. Max X1 + 2X2 R1: -X1 + 3X2 ≤ 9 R2: X1 + X2 ≤ 11 R3: 2X1 + X2 ≤ 18 X1 ,X2 ≥ 0

Do ponto de vista geométrico, e como visto atrás, cada forma SF0 corresponde a um vértice da região admissível. Assim, ao trocar uma variável básica por outra não básica este algoritmo vai percorrendo vários vértices da região admissível, com valores crescentes da função objectivo. Por apenas trocarem uma variável, dois vértices consecutivos estão unidos por uma aresta do hiper-poliedro que representa a região admissível.

Max X1 + 2X2 -X1 + 3X2 + X3 = 9 X1 + X2 + X4 = 11 2X1 + X2 + X5 = 18 X1 ,X2 ≥ 0 Exemplo. Max X1 + 2X2 X3 = 9 + X1 - 3X2 → 9/3 X4 = 11 - X1 - X2 → 11/1 X5 = X1 - X2 → 18/1 entra X2, sai X3

Max X1 + 2X2 X3 = 9 + X1 - 3X2 → 9/3 X4 = 11 - X1 - X2 → 11/1 X5 = X1 - X2 → 18/1 entra X2, sai X3 Exemplo. Max 6 + 5X1/3 - 2X3/3 X2 = X1/3 - X3/3 → 9 X4 = X1/3 + X3/3 → 6 X5 = X1/3 + X3/3 → 45/7 entra X1, sai X4

Max X1/3 - 2X3/3 X2 = X1/3 - X3/3 X4 = X1/3 + X3/3 X5 = X1/3 + X3/3 entra X1, sai X4 Exemplo. Max 16 - X3/4 - 5X4/4 X1 = 6 + X3/4 - 3X4/4 X2 = 5 + X3/12- X4/4 X5 = 1 -7X3/12+ 7X4/4 óptimo encontrado

Podemos ver agora como é que o algoritmo de optimização pode ser utilizado para colocar o sistema inicial na forma SFO, quando o anulamento das variáveis de decisão não constitui uma solução admissivel. Se essa é a situação, então temos uma (ou mais) restrição Ri na forma Xi = di+ ci1 Xm cin Xm+n em que o di < 0. Nesta situação, podemos introduzir uma variável artificial não negativa, Zi, na restrição fazendo Xi = Zi + di+ ci1 Xm cin Xm+n

Xi = Zi + di+ ci1 Xm cin Xm+n Como é óbvio, a restrição assim modificada e a inicial serão equivalentes sse Zi = 0. Reescrevendo a restrição modificada como Zi = - di+ ci1 Xm cin Xm+n - Xi Obtem-se uma restrição que já se encontra na forma SF0, já que -di > 0. Assim sendo, como uma solução admissível do sistema modificado é uma solução do sistema inicial se Zi = 0, tudo o que é necessário fazer é, no sistema modificado, minimizar Zi.

Em geral, dado um conjunto m de restrições de igualdade a m+n variáveis, a passagem à forma SF0 pode fazer-se nos seguintes passos Escolhem-se m variáveis para variáveis básicas, e reescreve-se o sistema isolando as variáveis básicas Xi = di+ ci1 Xm cin Xm+n Se todos os di forem não negativos, o sistema está na forma SFO. Caso contrário, introduzem-se variáveis artificiais nas restrições adequadas, reescrevendo-as em Zi = - di+ ci1 Xm cin Xm+n - Xi Finalmente minimiza-se a soma das variáveis artificiais.

Passagem para a Forma Resolvida SF0 Xi = di+ ci1Xm+1 +...+ cinXm+n
Naturalmente, se o mínimo fôr 0, no ponto de mínimo todas as variáveis artificiais são nulas. Em princípio, as variáveis artificiais são não-básicas, e o sistema toma a forma Xi = di+ ci1Xm cinXm+n +ei1Z eiqZq Em que os dis são não negativos. O sistema inicial é equivalente ao modificados com as variáveis artificiais nulas. Assim o sistema inicial é equivalente ao sistema que se obtem eliminando no anterior os termos nas variáveis artificiais, e que já está na forma SF0 porque todos os dis são não negativos. Xi = di+ ci1Xm cinXm+n

Na realidade alguma(s) das variáveis artificiais podem não ser não básicas obtendo-se restrições reescritas como Zq = 0 + ci1Xm cinXm+n +ei1Z eiq-1Zq-1 Neste caso, pode simplesmente trocar-se a variável Zi com um qualquer dos Xs não básicos obtendo-se, por exemplo Xm+1= 0 + c’i1Xm c’inXm+n +e’i1Z eiqZq em que c’ij= -cij/ci1, e’il= -eil/ci1 e eik= -1/ci1. A substituição de Zq por Xm+1 nas outras restrições não vai afectar os termos livres (dis) nelas existentes que serão simplesmente somados com 0.

Ao introduzir-se uma variável artificial introduz-se uma nova dimensão no problema. Por exemplo se o problema inicial tinha duas dimensões, X e Y, pode considerar-se a nova variável como a 3ª dimensão, Z. O problema inicial, pode considerar-se a intersecção do problema estendido com o espaço inicial. Por exemplo, em 2D, o problema inicial é a intersecção do problema estendido (3D) com o plano X-Y. Embora para o problema inicial Xi=0 não seja solução, no problema estendido, o ponto Xi=0 , Z > 0 é uma solução. A minimização de Z vai induzir um percurso no hiper- poliedro até atingir o espaço inicial (em 2D, o plano X-Y).

Exemplo -X1 + 3X2 ≤ 9 X1 + X2 ≤ 11 2X1 + X2 ≤ 18 X1 + 2X2 ≥ 12 Xi ≥ 0 -X1 + 3X2 + X3 = 9 X1 + X2 + X4 = 11 2X1 + X2 + X5 = 18 X1 + 2X2 - X6 = 12 X3 = X1 - 3X2 X4 = X1 - X2 X5 = X1 - X2 X6 = X1 + 2X2

Exemplo X3 = X1 - 3X2 X4 = X1 - X2 X5 = X1 - X2 X6 = X1 + 2X2 + Z1 min Z1 = 12 - X1 - 2X2 + X6 X3 = 9 + X1 - 3X2 X4 = 11 - X1 - X2 X5 = 18 -2X1 - X2 Z1 = 12 - X1 - 2X2 + X6 Projecção no plano X1-X2 do ponto <X1, X2, Z1> = <0, 0, 12>

min Z1 = 12 - X1 - 2X2 + X6 X3 = 9 + X1 - 3X2 X4 = 11 - X1 - X2 X5 = 18 -2X1 - X2 Z1 = 12 - X1 - 2X2 + X6 Exemplo min 6 - 5X1/3 + 2X2 /3 + X6 X2 = X1/3 - 3X3/3 X4 = X1/3 + 3X3/3 X5 = X1/3 + X3/3 Z1 = X1/3 + 2X3/3 + X6 Projecção no plano X1-X2 do ponto <X1, X2, Z1> = <0, 3, 6>

min 6 - 5X1/3 + 2X2 /3 + X6 X2 = X1/3 - 3X3/3 X4 = X1/3 + 3X3/3 X5 = X1/3 + X3/3 Z1 = X1/3 + 2X3/3 + X6 Exemplo min Z1 X1 = 18/5 + 2X3/5 + 3X6/6 -3Z1/5 X2 = 21/5 - X3/5 + X6/5 - Z1/5 X4 = 16/5 - X3/5 - 4X6/5 +4Z1/5 X5 = 33/5 - 3X3/5 - 7X6/5 +7Z1/5 21/5 18/5 O ponto <18/5, 21/5, 0> já está no plano X1-X2

Restrições Lineares sobre os Reais/Racionais

Apresentações semelhantes

Apresentação em tema: "Restrições Lineares sobre os Reais/Racionais"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Restrições Lineares sobre os Reais/Racionais

Apresentações semelhantes

Apresentação em tema: "Restrições Lineares sobre os Reais/Racionais"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback