A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Programação Dinâmica Estocástica. Solução Backward: Suponha 3 Estágios Programação Dinâmica Estocástica 12 3 Estágios: m=1,2,3 Estado: x m Decisão: D.

Apresentações semelhantes


Apresentação em tema: "Programação Dinâmica Estocástica. Solução Backward: Suponha 3 Estágios Programação Dinâmica Estocástica 12 3 Estágios: m=1,2,3 Estado: x m Decisão: D."— Transcrição da apresentação:

1 Programação Dinâmica Estocástica

2 Solução Backward: Suponha 3 Estágios Programação Dinâmica Estocástica 12 3 Estágios: m=1,2,3 Estado: x m Decisão: D m Variável Aleatória: k m Custo Elementar:

3 Programação Dinâmica Estocástica A qualidade de uma política é medida pelo seu Custo Total

4 Programação Dinâmica Estocástica Dado que o custo é aleatório há necessidade de trabalhar com médias. A qualidade de uma política é avaliada pela Esperança Matemática do seu custo.

5 Programação Dinâmica Estocástica Equação Recursiva Por analogía:

6 Programação Dinâmica Estocástica Continuando:

7 Programação Dinâmica Estocástica Passando à Otimização, define-se: Por analogia: É claro que:

8 Programação Dinâmica Estocástica Segue-se: De forma idêntica, não há dificuldade para estabelecer que:

9 Programação Dinâmica Estocástica Exercício: Considere o seguinte sistema hidrotérmico Existe uma afluência aleatória de energia ao reservatório y n com a seguinte distribuição de probabilidade: 00, ,500,25 3 0,5 0,25 0,5 2 0,25000,50, n Y

10 Programação Dinâmica Estocástica Se o sistema não atender a demanda, incorrerá num custo de deficit: Existe um custo associado à energia armazenada no reservatório no final do horizonte x 5 dada por: F 5 (x 5 ) x5x5 Fazer o planejamento otimizado da operação, considerando x 0 =3 U.E.

11 Programação Dinâmica Estocástica

12 A geração térmica e déficit podem ser representados por uma única variável g. 3 g g2g2 g1g1 9 C(g) g

13 Programação Dinâmica Estocástica A formulação fica:

14 Programação Dinâmica Estocástica Como a variável y n é aleatória, busca-se minimizar o custo esperado:

15 Programação Dinâmica Estocástica X4X4 F 4 (X 4 )U4*U4* X5X5 F 5 (X 5 )

16 Programação Dinâmica Estocástica X3X3 F 3 (X 3 )U3*U3* X4X4 F 4 (X 4 )

17 Programação Dinâmica Estocástica X2X2 F 2 (X 2 )U2*U2* X3X3 F 3 (X 3 )

18 Programação Dinâmica Estocástica X1X1 F 1 (X 1 )U1*U1* X2X2 F 2 (X 2 )

19 Programação Dinâmica Estocástica X0X0 F 0 (X 0 )U0*U0* X1X1 F 1 (X 1 )

20 Programação Dinâmica Estocástica Simulação para: A política ótima é: x n n u,g,y,v

21 Programação Dinâmica Estocástica Markoviana

22 A aleatoriedade depende também do passado recente A caracterização do estado vai exigir informação sobre este passado 12 3 Estágios: m=1,2,3 Estado: x m, k m Decisão: D m Variável Aleatória: k m Custo Elementar:

23 Programação Dinâmica Estocástica Markoviana A qualidade de uma política é uma variável alea- tória avaliada pela expectativa de custo total

24 Programação Dinâmica Estocástica Markoviana Equação Recursiva (Backward) : Por analogia

25 Programação Dinâmica Estocástica Markoviana Fase de Otimização É claro que:

26 Programação Dinâmica Estocástica Markoviana De maneira geral temos que: Observação: Uma sofisticação é termos:

27 Maldição da Dimensionalidade Comecemos promovendo uma comparação entre esforços computacionais requeridos em Programação Dinâmica e na Enumeração Completa. Para fixarmos idéia, vamos supor o problema:

28 Resolver Backward N – n° de estágios Ne - n° de estados em cada estágio Nc - n° de controles em cada estado Equação Recursiva ( mostra que para o estado fixado, temos necessidade de uma adição por controle Maldição da Dimensionalidade

29 Por estado Nc adições Por estágioNc*Ne adições No total N*Nc*Ne adições Em cada estado realizamos (Nc-1) comparações No total N*Ne*(Nc-1) comparações Enumeração Completa Ne estados ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° Nc controles estágio 012N-1 N Maldição da Dimensionalidade

30 A partir de cada x 0 teremos: Nc*Nc* *Nc*Nc trajetorias Como temos Ne valores diferentes para x 0, resultam: Ne*Nc N trajetórias distintas O custo de cada trajetória é calculado fazendo a soma de N+1 fatores J 0 + J J N-1 +T N*Ne*Nc N adições Para obter a solução ótima, devemos comparar os custos das trajetórias duas a duas: (Ne*Nc N -1) comparações Maldição da Dimensionalidade

31 (Programação Dinâmica) x (Enumeração completa) Vamos supor N=12 Nc=10 Ne=100 Tsoma=Tcomparação=10 -9 s 15 dias10*e1412*e14E.C. 23 us P.D. TempoComparaçõesAdições Maldição da Dimensionalidade

32 Número de variáveis de estado Número de variáveis de controle NeNe NcNc AdiçõesComparaçõesTempo us ms min , H Esta é a Maldição da Dimensionalidade Para N=12 façamos um estudo para um número crescente de variáveis de estado e de variáveis de controle. Maldição da Dimensionalidade

33 Exercício: Considere o mesmo problema hidrotérmico do exercício anterior e resolva para uma afluência Y n aleatória com distribuição de probabilidade markoviana, conforme a seguinte tabela. -Considere Y n-1 =1 -Fazer o planejamento otimizado de operação. Com as tabelas de decisões efetuar simulações com hidrologia baixa, média e alta. Considere x 0 =3 Maldição da Dimensionalidade Yn-1\Yn123 10,500,25 2 0,500,25 3 0,50


Carregar ppt "Programação Dinâmica Estocástica. Solução Backward: Suponha 3 Estágios Programação Dinâmica Estocástica 12 3 Estágios: m=1,2,3 Estado: x m Decisão: D."

Apresentações semelhantes


Anúncios Google