A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

CIn- UFPE Sistemas Especialistas Probabilísticos.

Apresentações semelhantes


Apresentação em tema: "CIn- UFPE Sistemas Especialistas Probabilísticos."— Transcrição da apresentação:

1 CIn- UFPE Sistemas Especialistas Probabilísticos

2 CIn- UFPE Sistemas Especialistas Probabilísticos Glauber Tomaz Hendrik Teixeira Macedo Mariana Lara Neves

3 CIn- UFPE Conteúdo da apresentação Combinando conhecimento e objetivos num ambiente de incerteza A Teoria da Utilidade Funções de utilidade Funções de utilidade multivariada Redes de decisão Teoria do Valor da Informação

4 CIn- UFPE Combinando a teoria da utilidade com a teoria da probabilidade Criação de um decision-theoric agent este agente toma decisões em contextos onde a incerteza e os objetivos conflitantes deixariam um agente lógico sem poder de decisão usa uma função utilidade no processo de tomada de decisão

5 CIn- UFPE Função utilidade fornece um número que expressa quão desejável o estado é para o agente indica as preferências do agente entre as várias situações do mundo é combinada com a probabilidade de ocorrência dos estados resultantes, fornecendo a utilidade esperada de cada ação

6 CIn- UFPE Função utilidade U(S) utilidade do estado S cada ação A poderá gerar diferentes estados Result i (A) antes da execução da ação A, o agente calcula a probabilidade para cada estado resultante: P(Result i (A) | Do(A),E) E evidência do agente sobre o mundo Do(A) proposição de que A será executada no estado em que o agente se encontra

7 CIn- UFPE Função utilidade a utilidade esperada de uma ação, dadas as evidências do estado: EU(A|E) = P(Result i (A)|E,Do(A)).U(Result i (A)) Princípio da máxima utilidade esperada (MEU): um agente racional deverá escolher a ação que maximize sua utilidade esperada

8 CIn- UFPE Teoria da Utilidade Loteria: cenários complexos onde os diferentes resultados obtidos são prêmios, e que estes são determinados por acaso. L= [p,A ; 1-p,B] Notação para expressar preferências entre loterias: A>B, A B e A B

9 CIn- UFPE Axiomas da teoria da utilidade: Ordenamento: (A>B) V (B>A) V (A B) Transitividade: (A>B) (B>C) (A>C) Continuidade: A>B>C p [p,A ; 1-p,C] B

10 CIn- UFPE Axiomas da teoria da utilidade: Substituição: A B [p,A ; 1-p,C] [p,B ; 1-p,C] Monotonicidade: A>B (p q [p,A; 1-p,B] [q,A; 1-q,B] Decomposição: [p,A; 1-p,[q,B; 1-q,C]] [p,A;(1-p)q,B; (1-p)(1-q),C]

11 CIn- UFPE Axiomas da Utilidade: Princípio da Utilidade: U(A)>U(B) A>B U(A)=U(B) A B Princípio da Máxima Utilidade Esperada (MEU): U([p 1,S 1 ;... ; p n,S n ]) = p i U(S i )

12 CIn- UFPE Funções Utilidade mapeia estados em valores reais os agentes podem ter quaisquer preferências, contanto que elas atendam aos axiomas da teoria Utilidade do dinheiro: preferência monotônica: o agente prefere possuir mais dinheiro quando se lida com valores definidos

13 CIn- UFPE Exemplo de um programa de TV (solução 1) opção 1: US$ 1,000,000 opção 2: tentar US$ 3,000,000 na moeda (cara ou coroa) Cálculo do EMV (Valor monetário esperado) EMV(rejeitar) = US$ 1,000,000 EMV(aceitar) = ½($0) + ½($3,000,000) = US$ 1,500,000 Solução: aceitar!

14 CIn- UFPE Exemplo de um programa de TV (solução 2) situação atual U(S k ) = 5 opção 1 U(S k+1,000,000 ) = 8 opção 2 U(S k+3,000,000 ) = 10 EU(rejeitar) = U(S k+1,000,000 ) = 8 EU(aceitar) = ½ U(S k ) + ½ U(S k+3,000,000 ) = 7.5 Solução: rejeitar!

15 CIn- UFPE Paradoxo de St. Petersburg (Bernoulli ) Moeda : cara na n-ésima vez $ 2 n Probabilidade = (½) n EMV = P(cara i ).MV(cara i ) = (½) i. 2 i = = Bernoulli: a utilidade do dinheiro é medida em escala logarítmica U(Sk+n) = log 2 n EU = P(cara i ).U(cara i ) = (½) i. log 2 2 i = 1/2 + 2/ = 2 U(S k+4 ) = log 2 4 = 2 (US$4,00)

16 CIn- UFPE Grayson (1960) As preferências de Mr. Beard são consistentes com a função utilidade: U(S k+n ) = log(n + 150,000) para (-$150,000 < n < $800,000)

17 CIn- UFPE Grayson (1960) Boa parte das pessoas tem uma função com forma côncava no lado positivo de riqueza risk-averse: U(S L ) < U(S EMV(L) ) (parte positiva do gráfico) risk-seeking: (parte negativa do gráfico) certainty equivalent: valor que o agente aceita no lugar de uma aposta insurance premium: diferença entre EMV(L) e o certainty equivalent risk-neutral: agente que possui uma curva linear para a função utilidade

18 CIn- UFPE Julgamento humano Teoria de decisão é normativa: descreve como o agente deveria atuar. As pessoas geralmente violam os axiomas da teoria da utilidade. Tversky e Kahneman (1982), Allais (1953) A: 80% de chance de $4,000 B: 100% de chance de $3,000 C: 20% de chance de $4,000 D: 25% de chance de $3,000

19 CIn- UFPE Julgamento humano Resultados: B e C U($0) = U($4,000) < U($3,000) 0.2.U($4,000) > 0.25.U($3,000) risk-averse em eventos com alta probabilidade de ganhos risk-seeking em eventos de baixa probabilidade de ganho

20 CIn- UFPE Escalas e valores da utilidade melhor prêmio possível U(S) = u T pior catástrofe possível U(S) = u Utilidades normalizadas: u = 0 e u T =1 resultados intermediário: [p, u T ; (1-p), u ] Exemplos: problemas médicos, de transporte e de meio-ambiente

21 CIn- UFPE Escalas e valores da utilidade Nos casos médicos e de segurança, temos: u = morte imediata exemplos: revisões em aviões, material dos carros, etc.. Valor de cada vida humana (análises médicas e de segurança): micromort = chance de uma em um milhão de morte (US $20) QUALY = equivalente a um ano em boa saúde, sem enfermidades

22 CIn- UFPE Sistemas Especialistas...um programa de computador inteligente, que usa uma base de conhecimento e inferências para resolver problemas complexos, que requerem grande esforço intelectual humano. (Feigenbaum 82). Todos os organismos vivos são especialistas em lidar com incertezas, do contrário não sobreviveriam. Problema : Instalar um reator nuclear. Considerações: custo do terreno, distância às áreas habitadas, risco de acidentes, etc. Características do problema: vários atributos. Sistemas Especialistas sob Incertezas

23 CIn- UFPE Funções Utilidade Multivariadas Um agente com um conjunto de preferências tem uma função utilidade do tipo U(x 1,..., x n ) = f[f 1 (x 1 ),..., f n (x n )] onde f 1 (x 1 ) é uma função simples. Quanto maior o valor do atributo, maior o valor da função utilidade. Exemplo: quanto maior a AusênciaDeAcidentes, melhor a solução.

24 CIn- UFPE Dominância entre Atributos Um terreno B, para a construção do reator, custa menos e é mais distante das áreas habitadas do que um terreno A. X1X1 X2X2 A D C B Região de domínio sobre A Mas se os atributos forem incerteza ? ?

25 CIn- UFPE Neste caso, precisamos introduzir o conceito de dominância estocástica. Professor, o que é dominância estocástica ? Suponha que o custo do terreno A seja normalmente distribuído em torno de R$ 3,7 milhões, com desvio padrão de R$ 0,4 milhões; e o custo do terreno B seja normalmente distribuído em torno de R$ 4,0 milhões, com desvio padrão de R$ 0,35 milhões.

26 CIn- UFPE Matematicamente se duas ações A e B têm distribuição de probabilidade p 1 (x) e p 2 (x) com relação ao atributo X, então A domina estocasticamente B em X se Distribuição Acumulada e Dominância

27 CIn- UFPE Preferências sem Incerteza Um conjunto de atributos {risco, custo do terreno, funcionários} exibe independência preferencial mútua (IPM) se estes não são correlacionados. Teorema: Se os atributos X 1,...,X n são mutuamente independentes, então a preferência do agente pode ser descrita como a que vai maximizar a função onde cada V i é a função valor do atributo X i. Estruturas de Preferências e Utilidade Multivariada

28 CIn- UFPE Preferências com Incerteza Atributos {X 1,..., X n } têm independência de utilidade sobre atributos {Y 1,..., Y n }, se as preferências pelas loterias em {X 1,..., X n } são independentes dos valores de {Y 1,..., Y n }. Atributos {X 1,..., X n } são mutuamente independentes de utilidade (MIU), se cada subconjunto de {X 1,..., X n } é independente de utilidade dos demais atributos do conjunto. Para atributos MIU, a utilidade é multiplicativa. U = k 1 U 1 + k 2 U 2 + k 1 k 2 U 1 U 2.

29 CIn- UFPE Rede de Decisão = Rede Bayesiana + ações/utilidades Local do reator Proximidade à População Custos Funcionários U Risco de Acidentes Rede de Decisão

30 CIn- UFPE Descrição da Rede de Decisão Nós de Chance (ovais): representam as variáveis aleatórias como nas redes Bayesianas; Nós de Decisão (retângulos): representam os pontos onde o agente que vai tomar a decisão pode escolher uma ação; Nós de Utilidade (losângulos): representam a função utilidade do agente.

31 CIn- UFPE Tabela de Ação-Utilidade Local do reator Funcionários U Risco de Acidentes A tabela de ação-utilidade é uma versão compilada da formulação original.

32 CIn- UFPE Algoritmo de Avaliação de Redes de Decisão 1. Ajuste as variáveis de evidência para o estado atual. 2. Para cada possível valor do nó de decisão: (a) Ajuste o nó para o valor de decisão dado; (b) Calcule as probabilidades posteriores para os nós pais do nó utilidade, usando um algoritmo inferência probabilística padrão; (c) Calcule a utilidade resultante da ação; 3. Retorne a ação com a maior função utilidade.

33 CIn- UFPE Quais as perguntas que devemos fazer sobre o problema? Precisamos saber como novas informações vão afetar a função utilidade do agente. Teoria do Valor da Informação Privatização ?

34 CIn- UFPE Problema do Petróleo Uma multinacional está vai comprar os direitos de explorar petróleo no Brasil. Existem 10 bacias onde a exploração é permitida. Estudos revelaram que apenas uma das bacia tem uma boa reserva de petróleo que vale aproximadamente R$ 1 bilhão. O preço de cada bacia é R$ 100 milhões. Quanto a empresa deve pagar para obter a informação da consultoria ?

35 CIn- UFPE Considere n = 10, C = R$ 1 bilhão e C/n = R$ 100 milhões. Com uma probabilidade 1/n, a consultoria mostra que a bacia 3 tem petróleo. Neste caso, a companhia vai comprar o bacia por C/n e terá um lucro de C - C/n = (n - 1)C/n. Com uma probabilidade (n - 1)/n, a consultoria mostra que um bloco não tem petróleo. A probabilidade de encontrar petróleo nas outras bacias é de 1/(n - 1). Assim, o lucro da empresa é C/(n - 1) - C/n = C/[(n - 1)/n]. O lucro que a empresa terá devido a informação é

36 CIn- UFPE Valor da Informação Perfeita (VIP) O conhecimento atual do agente é E. A função utilidade esperada para a melhor ação é dada por onde A é uma ação do agente, R i (A) é um estado de saída possível, F(A) representa a execução da ação A e P(R i | E, F ) é a probabilidade condicional de R i acontecer quando E e F acontecem.

37 CIn- UFPE O novo valor de após a nova evidência E j é A evidência E j é uma variável aleatória, portanto, devemos tomar a média sobre todos os possíveis valores e jk de E j. O valor da informação E j é definido por

38 CIn- UFPE Propriedades do Valor da Informação O valor da informação é não negativo O valor da informação, em geral, é não aditivo O valor da informação independe da ordem

39 CIn- UFPE Algoritmo de um Agente-Detetive Miope função Agente-Detetive (percepção) retorna uma ação estático: D - uma rede de decisão integre a percepção em D j o valor que maximiza E (E j ) - C(E j ) Se E (E j ) > C(E j ) então retorne uma Requisição de E j do contrário retorne a melhor ação de D O agente miope calcula o valor da informação assumindo que apenas uma evidência é adquirida.

40 CIn- UFPE Determine o escopo do problema Desenhe a rede de conexões (topologia) Associe as probabilidades Associe as utilidades Forneça as evidências disponíveis Avalie o diagrama Obtenha outras evidências Realize uma análise sobre as repostas a pequenas variações do sistema Construindo um Sistema Especialista sob Incerteza

41 CIn- UFPE Biobliografia Russel, S. and Norvig, P., Artificial Intelligence: A Modern Approach, Prentice-Hall (1995). Capítulo 16. Giarratano, J. and Riley, G., Expert Systems: Principles and Programming, International Thomson Publishing, 2 nd edition (1994). Capítulo 4. Waterman, D. A., A Guide to Expert Systems, Addison-Wesley (1986). Capítulos 12 e 25. Rich, E. e Knight, K., Inteligência Artificial, Makron Books (1993). Capítulo 8.


Carregar ppt "CIn- UFPE Sistemas Especialistas Probabilísticos."

Apresentações semelhantes


Anúncios Google