Seção 6: ESTATÍSTICA EM ENGENHARIA E CIÊNCIAS EXATAS Título: Seção 6: ESTATÍSTICA EM ENGENHARIA E CIÊNCIAS EXATAS Título: Jaime Shinsuke Ide Fábio Gagliardi.

Slides:



Advertisements
Apresentações semelhantes
Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Advertisements

Inteligência Artificial
Métodos Iterativos.
Lei de Little.
Inteligência Artificial
Fluxo em Redes Prof. Ricardo R. Santos.
Prof. André Laurindo Maitelli DCA-UFRN
Algoritmos para Geração de Variáveis Aleatórias
UFES CC/EC/Mestrado Teoria dos Grafos Árvores. UFES CC/EC/Mestrado Teoria dos Grafos Árvores Grafo Acíclico: não possui ciclos.
Métodos para representação de estruturas hierárquicas
ESTIMAÇÃO.
1 Domínios Finitos A eficiência das programas em domínios finitos (incluindo booleanos) podem ainda ser melhoradas pelo uso de Algoritmos de Propagação.
Prof. M.Sc. Fábio Francisco da Costa Fontes Abril
PERCEPTRON (CONTINUAÇÃO)
Modelos de Preferências em Inteligência Artificial CP-Nets
Busca em Profundidade Para encontrar um caminho de solução Sol, de um dado nó para algum nó objetivo Se N é um nó objetivo, então Sol=[N] Se há um nó N1.
Inteligência Artificial
Inteligência Artificial
UM ESTUDO SOBRE O PROBLEMA DO CAIXEIRO VIAJANTE
Computação Evolutiva: Programação Genética
Árvore Geradora de Peso Mínimo
Inteligência Artificial
Hashing (Espalhamento)
Pesquisa Operacional - Profa Úrsula L. F. Ribeiro
1 Simulação baseada em multiagentes – aplicação em educação O processo de simulação significa dirigir o modelo de um sistema com entradas satisfatórias.
Redes Bayesianas Alexandre Silva Pinheiro
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Solução: SIMULAÇÃO Sistemas Complexos
Grafos Msc. Cintia Carvalho Oliveira Doutoranda em Computação – UFU
Algoritmos em Grafos.
T ÓPICOS DE I.A. Métodos de Busca Busca em Espaços de Estado Prof. Mário Dantas.
Aprendizado de Máquina Aula 8
FACENS – Engenharia da Computação Inteligência Artificial Busca.
Criptografia Simétrica
Informática Teórica Engenharia da Computação
Informática Teórica Engenharia da Computação
Otimização por Colônia de Formigas (ACO)
Programação Avançada Simulação – Conceitos básicos
C OMPARAÇÃO DO COMPORTAMENTO DO BIC EM ALGUNS MODELOS PROBABILÍSTICOS Diogo Taurinho Prado Orientadora: Denise Duarte.
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
Operações com grafos União Exemplo
DISTRIBUIÇÕES AMOSTRAIS
Histórico, exemplos e problemas
Busca com informação e exploração
Área de Pesquisa: Redes de Computadores
Introdução e Busca Cega
Redes Bayesianas – Inferência
Redes Bayesianas - Aplicação em Risco Operacional
Sistemas Especialistas
Uma Abordagem Híbrida Fuzzy-Bayesiana para Modelagem de Incertezas
Algoritmos de Busca Local
Inferência Estatística
Inteligência Artificial
Estatística Geral (Elementos de Probabilidade)
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Técnicas de Reamostragem Camilo Daleles Rennó
Bayesian networks Chapter14.1–3 1. Bayesian networks Uma notação grafica para afirmações de independência condicional E uma especificação compacta para.
Regressão e Previsão Numérica.

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
Mestrado em Informática
Mecanismo de sugestão e processo de caracterização de redes sociais
On The Complexity of Determining Autonomic Policy Constrained Behaviour Sobre a Complexidade de Determinação de Política Autônoma de Comportamento Restrito.
REDES COMPLEXAS Rafael Dahis Engenharia de Computação e Informação UFRJ Redes de Computadores II – 2009/2 Professores: Luis Henrique Otto.
Metodologia da Pesquisa em Ensino de Ciências I
Algoritmo de Transportes Objecto de Aprendizagem Manuel Pina MarquesDEIG
Ant Colony Optimization Theory Rio de Janeiro 2011 Disciplina: Inteligência de Enxame Docente: José Manoel Seixas Discente: José Dilermando Costa Junior.
Modelos de distribuições discretas de probabilidade
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.
Modelagem de Fenômenos Físicos Utilizando a Técnica de Monte Carlo Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós graduação.
Transcrição da apresentação:

Seção 6: ESTATÍSTICA EM ENGENHARIA E CIÊNCIAS EXATAS Título: Seção 6: ESTATÍSTICA EM ENGENHARIA E CIÊNCIAS EXATAS Título: Jaime Shinsuke Ide Fábio Gagliardi Cozman Escola Politécnica, Universidade de São Paulo Av. Prof. Mello Moraes, 2231, , São Paulo, SP – Brasil Jaime Shinsuke Ide Fábio Gagliardi Cozman Escola Politécnica, Universidade de São Paulo Av. Prof. Mello Moraes, 2231, , São Paulo, SP – Brasil 1 1

Este trabalho apresenta métodos para geração uniforme de redes Bayesianas (modelos baseados em grafos direcionados para representação de distribuições conjuntas). Redes Bayesianas foram originalmente propostas pela comunidade de inteligência artificial na década de 80 e tem sido aplicadas em uma enorme variedade de problemas de decisão e diagnóstico automatizado. Inúmeros trabalhos tem sido propostos para inferência e estimação de redes Bayesianas, e testes tem sido conduzidos em conjuntos de redes selecionados arbitrariamente. Até o momento não existe nenhum método na literatura que permita gerar redes Bayesianas de forma uniforme. A proposta deste trabalho é construir um gerador aleatório e uniforme de redes Bayesianas com características determinadas pelo usuário (tipo de estrutura, tipo de distribuições de probabilidade associadas, número máximo de arcos ou número máximo de arcos por nó e número de nós). Para tanto, empregam-se cadeias de Markov para geração da estrutura da rede (informação qualitativa) e métodos baseados em distribuições Dirichlet para geração das distribuições de probabilidades associadas a cada nó (informação quantitativa). O método para geração de estruturas foca tanto a geração de grafos multi-conectados quanto de grafos conectados de forma única (“polytrees”). O método desenvolvido foi implementado e o programa resultante (BNGenerator) está disponível na Internet pelo endereço: Este trabalho apresenta métodos para geração uniforme de redes Bayesianas (modelos baseados em grafos direcionados para representação de distribuições conjuntas). Redes Bayesianas foram originalmente propostas pela comunidade de inteligência artificial na década de 80 e tem sido aplicadas em uma enorme variedade de problemas de decisão e diagnóstico automatizado. Inúmeros trabalhos tem sido propostos para inferência e estimação de redes Bayesianas, e testes tem sido conduzidos em conjuntos de redes selecionados arbitrariamente. Até o momento não existe nenhum método na literatura que permita gerar redes Bayesianas de forma uniforme. A proposta deste trabalho é construir um gerador aleatório e uniforme de redes Bayesianas com características determinadas pelo usuário (tipo de estrutura, tipo de distribuições de probabilidade associadas, número máximo de arcos ou número máximo de arcos por nó e número de nós). Para tanto, empregam-se cadeias de Markov para geração da estrutura da rede (informação qualitativa) e métodos baseados em distribuições Dirichlet para geração das distribuições de probabilidades associadas a cada nó (informação quantitativa). O método para geração de estruturas foca tanto a geração de grafos multi-conectados quanto de grafos conectados de forma única (“polytrees”). O método desenvolvido foi implementado e o programa resultante (BNGenerator) está disponível na Internet pelo endereço: 2 2

Gibbs sampler Inteligência Artificial (incertezas) Redes Bayesianas (RB) Geração de RB Geração de DAG Geração de distribuições condicionais Métodos Aproximados Algoritmos de Inferência Métodos MCMC números quasi- aleatórios BNGenerator Motivação: Inúmeros trabalhos tem sido propostos para inferência e estimação de redes Bayesianas, e testes tem sido conduzidos em conjunto com redes selecionados arbitrariamente. Até o momento não existe nenhum método na literatura que permita gerar redes Bayesianas de forma uniforme. A proposta deste trabalho é construir um gerador aleatório e uniforme de redes Bayesianas com características determinadas pelo usuário (tipo de estrutura, tipo de distribuições de probabilidade associadas, etc). (Estrutura do grafo) 3 3

Definição Grafos acíclicos direcionados. (Directed Acyclic Graph - DAG) Cada variável está associada à uma distribuição de probabilidade. Distribuição Conjunta definida por: Definição Grafos acíclicos direcionados. (Directed Acyclic Graph - DAG) Cada variável está associada à uma distribuição de probabilidade. Distribuição Conjunta definida por: p(X) =  i p(X i | pa{X i }) Conjunto de todas as variáveis Conjunto de todos os pais ( se tiver) A A B B C C Nó: representa uma variável de interesse. Arco: indica uma dependência causal e de informação entre duas variáveis p(A,B,C) = p(A).p(B/A).p(C/A) p (A) A=0 0,3 A=1 0,7 p (C/A) 0 0 0, , , ,8 Resultado:representação compacta e eficiente. Ilustração: Rede com 3 nós. 4 4

Grafos Árvore simplesPolytree Acíclico Não direcionados Conectado Uni-conectado (árvore) Direcionados Desconectado Cíclico Multi-conectado A BC ED A BC E D A BC ED A BC ED A BC E D A BC ED Tipos diferentes de estruturas de grafos Ilustrações para cada tipo de estrutura 5 5

Para gerar (construir) uma rede Bayesiana precisamos: Gerar a estrutura (grafo) Gerar as distribuições condicionais associadas a cada nó Para gerar (construir) uma rede Bayesiana precisamos: Gerar a estrutura (grafo) Gerar as distribuições condicionais associadas a cada nó A A B B C C Nó: representa uma variável de interesse. Arco: indica uma dependência causal e de informação entre duas variáveis p(A,B,C) = p(A).p(B/A).p(C/A) p (A) A=0 0,3 A=1 0,7 p (C/A) 0 0 0, , , ,8 A parte mais difícil é a geração de grafos (de maneira controlada) 6 6

p (C/A,B) , , , , , , , ,6 Sejam as variáveis binárias: A, B e C B B A A C C [0,1 0,9] [0,2 0,8] [0,3 0,7] [0,4 0,6] Distribuições a serem geradas de forma uniforme Metodologia geral Para uma distribuição com k valores, emprega-se a distribuição multivariável de Dirchlet de dimensão k. Para isso, define-se k parâmetros (  1,  2,...,  k ). Para se ter distribuição uniforme, define-se  ’s =1. Geração : - Sorteia-se k valores de u~U(0,1) - Computar - log(u) para cada u - Normalizar os k valores obtidos Metodologia geral Para uma distribuição com k valores, emprega-se a distribuição multivariável de Dirchlet de dimensão k. Para isso, define-se k parâmetros (  1,  2,...,  k ). Para se ter distribuição uniforme, define-se  ’s =1. Geração : - Sorteia-se k valores de u~U(0,1) - Computar - log(u) para cada u - Normalizar os k valores obtidos 7 7

Dimensão da dificuldade. O número de estruturas de grafos possíveis cresce super-exponencialmente em função do número de nós. Métodos heurísticos são propostos para geração de redes Bayesianas. Não garante sobre a distribuição dos grafos gerados. É desejável que se possua controle sobre a geração do grafo. “Geração uniforme de grafos” significa que cada grafo tem a mesma probabilidade de ser gerado, dentro do domínio de todos os grafos possíveis. Dimensão da dificuldade. O número de estruturas de grafos possíveis cresce super-exponencialmente em função do número de nós. Métodos heurísticos são propostos para geração de redes Bayesianas. Não garante sobre a distribuição dos grafos gerados. É desejável que se possua controle sobre a geração do grafo. “Geração uniforme de grafos” significa que cada grafo tem a mesma probabilidade de ser gerado, dentro do domínio de todos os grafos possíveis. Número total de combinações possíveis número de nós (n) combinações possíveis (c n ) Número total de combinações possíveis número de nós (n) combinações possíveis (c n )

Idéia chave: partir de um grafo (estado) inicial, e gerar grafos subsequentes segundo uma regra de transição de Markov que garante a convergência da simulação. A cada n- iterações suficientes para a convergência, o grafo (estado) atual é selecionado para a amostra. Estes grafos selecionados constituirão uma amostra uniforme de grafos com determinadas características. Condições que devem ser satisfeitas: Irredutibilidade Aperiodicidade Matriz de transição duplamente estocástica Idéia chave: partir de um grafo (estado) inicial, e gerar grafos subsequentes segundo uma regra de transição de Markov que garante a convergência da simulação. A cada n- iterações suficientes para a convergência, o grafo (estado) atual é selecionado para a amostra. Estes grafos selecionados constituirão uma amostra uniforme de grafos com determinadas características. Condições que devem ser satisfeitas: Irredutibilidade Aperiodicidade Matriz de transição duplamente estocástica... Cadeia de Markov Ergódica Distribuição estacionária converge para uniforme 9 9

P 10 (0,2)=1/6 P 12 (1,2)=1/ P 13 (0,1)=1/6 P 21 (1,2)=1/6 P 31 (0,1)=1/6 P 01 (0,2)=1/6 P 00 =5/6 P 11 =1/ Exemplo de geração de grafo multi-conectado com 3 nós estado 0 estado 1 estado 2 estado 3 Matriz de transição /6 1/ / /6 p 22 p Regra de transição Sortear um arco(i,j), com probabilidade 1/6 Se o arco(i,j) existir, manter atual estado Senão, adicionar o arco(i,j) Regra de transição Sortear um arco(i,j), com probabilidade 1/6 Se o arco(i,j) existir, manter atual estado Senão, adicionar o arco(i,j) P 22 P 33 10

Teorema 1- A matriz de transição definida pelo Algoritmo 1 é duplamente estocástica. Teorema 2 - A cadeia de Markov gerada pelo Algoritmo 1 é irredutível. Teorema 3 - A cadeia de Markov gerada é aperiódica. Teorema 4 - A cadeia de Markov gerada é ergódica e sua distribuição estacionária única converge para a distribuição uniforme. Teorema 1- A matriz de transição definida pelo Algoritmo 1 é duplamente estocástica. Teorema 2 - A cadeia de Markov gerada pelo Algoritmo 1 é irredutível. Teorema 3 - A cadeia de Markov gerada é aperiódica. Teorema 4 - A cadeia de Markov gerada é ergódica e sua distribuição estacionária única converge para a distribuição uniforme. Algoritmo 1: Gerando DAG´s multi-conectados Entrada: número de nós (n), número máximo de arcos por nó (maxD), número de iterações (N). Saída: DAG multi-conectado com n nós. 01. Inicializar grafo como uma árvore única ordenada. 02. Repetir o seguinte ciclo N vezes; 03.Gerar um par distinto de nós, i e j, distribuído uniformemente; 04.Se o arco (i,j) existir no grafo atual, remover o arco (i,j), desde que o grafo permaneça acíclico e conectado; 05.Senão; 06.Adicionar o arco(i,j), desde que o grafo permaneça acíclico e satisfaça a condição maxD; 07.Senão, permaneça no mesmo estado (grafo) ; 08. Retornar o grafo atual após as N iterações. Entrada: número de nós (n), número máximo de arcos por nó (maxD), número de iterações (N). Saída: DAG multi-conectado com n nós. 01. Inicializar grafo como uma árvore única ordenada. 02. Repetir o seguinte ciclo N vezes; 03.Gerar um par distinto de nós, i e j, distribuído uniformemente; 04.Se o arco (i,j) existir no grafo atual, remover o arco (i,j), desde que o grafo permaneça acíclico e conectado; 05.Senão; 06.Adicionar o arco(i,j), desde que o grafo permaneça acíclico e satisfaça a condição maxD; 07.Senão, permaneça no mesmo estado (grafo) ; 08. Retornar o grafo atual após as N iterações. 11

Algoritmo 2: Gerando polytrees Entrada: número de nós (n), número máximo de arcos por nó (maxD), número de iterações (N). Saída: polytree com n nós. 01. Inicializar grafo como uma árvore simples ordenada. 02. Repetir o seguinte ciclo N vezes; 03.Gerar um par distinto de nós, i e j, distribuído uniformemente; 04.Se o arco (i,j) existir no grafo atual ou se o grafo resultante não satisfazer a condição maxD, manter o mesmo estado (grafo); 05.Senão; 06.Inverter o arco (i,j) com probabilidade de 1/2, e então; 07.Encontrar o predecessor, nó k, no caminho entre os nós i e j, remover o arco entre k e j, e adicionar o arco (i,j) ou (j,i), dependendo do sorteio na linha 6; 08. Retornar o grafo atual após as N iterações. 12

Geração aleatória e uniforme de redes Bayesianas Programa desenvolvido em Java BNGenerator Geração aleatória e uniforme de redes Bayesianas Programa desenvolvido em Java BNGenerator Linha de comando do BNGenerator: java BnGenerator -nNodes 20 - maxDegree 3 -nGraphs 1 -format xml -nval 4 -fName Poly1 -structure singly ( Visualização (no sistema JavaBayes - ) de uma polytree de 20 nós gerada pelo BNGenerator. 13

estado freqüência Histograma 1: Gerando grafos multi-conectados média Histograma 2: Gerando polytrees estado média freqüência 4 nós; maxDegree 3; 446 diferentes tipos de grafos 5 nós; maxDegree 3; 128 diferentes tipos 14

O gerador aleatório de redes Bayesianas desenvolvido, BNGenerator, é algo inédito na área. Devido à sua característica de possibilitar o controle da estrutura da rede gerada. Vale a pena ressaltar que a metodologia desenvolvida, empregando cadeias de Markov, para geração aleatória de redes é flexível o suficiente para aplicá-la a diversos tipos de estruturas de interesse. A desvantagem do método é a dificuldade em determinar o número de iterações necessários para a convergência da cadeia de Markov. O inconveniente é superado, adotando-se um número grande de iterações; e constatou-se que o algoritmo desenvolvido é rápido, podendo processar muitas iterações em pouco tempo. Provas teóricas sobre o método desenvolvido encontra-se no artigo: Random generation of Bayesian networks. XI Simpósio em Inteligência Artificial (SBIA2002), Recife, (artigo aceito, a ser publicado) O uso de amostras uniformes de redes Bayesianas para análise de métodos MCMC de inferência é apresentado em: Testing MCMC algorithms with ramdomly generated Bayesian networks. I Workshop de Teses e Dissertações em Inteligência Artificial - WTDIA'02, realizado junto ao SBIA2002. (artigo submetido) O gerador aleatório de redes Bayesianas desenvolvido, BNGenerator, é algo inédito na área. Devido à sua característica de possibilitar o controle da estrutura da rede gerada. Vale a pena ressaltar que a metodologia desenvolvida, empregando cadeias de Markov, para geração aleatória de redes é flexível o suficiente para aplicá-la a diversos tipos de estruturas de interesse. A desvantagem do método é a dificuldade em determinar o número de iterações necessários para a convergência da cadeia de Markov. O inconveniente é superado, adotando-se um número grande de iterações; e constatou-se que o algoritmo desenvolvido é rápido, podendo processar muitas iterações em pouco tempo. Provas teóricas sobre o método desenvolvido encontra-se no artigo: Random generation of Bayesian networks. XI Simpósio em Inteligência Artificial (SBIA2002), Recife, (artigo aceito, a ser publicado) O uso de amostras uniformes de redes Bayesianas para análise de métodos MCMC de inferência é apresentado em: Testing MCMC algorithms with ramdomly generated Bayesian networks. I Workshop de Teses e Dissertações em Inteligência Artificial - WTDIA'02, realizado junto ao SBIA2002. (artigo submetido) (Para os interessados, o autor estará distribuindo alguns exemplares dos artigos acima, entre 17h30 e 18h30. Compareça!) 15