Programação Avançada Simulação – Conceitos básicos

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Amostragem em Pesquisas Sócio-Econômicas
Probabilidade e Esperança Condicional
Prof. André Laurindo Maitelli DCA-UFRN
Algoritmos para Geração de Variáveis Aleatórias
Estatística amintas paiva afonso.
Intervalos de Confiança
ANÁLISE DISCRIMINANTE
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
Cássio Luís Fernandes de Oliveira
ESTIMAÇÃO.
QUESTÕES PARA DISCUSSÃO E EXERCÍCIOS – CAP. 4
Mineração de Dados Avaliação de Classificadores
Estatística 8 - Distribuições Amostrais
MB-711 Fundamentos de Tratamento de Incertezas
Capítulo 6 Estimativas e Tamanho de Amostras
MB751 – Modelos de previsão
Diretrizes para Desenvolvimento do Projeto
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Solução: SIMULAÇÃO Sistemas Complexos
Estatística Aplicada (Aula 4)
Buscas em Grafos Prof. André Renato 1º Semestre/2012
Prof. Natalia Castro Fernandes Mestrado em Telecomunicações – UFF 2º semestre/2012.
Site: Estatística Prof. Edson Nemer Site:
ESTATÍSTICA.
ME623A Planejamento e Pesquisa
Informática Teórica Engenharia da Computação
Prof. Natalia Castro Fernandes Engenharia de Telecomunicações – UFF 2º semestre/2012.
Conceitos básicos de orientação a objetos
Programação Avançada Prof. Natalia Castro Fernandes
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
Linguagem de Programação II Parte IX
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
VALORES ESPERADOS.
Função de uma Variável Aleatória
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Aula 03 – BCC202 Análise de Algoritmos (Parte 1) Túlio Toffolo www
Desafios gerenciais Aula 4.
Modelos de distribuição de erros
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Site: Estatística Prof. Edson Nemer Site:
Aula 5 - Método experimental ou de seleção aleatória
Análise de Incertezas Introdução.
Avaliação de Desempenho Simulação
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Medidas de Dispersão Aula 8.
Modelagem de Sistemas Dinâmicos
DISTRIBUIÇÃO DE POISSON
DISTRIBUIÇÃO NORMAL.
Probabilidade e Estatística para Avaliação de Desempenho
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Abordagem Sistemática Guilherme Amaral Avelino Avaliação e Controle de Sistemas de Informação.
PROCESSO DE POISSON [ Parte II ] 1 - INTRODUÇÃO 2 - PROCESSO DE POISSON 3 - TEMPOS DE CHEGADA 4 - TEMPOS ENTRE CHEGADAS 5 - PROCESSOS DE RENOVAÇÃO 6 -
Metodologia da Pesquisa em Ensino de Ciências I
© 2000 Paulo Adeodato Avaliação de Desempenho de Sistemas Teste de Geradores de Números Aleatórios Paulo Adeodato Departamento de Informática Universidade.
Estimação: Estimativa Pontual Estimativa Intervalar
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
GESTÃO E GARANTIA DA QUALIDADE
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Testes de Unidade. 2 Pauta Testes de Unidade; Testes de Unidade; Desenvolvimento orientado a testes; Desenvolvimento orientado a testes; Testes unitários.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Distribuições de Probabilidade Camilo Daleles Rennó
Transcrição da apresentação:

Programação Avançada Simulação – Conceitos básicos Prof. Natalia Castro Fernandes Mestrado em Telecomunicações – UFF 2º semestre/2012

Introdução Análise de um problema Resolução analítica Simulação Teste Dificuldade de resolução de grande escala Simplificações podem distorcer o resultado, mas sem usar as simplificações o modelo pode ficar muito complexo Análise de um problema Resolução analítica Equações e modelos Simulação Modelo simplificado Teste Implementação real Quais partes do modelo podemos abstrair? Qual a distância entre a realidade e o resultado da simulação? Implementar pode ser muito complexo Como fazer testes em escala? A melhor análise tem os três tipos: resolução analítica, simulação e teste Em geral, basta fazer duas análises, desde que uma valide a outra.

Simulação Vantagens Desvantagens Pode lidar com modelos mais complexos do que a análise matemática Melhor representação do sistema real que a análise matemática Mais simples de implementar do que a solução completa Abstração de detalhes Pode analisar cenários com grande escala, o que pode ser proibitivo em implementações reais Desvantagens Dificuldade de interpretar os resultados O que eu fiz está certo??? O que representa o resultado obtido??? Longo tempo de execução

Caracterização de um simulador Determinístico ou estocástico Modelo contém eventos aleatórios? Estático ou dinâmico Evolução do tempo influi no sistema? Contínuo ou discreto Estado do sistema evolui continuamente ou em pontos discretos no tempo? Simulação discreta de eventos --Estocástica, dinâmica e discreta --

Simulador estocástico Modelo contém eventos aleatórios Depende de gerador de números aleatórios Gerar números pseudo-aleatórios Parecem aleatórios, mas são essencialmente determinísticos Uso de função pseudo-aleatória Mas como podemos gerar números aleatórios???

Gerador de números aleatórios Deve gerar números que pareçam uma variável aleatória uniforme Uniformemente distribuídos entre 0 e N-1, onde N é um número qualquer Estatisticamente independentes um do outro Já vimos que a função random() do módulo random faz exatamente isso. E se eu quisesse criar o my_random(), que tivesse as mesmas características de v.a. uniforme?

Método Congruente Método para gerar v.a. uniformes Utiliza três parâmetros inteiros a e M = parâmetros internos do algoritmo M determina quantos números poderão ser gerados x(0) = 1º valor da sequência pseudo-aleatória, também chamado de semente x(i+1) = a*x(i) % M U(i+1) = x(i+1)/M V.a. uniforme gerada

Método Congruente Exemplos a=3, M=11, x(0)=4 x(i+1) = 3*x(i) % 11 Sequência = 4, 1,3,9,5, 4, 1,3,9,5,4,... Má escolha de parâmetros pode gerar uma baixa variabilidade de valores e repetição da sequência com poucos sorteios.

Propriedade de um gerador pseudo-aleatório Todos os números da sequência são gerados? Qual o tamanho da sequência? Sugestão de valores para método congruente: M=(2^31) -1 A=7^5

Método Congruente Linear Mai s usado, pois costuma garantir maior variabilidade nos valores Um parâmetro a mais que o método congruente: c x(i+1) = (a*x(i)+c) % M U(i+1) = x(i+1)/M

Exercício Gere mil números aleatórios entre 0 e 1 com o método congruente e faça um histograma com intervalos de 0.1 de largura Repita utilizando o método congruente linear Repita utilizando a função random() Compare os resultados O gráfico pode ser feito com qualquer ferramenta

Lei dos Grandes Números Frequência relativa do resultado de um experimento aleatório converge para sua probabilidade Resultado fundamental em probabilidade e estatística Portanto, um bom gerador deveria apresentar uma frequência de ocorrências para todos os valores do histograma, no exercício anterior, igual a 1/10 Outro exemplo é o dado não viciado Se jogado muitas vezes, a frequência de cada face vale 1/6 Prova de que a probabilidade existe!!!! Números, quando em grande quantidade, convergem!!!

Lei dos Grandes Números Uma grande quantidade de medidas leva a média real do experimento Ex: gere um número entre 0 e 1 com o random() várias vezes

Lei dos Grandes Números Resposta = [0.8490961500569881, 0.6456630621108963, 0.7011384939674841, 0.7093239739503144, 0.008255047174339558, 0.5118803420415918, 0.9067574331321653, 0.04266981994782948, 0.19040859063960625, 0.30762765616240917, 0.2759092882464159, 0.03340334367397668] Média com 1 medida: 0.849096150056988 Média com 2 medidas: 0.7473796060839422 Média com 3 medidas: 0.7319659020451228 Média com 12 medidas: 0.3727341022628085 Média com 100 medidas: 0.48730569712969135 Média com 1000 medidas: 0.5049299613079365 Média com 10000 medidas: 0.49950420528919764

Gerando outras variáveis aleatórias Em um modelo de simulação, outras variáveis podem ser necessárias Exemplo: Geração de tráfego de um nó pode ser modelada com um processo de Poisson Relembrando O processo de Poisson dá a probabilidade de ocorrerem n eventos independentes com taxa média λ em um período de tempo t Tempo contínuo e estado discreto Pode-se mostrar que o intervalo entre dois eventos consecutivos em um processo de Poisson é modelado por uma variável aleatória geométrica.

Simulação Evolução de um sistema estocástico no tempo Evolução do estado do sistema Estado depende das medidas de interesse Medidas de interesse = dados que você deseja medir com a sua simulação

Variáveis da simulação Tempo representa o instante de tempo que o simulador se encontra Variáveis de estado Representam o estado do sistema no tempo t Variáveis de interesse Representam valores que permitem o cálculo de medidas de interesse

Eventos São ações que modificam o estado do sistema Quando um evento ocorre, as variáveis são atualizadas Tempo, estado do sistema e medidas de interesse Permitem seguir o modelo no tempo Utilização de lista de eventos

Lista de eventos Lista contendo todos os eventos que irão ocorrer no futuro Cada evento é identificado por tipo e instante que deverão acontecer A lista deve estar ordenada pelos instantes de ocorrência dos eventos Exemplo Evento 1 T=1 Evento 2 T=7 Evento 3 T=10

Lista de eventos Após executar o evento atual, o simulador consulta a lista Simulador processa próximo evento e o remove da lista Quando novos eventos serão adicionados à lista? Ao processar um evento!

Exemplo Simulador processa Evento 1 Evento 1 gera 2 novos eventos Simulador reordena a lista Simulador descarta evento 1 Simulador processa próximo evento Simulador Evento x T=12 Evento y T=8 Evento 1 T=1 Evento 2 T=7 Evento 3 T=10

Simulador genérico Inicializar variáveis Inserir um ou mais eventos na lista de eventos Enquanto não chegar ao fim da simulação Remover próximo evento da lista de eventos Processar evento

Estimando medidas de interesse Exemplo de medida de interesse: Tempo até que o sistema falhe Suponha que essa v.a. tenha distribuição desconhecida Como estimar algo sobre essa medida de interesse? Tirar média amostral Simular vários valores de X e tirar a média

Intervalo de Confiança Média amostral não é igual ao valor esperado Média amostral tende ao valor esperado Exemplo: Média amostral da random() é quase 0.5, mas não é exatamente o valor esperado 0.5 Ideia Utilizar a média para calcular um intervalo onde o valor esperado pode estar

Teorema do Limite Central Seja uma sequência de variáveis aleatórias identicamente independentes com valor esperado e variância (σ2) menores que ∞ A distribuição dessa sequência de variáveis converge para distribuição Normal se o tamanho da sequência (n) tende ao infinito (ou seja, se tivermos infinitas amostras, n-> ∞) É possível fazer essa aproximação para a normal, se usarmos um n suficientemente grande (ou seja, se tivermos muitas amostras)

Intervalo de confiança Definição Com probabilidade o intervalo gerado contém o valor esperado μ Calcula uma barra de erro que, com =95% de chance, contém o valor correto da medida Boa chance do intervalo gerado conter o valor esperado, mas não é garantido!

Intervalo de confiança Aproximação pela normal A confiança do intervalo

Entendendo a conta A confiança do intervalo é a média amostral, ou seja, a média das suas medidas é o desvio padrão amostral, ou seja, o desvio padrão das suas medidas é o valor do eixo x em uma normal com média 0, de tal forma que, se considerarmos o intervalo entre + e - , teremos marcado da área da Normal n é o seu número de amostras Z0.9=1.65 e Z0.95=1.96

Entendo a conta Lembrando que o desvio padrão amostral é calculado como: Onde: Média amostral

Intervalo de confiança Como apresentar seus gráficos? SEMPRE coloque a média amostral e o intervalo de confiança de cada um de seus pontos no gráfico

Resultado da simulação Estado estacionário x estado transiente Existe um tempo, chamado de transiente, no qual o resultado da simulação ainda não convergiu Efeito do estado inicial Na maioria das simulações, deseja-se conhecer o estado estacionário e não o estado transiente Considerar medidas a partir da estabilização do sistema Outra possibilidade é partir de um estado inicial mais próximo do estado estacionário

Número de rodadas É preciso realizar uma simulação diversas vezes para obter diversas medidas e tirar a média e o desvio padrão amostral Como saber qual é um bom número de rodadas? Lembrando que o ideal seriam infinitas rodadas

Número de rodadas Escolher um valor para a confiança do intervalo a ser gerado, ou seja, Escolher um valor máximo para o tamanho do intervalo, que chamaremos de L O valor de L deve ser escolhido de acordo com o seu intervalo de medidas, de tal forma que a barra de erros não fique grande demais Escolher um número de amostras mínimo, nmin O desvio padrão amostral, S, depende de n Por isso, existe um valor mínimo para n nmin=20 é um bom valor mínimo Gerar amostras até que intervalo gerado seja menor do que L

Algoritmo Escolha e L Gerar pelo menos nmin amostras Gerar mais amostras, para cada um dos seus pontos, até que: Calcular média amostral Montar o gráfico 2 < L

Exercícios Faça um script que calcule a média amostral de um conjunto de medidas. As medidas devem estar em um arquivo, sendo colocada uma medida por linha com a seguinte configuração: Valor_eixo_x Medida O script deve escrever em um arquivo de saída a média amostral para cada um dos valores de x com o seguinte formato: Valor_eixo_x Média Exemplo: Arquivo de entrada Arquivo de saída 1 10 1 9 1 8 2 3 2 6 2 9 1 9 2 6

Exercícios Faça um script que calcule o desvio padrão amostral, supondo que as medidas estão dispostas como explicado no exercício anterior. O script deve retornar o desvio padrão amostral de cada ponto da mesma forma que foi feito no exercício anterior. Faça um script que mescle os dois exercícios anteriores, criando um arquivo de saída do tipo: eixo_x média desvio

Exercícios Crie um script que leia a saída do exercício anterior e calcule o intervalo de confiança de 95% (Sua saída deve ser referente a . ). O arquivo de saída deve ser do tipo: eixo_x média intervalo

Referências Aulas do Prof. Daniel Figueiredo http://www.land.ufrj.br/~classes/model-analise-2009/slides/aula_simul_1.pdf http://www.land.ufrj.br/~classes/model-analise-2009/slides/aula_simul_2.pdf http://www.land.ufrj.br/~classes/model-analise-2009/slides/aula_simul_3.pdf http://www.land.ufrj.br/~classes/model-analise-2009/slides/aula_simul_4.pdf