Probabilidade e Estatística para Avaliação de Desempenho

Slides:



Advertisements
Apresentações semelhantes
Escola Politécnica de Pernambuco Departamento de Ensino Básico
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Variáveis Aleatórias Uma variável aleatória associa um número real a cada resultado de um experimento aleatório. Mais precisamente…
Algoritmos para Geração de Variáveis Aleatórias
Intervalos de Confiança
Cássio Luís Fernandes de Oliveira
Variável Aleatória Contínua
ESTIMAÇÃO.
QUESTÕES PARA DISCUSSÃO E EXERCÍCIOS – CAP. 4
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
MB-711 Fundamentos de Tratamento de Incertezas
. Capítulo 1 Introdução à Estatística Capítulo 1 Introdução à Estatística Prof. Paulo Renato de Morais ESTATÍSTICA APLICADA.
Capítulo 5 A Distribuição Normal de Probabilidade
Capítulo 6 Estimativas e Tamanho de Amostras
TODA MEDIÇÃO ESTÁ SUJEITA A ERROS, DEVIDO À RAZÕES DE ORDEM PRÁTICA E TEÓRICA. A origem dos erros podem estar na modelagem, nas circunstâncias e métodos.
Variáveis Aleatórias Uma variável aleatória associa um número real a cada resultado de um experimento aleatório. Mais precisamente…
J. Landeira-Fernandez Ética e Ciência
Probabilidade.
Sérgio Mário Lins Galdino
Programação Avançada Simulação – Conceitos básicos
Fundamentos de Análise de Sinais
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
VALORES ESPERADOS.
Distribuição de Probabilidades
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Modelos de distribuição de erros
Amostragem Pontos mais importantes:
Estatística Inferencial (cap. 7 Martins)
Site: Estatística Prof. Edson Nemer Site:
Variável Aleatória Discreta Unidimensional
PLANEJAMENTO DO EXPERIMENTO
Análise de Incertezas Introdução.
Probabilidade e Estatística Exemplo da Moeda Balanceada
Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.
3. Distribuições de probabilidade
Professor Antonio Carlos Coelho
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Estimativas de grandezas cap 2. e cap 3 Média Desvio Padrão e Variância Definições importantes Distribuição Normal Teorema do limite central Hipóteses.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
TÉCNICAS ESTATÍSTICAS PARA AUDITORIA
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Abordagem Sistemática Guilherme Amaral Avelino Avaliação e Controle de Sistemas de Informação.
Aula 4 – Estatística- Conceitos básicos
Experimento Aleatório Experimento aleatório é um procedimento cujo resultado é incertoExperimento aleatório é um procedimento cujo resultado é incerto.
DISTRIBUIÇÃO DE POISSON
DISTRIBUIÇÃO BINOMIAL
2. VARIÁVEIS ALEATÓRIAS 2015.
ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera.
ANÁLISE DE DADOS EM BIOLOGIA
Estimação: Estimativa Pontual Estimativa Intervalar
GESTÃO E GARANTIA DA QUALIDADE
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Módulo 1 Estatística Básica.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Distribuição Amostral 3 Miguel Angel Uribe Opazo.
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Campus Londrina LAB FÍSICA 1 ALGARISMOS SIGNIFICATIVOS e INCERTEZAS NAS MEDIDAS LAB FÍSICA 1 ALGARISMOS SIGNIFICATIVOS.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Revisão de Estatística Parte II J M Fernandes. Amostras estatísticas para parâmetros populacionais Assumir que a distribuição é normal X~N(µ(σ 2 )) Gerar.
Estatística Aplicada à Adminitração Prof. Alessandro Moura Costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Distribuições de Probabilidade Camilo Daleles Rennó
INFERÊNCIA ESTATÍSTICA
Transcrição da apresentação:

Probabilidade e Estatística para Avaliação de Desempenho Carlos Alberto Kamienski cak@ufabc.edu.br

Probabilidade e Estatística Variável aleatória Eventos independentes Distribuição de probabilidade e densidade Média ou valor esperado Variância e desvio padrão Amostragem e estimação de parâmetros Intervalo de confiança

Variável Aleatória Mapeamento de um evento (resultado de um experimento aleatório) em um número Exemplos: X = estado do servidor: 1  ativo, 0  inativo Y = número de pacotes IP por intervalo de tempo Z = atraso estabelecimento conexão SSH Experimento: lançar um dado A = valor facial B = 0  valor  3 1  valor  4 C = 0  valor par 1  valor ímpar

Variáveis Discretas e Contínuas Uma variável aleatória é discreta se o número de resultados possíveis é finito ou pode ser contado Variáveis aleatórias discretas são determinadas por uma contagem Uma variável aleatória é contínua se pode assumir qualquer valor dentro de determinado intervalo O número de resultados possíveis não pode ser listado Variáveis aleatórias contínuas são determinadas por uma medição -2 -1 1 2 Número de resultados infinitos

Eventos independentes Dois eventos são independentes a ocorrência de um não afeta a probabilidade do outro A existência ou não de relação de dependência pode modificar conclusões de uma simulação Eventos dependentes Número de pacotes que chegam em um roteador Número de pacotes descartados Eventos independentes Número de chamadas que chegam a um central telefônica Duração das chamadas

Distribuição de probabilidade Descreve a chance que uma variável pode assumir ao longo de um espaço de valores A soma de todas as probabilidades deve ser 1 Variável discreta Tabela especificando a probabilidade de que a variável assuma cada um dos valores possíveis Variável contínua Função especificando a probabilidade de que a variável assuma um valor em cada um dos intervalos possíveis

Distribuição discreta de probabilidade Determina o comportamento de uma variável aleatória discreta, atribuindo probabilidades a todos os possíveis valores Exemplo: variável X (estado do servidor) P[X=1] = p1 P[X=0] = p2 O conjunto {p1, p2} é a distribuição de probabilidade da variável aleatória discreta X

Função acumulada e densidade No caso de variáveis contínuas, define-se uma função de distribuição acumulada FX(x) que determinada a probabilidade da variável assumir um valor menor ou igual a um determinado valor x onde, fX(x) é a função de densidade de probabilidade ou somente densidade

Distribuição de Poisson Parâmetro:  (média) Utilização: Número de chegadas em um determinado tempo Número de chamadas telefônicas em um tempo t Número de conexões TCP em um tempo t Exemplo: X = número de conexões SSH por hora Em determinado servidor  = 3,5 P(X = 2) = 0,185

Distribuição de Poisson (densidade)  = 10 Geração: R (http://www.r-project.org)

Distribuição de Poisson (acumulada)  = 10 Geração: R (http://www.r-project.org)

Distribuição Uniforme Parâmetros: a e b (limite inferir e superior) Utilização: Variável limitada sem informação adicional Direção de movimentação de um usuário em um rede celular Distância entre fonte e destino em uma rede Probabilidade de um pacote conter um erro

Distribuição Uniforme a = 0 b = 10

Distribuição Exponencial Parâmetro:  (média) Utilização: Tempos entre eventos sucessivos Tempo entre chamadas telefônicas Tempo entre requisições a um servidor TELNET Tempo entre falhas de um equipamento

Distribuição Exponencial  = 10

Distribuição Normal (Gaussiana) Parâmetros: ,  (média e desvio padrão) Utilização: Aleatoriedade causada por várias fontes independentes agindo em conjunto Erros em medições

Distribuição Normal (Gaussiana) Normal Padrão  = 0  = 1

Média ou valor esperado A média denota o valor esperado de uma variável aleatória Média distribucional Média amostral (estimador)

Variância e desvio padrão A média não dá informação sobre dispersão Ex: conjuntos {5,10,15} e {0,10,20}, com média 10 Variância e desvio padrão medem a dispersão dos dados em relação à média Variância amostral (estimador) Desvio padrão = 

Amostragem e estimação Os parâmetros reais geralmente são desconhecidos Ex: Qual a vazão de saída de um roteador? Os parâmetros são aproximados por amostragem, gerando estatísticas, como média e desvio padrão (amostral) Com k amostras de tamanho n de uma variável X, são geradas k médias (estimativas) Próximo passo: determinar uma única estimativa

Intervalo de confiança Não é possível encontrar uma estimativa perfeita para a média a partir de um número finito de amostras de tamanho finito A melhor opção é obter limites probabilísticos: P(c1    c2) = 1 -   é o nível de significância (menor é melhor) Intervalo de confiança é um intervalo que com alta probabilidade contém o parâmetro estimado Influenciado pelo número de amostras, pelo nível de confiança e pelo desvio padrão das amostras Intervalo de confiança ao nível 90%, 95%, 99%, etc.

Intervalo de confiança

Intervalo de confiança

Intervalo de confiança

Processo de Estimação População Amostra Aleatória Estou 95% confiante que  está entre 40 e 60 Média X = 50 Média, , é desconhecida Amostra

Intervalo de Confiança de 95% 0.95 z.025= -1.96 z.025= 1.96

Tabela Z da Distribuição Normal

O que é o Intervalo de Confiança para a média? Uma maneira de expressar a incerteza de x como uma estimativa de  x = média da amostra  = média da população 95% do IC diz que em média, 95% das vezes, se você estimar um intervalo para , o valor verdadeiro de  irá estar dentro do intervalo

Intervalo de Confiança para a Média Estimação do Intervalo de Confiança  ( CONHECIDO) onde: z = valor crítico da tabela normal padrão  = Desvio padrão n = tamanho da amostra

Intervalo de Confiança para  ( conhecido) Premissas O desvio padrão da população é conhecido A distribuição da população é Gaussiana Se não for, usar uma amostra muito grande Estimativa do Intervalo de Confiança

Nível de Confiança Denotado por Interpretação baseada em freqüência relativa A longo prazo, de todos os intervalos de confiança que podem ser construídos podem conter o parâmetro desconhecido Um intervalo específico irá conter ou não conter o parâmetro

Intervalo e nível de confiança Distribuição amostral da Média _ Intervalos variam de a dos intervalos construídos contém  não contêm Intervalos de Confiança

Fatores que afetam a largura do intervalo (precisão) Variação dos dados Medida por Tamanho da amostra Nível de confiança Extensão do intervalo X - Z a X + Z  x x © 1984-1994 T/Maker Co.

Using Other Confidence Levels A 100(1-α)% confidence interval for the mean µ of a normal population when the value of  is known is given by [  / , + / ] The most frequently used confidence levels are 95%, 99% and 90%. Their corresponding ’s are Confidence level 95% 99% 90% 1.96 2.58 1.645

Structure of Confidence Intervals Lower Confidence Limit Upper Confidence Limit Margin of error

Interpreting a Confidence Interval True: 95% of samples will produce a CI [  2/ , + 2/ ] that cover the true mean µ every sample has a 95% chance of producing a CI that covers the truth. Wrong: there is a 95% chance that the true mean is in the interval [12.4, 13.2] . 95% of samples of size 100 will have sample means between 12.4 and 13.2.