Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.

Slides:



Advertisements
Apresentações semelhantes
Análise Estatística Testes de Hipóteses.
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Estatística amintas paiva afonso.
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
Estatística Descritiva vs Estatística Indutiva
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Cássio Luís Fernandes de Oliveira
ESTIMAÇÃO.
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 6 Estimativas e Tamanho de Amostras
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Erros no Teste de Hipóteses
Testes de Hipóteses Forma mais clássica de inferência estatística
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 4)
Distribuição de probabilidade
Distribuição de probabilidade
Intervalo de Confiança para a média da população
ESTATÍSTICA.
ESTATÍSTICA.
Estatística - Estimação – III - 1; Teorema do limite central
Sérgio Mário Lins Galdino
Denise Duarte Depto de Estatística ICEx- UFMG
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
Fundamentos de Análise de Sinais
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Amostragem: Média e desvio-padrão amostral Prof. Helcio Rocha
Exponential Random Graph Models
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Comparação de Sistemas Usando Dados de Amostras
Modelagem Estatística
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Técnicas de amostragem
Estatística Inferencial (cap. 7 Martins)
Distribuição da Proporção Amostral
ANÁLISE ESTATÍSTICA II
Site: Estatística Prof. Edson Nemer Site:
ANÁLISE ESTATÍSTICA II
Inferência Estatística
Estatística Aplicada Aula 7
Introdução à Estatística
Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:
Probabilidade e Estatística Exemplo da Moeda Balanceada
Noções de Inferência Estatística
Aula 11 - Teste de hipóteses, teste de uma proporção
Estatística Aplicada Aula 8
EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.
Professor Antonio Carlos Coelho
Probabilidade e Estatística para Avaliação de Desempenho
Distribuição da Amostra
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
TÉCNICAS ESTATÍSTICAS PARA AUDITORIA
INFERÊNCIA ESTATÍSTICA PROPORÇÃO POPULACIONAL p
INTERVALOS DE CONFIANÇA
Estimação: Estimativa Pontual Estimativa Intervalar
SPSS Guia Prático para Pesquisadores
GESTÃO E GARANTIA DA QUALIDADE
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Inferência Estatística
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Distribuição Amostral 3 Miguel Angel Uribe Opazo.
Estatística Aplicada à Adminitração Prof. Alessandro Moura Costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
INFERÊNCIA ESTATÍSTICA
Critérios de Escolha dos Métodos Estatísticos
Transcrição da apresentação:

Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira

Amostragem vs. População Milhões de números X 1, X 2,..., X n Amostragem População Média  Desv. Pad.  MédiaX Desv. Pad. s Objetivo: Determinar parâmetros a partir das estatisticas

Intervalo de Confiança Em estatística, inferências (a partir de dados) não são definitivas inquestionáveis: devem ser sempre apresentadas com os intervalos de confiança associados Nós apenas medimos os fenômenos do mundo real em observações discretas e generalizamos as conclusões para todo o domínio Há sempre um erro ao processo de generalização

Intervalo de Confiança P(a    b) = 1 -  onde: –  :valor esperado do parâmetro (desconhecido) –(a,b):intervalo de confiança (variável aleatória) –  :nível de significância –100( 1 -  )nível de confiança –( 1 -  )coeficiente de confiança

Métodos para se Determinar o Intervalo de Confiança. Quantis de k médias Teorema Central do Limite (a partir de 1 média) –Aproximação pela distribuição normal (n  30) –Aproximação pela distribuição t de Student (n<30)

Exemplo: Quantis de 100 Médias a 90% de Nível de Confiança-1 Tomam-se 100 amostras {x 1, x 2,.., x n } de n exemplos Calculam-se as 100 médias Colocam-se as 100 médias em ordem crescente Toma as [1+0,05(100-1)] e [1+(1-0,05)(100-1)]-ésimas médias como limites inferior e superior ab

Intervalo de Confiança – Distribuição Normal - N(0,1) Faz-se a transformação para a normal reduzida N(0,1) Consulta-se na tabela o quantil z [1-  /2] da normal reduzida Encontra o intervalo de confiança (a,b)

Exemplo 1 Suponha uma certa distribuição de pontos que tenha: x = 3.90 s = 0.95 n = 32 Queremos um intervalo de confiança sobre a média de 90%! 100(1-  ) = 90   = 0.1 Temos, Z [0.995] = 1.645, o que implica um intervalo de confiança

Intervalo de Confiança – Estatística de t-Stundent Faz-se a transformação para a t de Student com graus de liberdade Consulta-se na tabela o quantil t [1-  /2; ] da t de Student Encontra o intervalo de confiança (a,b)

Exemplo 2 Suponha a amostragem: {-0.04, -0.19, 0.14, -0.09, -0.14, 0.19, 0.04, 0.09}. Temos, x = 0 s = n = 8 Queremos um intervalo de confiança sobre a média de 90%! 100(1-  ) = 90   = 0.1 Temos, t [0.95;7] = 1.895, o que implica um intervalo de confiança

Teste de Média Zero médias 0 Intervalos de Confiança que incluem o zero Intervalos de Confiança que não incluem o zero

Exemplo 3 A diferença de tempo de processamento para duas diferentes implementações do mesmo algoritmo é dada pela amostragem: {1.5, 2.6, -1.8, 1.3, -0.5, 1.7, 2.4} n = 7; x = 1.03; s 2 = 2.57 ; s = 1.60 Intervalo de Confiança de 99% : 100(1-  ) = 99,  = 0.01, 1-  /2 = 0.995

Procedimentos Estatísticos para Comparação de Dois Sistemas Observações Emparelhadas Se n experimentos são realizados sobre dois sistemas, e existe uma relação um para um entre o i-ésimo teste do sistema A e o i-ésimo teste do sistema B, estas observações são ditas emparelhadas Observações Não Emparelhadas Se não existir uma correspondência entre as amostras dos sistemas A e B, as observações são ditas não em parelhadas.

Observações Emparelhadas Seis medidas similares foram aplicas a dois sistemas, e obtemos: {(5.4, 19.1), (16.6, 3.5), (0.6, 3.4), (1.4, 2.5), (0.6, 3.6), (7.3, 1.7)} Um Sistema é melhor do que o outro? A diferença de rendimento constitui ma amostragem das seis observações: {-13.7, 13.1, -2.8, -1.1, -3.0, 5.6} X = -0.32; s = 9.03; IC(90%) =  t 0.95 (3.69), t 0.95 = IC(90%) = (-7.75, 7.11) O intervalo de Confiança incluí o zero, desta forma os dois sistemas não são diferentes!

Observações Não Emparelhadas É necessário realizar uma estimativa da variância e dos graus de liberdade: Receita: Procedimento teste-t 1) Calcular as médias

Observações Não Emparelhadas 2) Calcular os Desvios Padrões:

Observações Não Emparelhadas 3) Calcula a diferença das médias: 4) Calcular o desvio padrão da diferença das médias:

Observações Não Emparelhadas 5) Calcular o número efetivo de graus de liberdade:

Observações Não Emparelhadas 6) Calcule o intervalo de confiança para a diferença das médias: 7) Se o intervalo de confiança incluir o zero, a diferença é não significativa em um nível de confiança de 100(1-  )%. Se o intervalo de confiança não incluir o zero, então o sinal da diferença das médias indicará qual sistema é o melhor!

Exemplo – Observações não Emparelhadas O tempo de processador requerido para executar uma tarefa foi medido em dois sistemas: Sistema A: {5.36, 16.57, 0.62, 1.41, 0.64, 7.26} Sistema B: {19.12, 3.52, 3.38, 2.50, 3.60, 1.74} Sistema A: Média x a = 5.31 Variância s a 2 = n a = 6 Sistema B: Média x b = 5.64 Variância s a 2 = n b = 6

Exemplo – Observações não Emparelhadas Diferença das médias: x a – x b = Desvio Padrão para diferença das médias: s =3.698 Número efetivo de graus de liberdade: = t [0.95; 12] = 1.71 Intervalo de confiança = (-6.92, 6.26) O intervalo de confiança inclui o zero! Assim sobre este nível de confiança os sistemas são iguais!

Teste Visual 1)Os CI’s não se sobrepõem, o sistema vermelho é melhor. 2)Os CI’s se sobrepõem e as médias estão dentro do CI do sistema oposto. Os sistemas são iguais! 3)Os CI’s se sobrepõem, mas as médias não estão dentro do CI do sistema oposto. É necessário o procedimento do teste-t!

Intervalo de Confiança Unilateral Se desejarmos comparar uma grandeza x com um determinado valor, para sabermos, por exemplo, se ela é maior que este valor. Só necessitamos de um lado do intervalo de confiança. Assim, pode-se definir:

Exemplo – IC Unilateral O tempo de resposta a um estimulo foi medido para um sistema A e um sistema B. SistemaN o de medidas MédiaDesv. Padrão A B Procedimento Teste-t: s = = ( > 30) z 0.90 =1.28 IC = (-17.37, *19.35) = (-17.37, 7.402)

Intervalos de Confiança para Proporções Estatística de Dados Categóricos – Probabilidades associada às Categorias. Tais probabilidade são chamadas de proporções! Dado que n 1 das n observação são do tipo 1, o IC para a proporção é dado por:

Exemplo - Proporções Um experimento foi repetido 4 vezes em dois sistemas. O sistema A foi superior Ao sistema B em 26 repetições. O sistema A é superior com uma confiança de 99%? P = 26/40 = 0.65; s = ; z = O que dá um IC = 0.62  (2.576)(0.075) = (0.46, 0.84) Como o ponto 0.5 pertence ao IC não pode-se afirmar que o Sistema A é superior ao Sistema B com 99% de certeza!

Determinação do Tamanho das Amostras Tamanho da amostra para determinação da média: Se queremos um precisão de  r% e um IC de 100(1-  )% Tamanho da amostra para determinação de proporções: Se queremos um precisão de  r% e um IC de 100(1-  )%

Determinação do Tamanho das Amostras Tamanho da amostra para IC’s que não se sobrepõem: