A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.

Apresentações semelhantes


Apresentação em tema: "Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira."— Transcrição da apresentação:

1 Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira

2 Amostragem vs. População Milhões de números X 1, X 2,..., X n Amostragem População Média  Desv. Pad.  MédiaX Desv. Pad. s Objetivo: Determinar parâmetros a partir das estatisticas

3 Intervalo de Confiança Em estatística, inferências (a partir de dados) não são definitivas inquestionáveis: devem ser sempre apresentadas com os intervalos de confiança associados Nós apenas medimos os fenômenos do mundo real em observações discretas e generalizamos as conclusões para todo o domínio Há sempre um erro ao processo de generalização

4 Intervalo de Confiança P(a    b) = 1 -  onde: –  :valor esperado do parâmetro (desconhecido) –(a,b):intervalo de confiança (variável aleatória) –  :nível de significância –100( 1 -  )nível de confiança –( 1 -  )coeficiente de confiança

5 Métodos para se Determinar o Intervalo de Confiança. Quantis de k médias Teorema Central do Limite (a partir de 1 média) –Aproximação pela distribuição normal (n  30) –Aproximação pela distribuição t de Student (n<30)

6 Exemplo: Quantis de 100 Médias a 90% de Nível de Confiança-1 Tomam-se 100 amostras {x 1, x 2,.., x n } de n exemplos Calculam-se as 100 médias Colocam-se as 100 médias em ordem crescente Toma as [1+0,05(100-1)] e [1+(1-0,05)(100-1)]-ésimas médias como limites inferior e superior ab

7 Intervalo de Confiança – Distribuição Normal - N(0,1) Faz-se a transformação para a normal reduzida N(0,1) Consulta-se na tabela o quantil z [1-  /2] da normal reduzida Encontra o intervalo de confiança (a,b)

8 Exemplo 1 Suponha uma certa distribuição de pontos que tenha: x = 3.90 s = 0.95 n = 32 Queremos um intervalo de confiança sobre a média de 90%! 100(1-  ) = 90   = 0.1 Temos, Z [0.995] = 1.645, o que implica um intervalo de confiança 3.62 3.90 4.17

9 Intervalo de Confiança – Estatística de t-Stundent Faz-se a transformação para a t de Student com graus de liberdade Consulta-se na tabela o quantil t [1-  /2; ] da t de Student Encontra o intervalo de confiança (a,b)

10 Exemplo 2 Suponha a amostragem: {-0.04, -0.19, 0.14, -0.09, -0.14, 0.19, 0.04, 0.09}. Temos, x = 0 s = 0.138 n = 8 Queremos um intervalo de confiança sobre a média de 90%! 100(1-  ) = 90   = 0.1 Temos, t [0.95;7] = 1.895, o que implica um intervalo de confiança -0.0926 0 0.0926

11 Teste de Média Zero médias 0 Intervalos de Confiança que incluem o zero Intervalos de Confiança que não incluem o zero

12 Exemplo 3 A diferença de tempo de processamento para duas diferentes implementações do mesmo algoritmo é dada pela amostragem: {1.5, 2.6, -1.8, 1.3, -0.5, 1.7, 2.4} n = 7; x = 1.03; s 2 = 2.57 ; s = 1.60 Intervalo de Confiança de 99% : 100(1-  ) = 99,  = 0.01, 1-  /2 = 0.995

13 Procedimentos Estatísticos para Comparação de Dois Sistemas Observações Emparelhadas Se n experimentos são realizados sobre dois sistemas, e existe uma relação um para um entre o i-ésimo teste do sistema A e o i-ésimo teste do sistema B, estas observações são ditas emparelhadas Observações Não Emparelhadas Se não existir uma correspondência entre as amostras dos sistemas A e B, as observações são ditas não em parelhadas.

14 Observações Emparelhadas Seis medidas similares foram aplicas a dois sistemas, e obtemos: {(5.4, 19.1), (16.6, 3.5), (0.6, 3.4), (1.4, 2.5), (0.6, 3.6), (7.3, 1.7)} Um Sistema é melhor do que o outro? A diferença de rendimento constitui ma amostragem das seis observações: {-13.7, 13.1, -2.8, -1.1, -3.0, 5.6} X = -0.32; s = 9.03; IC(90%) = -0.32  t 0.95 (3.69), t 0.95 = 2.015 IC(90%) = (-7.75, 7.11) O intervalo de Confiança incluí o zero, desta forma os dois sistemas não são diferentes!

15 Observações Não Emparelhadas É necessário realizar uma estimativa da variância e dos graus de liberdade: Receita: Procedimento teste-t 1) Calcular as médias

16 Observações Não Emparelhadas 2) Calcular os Desvios Padrões:

17 Observações Não Emparelhadas 3) Calcula a diferença das médias: 4) Calcular o desvio padrão da diferença das médias:

18 Observações Não Emparelhadas 5) Calcular o número efetivo de graus de liberdade:

19 Observações Não Emparelhadas 6) Calcule o intervalo de confiança para a diferença das médias: 7) Se o intervalo de confiança incluir o zero, a diferença é não significativa em um nível de confiança de 100(1-  )%. Se o intervalo de confiança não incluir o zero, então o sinal da diferença das médias indicará qual sistema é o melhor!

20 Exemplo – Observações não Emparelhadas O tempo de processador requerido para executar uma tarefa foi medido em dois sistemas: Sistema A: {5.36, 16.57, 0.62, 1.41, 0.64, 7.26} Sistema B: {19.12, 3.52, 3.38, 2.50, 3.60, 1.74} Sistema A: Média x a = 5.31 Variância s a 2 = 37.92 n a = 6 Sistema B: Média x b = 5.64 Variância s a 2 = 44.11 n b = 6

21 Exemplo – Observações não Emparelhadas Diferença das médias: x a – x b = -0.33 Desvio Padrão para diferença das médias: s =3.698 Número efetivo de graus de liberdade: = 11.921 t [0.95; 12] = 1.71 Intervalo de confiança = (-6.92, 6.26) O intervalo de confiança inclui o zero! Assim sobre este nível de confiança os sistemas são iguais!

22 Teste Visual 1)Os CI’s não se sobrepõem, o sistema vermelho é melhor. 2)Os CI’s se sobrepõem e as médias estão dentro do CI do sistema oposto. Os sistemas são iguais! 3)Os CI’s se sobrepõem, mas as médias não estão dentro do CI do sistema oposto. É necessário o procedimento do teste-t!

23 Intervalo de Confiança Unilateral Se desejarmos comparar uma grandeza x com um determinado valor, para sabermos, por exemplo, se ela é maior que este valor. Só necessitamos de um lado do intervalo de confiança. Assim, pode-se definir:

24 Exemplo – IC Unilateral O tempo de resposta a um estimulo foi medido para um sistema A e um sistema B. SistemaN o de medidas MédiaDesv. Padrão A972124.10198.20 B153141.47226.11 Procedimento Teste-t: s = 19.35 = 191.05 ( > 30) z 0.90 =1.28 IC = (-17.37, -17.37+1.28*19.35) = (-17.37, 7.402)

25 Intervalos de Confiança para Proporções Estatística de Dados Categóricos – Probabilidades associada às Categorias. Tais probabilidade são chamadas de proporções! Dado que n 1 das n observação são do tipo 1, o IC para a proporção é dado por:

26 Exemplo - Proporções Um experimento foi repetido 4 vezes em dois sistemas. O sistema A foi superior Ao sistema B em 26 repetições. O sistema A é superior com uma confiança de 99%? P = 26/40 = 0.65; s = 0.075 ; z 0.995 = 2.576 O que dá um IC = 0.62  (2.576)(0.075) = (0.46, 0.84) Como o ponto 0.5 pertence ao IC não pode-se afirmar que o Sistema A é superior ao Sistema B com 99% de certeza!

27 Determinação do Tamanho das Amostras Tamanho da amostra para determinação da média: Se queremos um precisão de  r% e um IC de 100(1-  )% Tamanho da amostra para determinação de proporções: Se queremos um precisão de  r% e um IC de 100(1-  )%

28 Determinação do Tamanho das Amostras Tamanho da amostra para IC’s que não se sobrepõem:


Carregar ppt "Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira."

Apresentações semelhantes


Anúncios Google