A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Inferência Estatística e Teste de Hipóteses

Apresentações semelhantes


Apresentação em tema: "Inferência Estatística e Teste de Hipóteses"— Transcrição da apresentação:

1 Inferência Estatística e Teste de Hipóteses
Patometria I Inferência Estatística e Teste de Hipóteses Terceira Aula 2014

2 Inferência = efetuar generalizações a partir de amostras
Analisando uma amostra de indivíduos com insuficiência cardíaca, conclui-se que um indivíduo qualquer dessa população tem 20% de chance de sobreviver mais que 3 meses. Raciocínio Indutivo: Do particular para o geral.

3 Inferência Estatística
processo de decisão que permite estimar características populacionais a partir de indivíduos amostrados da população População Inteira Parâmetros Amostra Estimadores Técnicas de Amostragem (Estimação) Inferência

4 Inferência Estatística
Estimação Testes de Hipóteses

5 Estimadores População: Média -  Variância - 2 Amostra:
Média estimador de  Variância - S2 - estimador de 2

6 Erros Amostrais A estimativa das características de uma população a partir de dados amostrados está sujeita a variação da composição da amostra. Na estimação, devemos levar em conta essas variações e considerar os erros embutidos no processo de amostragem.

7 Erro Padrão da Média Se retirarmos de uma população um número de amostras m aleatórias de mesmo tamanho n não devemos esperar que todas as médias amostrais sejam iguais. População (N) Amostras (n) ...

8 Erro Padrão da Média Exemplo: Considere o conjunto de freqüências cardíacas de uma certa população: Podemos escolher cinco amostras aleatórias dessa população, cada uma com três elementos (n = 3).

9 Média das médias amostrais:
Erro Padrão da Média Num. da Amostra (a) Dados Amostrais            1 68, 69, 71 69,33 2 68, 70, 72 70,00 3 67, 70, 73 4 67, 69, 69 68,33 5 68, 69, 70 69,00 Média das médias amostrais:

10 Erro Padrão da Média O desvio-padrão das médias amostrais:
Média das médias amostrais DP = 0,71 é uma medida da dispersão das cinco médias amostrais. Esse é um método empírico para definição de Erro Padrão da Média (EPM)

11 Existe uma relação inversa entre o tamanho da amostra e o EPM.
Erro Padrão da Média Existe uma relação inversa entre o tamanho da amostra e o EPM. Matematicamente temos: onde n é o tamanho da amostra,  e s o desvio-padrão da população e da amostra, respectivamente.

12 Estatística & Tomada de Decisão
Teste de Hipóteses Situação: Existe uma droga anti-hipertensiva no mercado, droga A. Um laboratório deseja testar uma nova droga anti-hipertensiva, droga B, comparando-a com a já existente. Assim, o laboratório deseja saber se a droga B é melhor que a droga A. Idéia básica: procurar condições que garantam que os resultados de experimentos possam ser generalizados para além da situação experimental.

13 Hipóteses estatísticas para o exemplo anterior:
Hipótese Estatística Consideração feita acerca de um parâmetro (ou característica) na população estudada. Hipóteses estatísticas para o exemplo anterior: A droga A é tão eficiente no tratamento da hipertensão quanto a droga B. A droga A é mais eficiente no tratamento da hipertensão que a droga B. A droga A é menos eficiente no tratamento da hipertensão que a droga B. A droga A não é igual à droga B no tratamento da hipertensão. Precisamos testar as hipóteses.

14 Teste de Hipóteses Raciocínio
Baseia-se em alguma teoria, informação ou conjectura que sustente uma suspeita, que poderá ou não ser refutada. H0: Hipótese nula, aquela a ser refutada – sempre abrange a igualdade; HA: Hipótese alternativa – desenvolvida como o oposto da hipótese nula e representa a conclusão que será apoiada caso a H0 seja rejeitada. A rejeição da H0 deve ser baseada em evidências a partir da amostra.

15 Teste de Hipóteses A formulação das hipóteses depende do ponto de vista adotado e do que se deseja comprovar. Situação: Existe uma droga anti-hipertensiva no mercado, droga A. Um laboratório deseja testar uma nova droga anti-hipertensiva, droga B, comparando-a com a já existente. Assim, o laboratório deseja saber se a droga B é melhor que a droga A. - Eficiência média da droga A - Eficiência média da droga B

16 Conclusões do Teste de Hipóteses
Rejeitar a hipótese nula, H0 (em favor da hipótese alternativa considerada); Não Rejeitar a hipótese nula, H0 (em favor da hipótese alternativa). Uma vez que a conclusão do teste de hipótese se baseia em evidências obtidas de uma amostra, nunca poderemos provar que a H0 é falsa. A decisão sobre o teste envolve riscos e erros.

17 Decisões & Erros Teste de Hipóteses
Decisão Correta Erro tipo I () Rejeitar H0 Erro Tipo II () Aceitar H0 H0 é Falsa H0 é Verdadeira “A VERDADE” Decisão Erro Tipo I ( ): Rejeitar a hipótese nula quando na realidade ela é verdadeira. Erro Tipo II (): Não rejeitar a hipótese nula quando na realidade ela é falsa.

18 Teste de Hipóteses Como Decidir?
A decisão do teste depende da comparação entre a probabilidade de se observar uma diferença ao acaso, dada uma amostra de tamanho n, e o Erro Tipo I, escolhido previamente. A metodologia do teste de hipótese nos fornece mecanismos para avaliar a magnitude das diferenças e quantificar a tomada de decisão. Estatística do teste

19 Regiões de Rejeição e de Não-Rejeição
Teste de Hipóteses Regiões de Rejeição e de Não-Rejeição Valor Crítico Valor de  da Hipótese Região de Não-Rejeição Região de Rejeição /2  - nível de significância do teste estatístico Região de Rejeição – valores da estatística do teste improváveis de ocorrer se H0 for verdadeira, e muito prováveis se H0 for falsa.

20 Teste de Hipóteses Bicaudal e Monocaudal
/2 Bicaudal: H0:  = o HA:   o Monocaudal: H0:   o HA:  > o Monocaudal: H0:   o HA:  < o

21 Teste de Hipóteses - Estatística do teste
A estatística do teste de hipótese depende do tipo de variável, da função de distribuição e das informações disponíveis. Variável Qualitativa Variável Quantitativa Sim Dist. Normal (População) Não “Amostra Grande” Teste z Teste t Testes não- paramétricos  conhecido?

22 Inferência quando  é desconhecido
Na maioria das situações reais,  é desconhecido. Neste caso, podemos substituir  pelo desvio-padrão amostral, S. Estaremos introduzindo mais um erro no processo de inferência, o erro de estimação de . Este novo intervalo será mais largo do que o considerado com a estatística z; Surge uma nova distribuição → t

23 Distribuição t de Student
William Gosset ( ) O parâmetro usado para descrever a distribuição t é o número de graus de liberdade, gl, (d.f. degrees of freedom), que é o tamanho da amostra (n) menos 1.

24 Distribuição t de Student
Graus de liberdade Função Gama

25 Distribuição t de Student
Curva de densidade de Probabilidade Simétrica em relação à média; Depende do grau de liberdade, gl; Quanto mais gl aumenta, mais a distribuição t tende à Normal padrão.

26

27

28

29

30 Graus de Liberdade Quanto menor a amostra, maior o desvio padrão e o erro padrão da média, e também menos graus de liberdade: consequentemente maior interpenetração das curvas de distribuição e mais difícil de mostrar a diferença entre grupos.

31 Teste de Hipótese para uma Amostra
 conhecido  Teste z  desconhecido  Teste t

32 Teste de Hipóteses para Duas Amostras A e B desconhecidos
É possível comparar duas médias amostrais, quando os desvios-padrão das populações são desconhecidos, através da estatística t abaixo: Assim como no caso do teste z, o EPMD pode ser calculado de maneiras diferentes, dependendo se as variâncias nas populações A e B são iguais ou não.

33 Erro Padrão das Diferenças entre Médias
(desconhecidos) Variância conjugada Para decidir se as variâncias são iguais ou diferentes, um outro teste estatístico, que será apresentado adiante, é necessário (Teste F).

34 Erro Padrão das Diferenças entre Médias
A variância conjugada representa a média ponderada das variâncias amostrais dos dois grupos, dada por: Se nA = nB: Note que, se os tamanhos dos grupos são iguais, a expressão para calcular o EPMD para variâncias iguais é idêntica à usada, quando as variâncias são diferentes!

35 Teste t-Student para Duas Amostras
Situação 1: Em um ensaio clínico, comparou-se dois anorexígenos e as perdas de peso foram registradas. Deseja-se testar se a diferença observada nas duas amostras é estatisticamente significante, assumindo-se  de 1%. Não há informações sobre a população  Teste t-Student.

36

37

38 Teste t-Student para Duas Amostras
As variâncias são estatisticamente similares? H0: Sa2 = Sb2

39 Teste t-Student para Duas Amostras
As variâncias são iguais! onde

40 Teste t-Student para Duas Amostras
Procurar o valor de t crítico, tc, para gl igual a 11 e  de 0,005 (bicaudal).  Tabela t Regra de Decisão Se –tc < t < tc  Aceita-se H0 Caso contrário, Rejeita-se H0.

41

42

43 Teste t-Student para Duas Amostras
Situação 2: Um estudo compara as alturas de crianças de 4 anos de duas populações diferentes. Deseja-se testar se as alturas médias observadas nas duas amostras são estatisticamente diferentes, assumindo-se  de 5%. Os resultados obtidos estão resumidos na tabela abaixo: Como nA = nB a expressão para o cálculo de EPMD independe da relação entre as variâncias populacionais.

44 Teste de Hipótese Estatística F

45 Comparando Variâncias Teste F
Sir Ronald A. Fisher ( ) Mesma idéia dos testes para médias, teste z e t, porém usa-se a razão das variâncias, e não a sua diferença, como no caso dos testes para médias. Estatística F:

46 Comparando Variâncias Teste F
Se supomos que os dados têm Distribuição Normal, então é possível comparar as variâncias de duas populações através da estatística F dada abaixo, cujos valores descritivos dependem de dois graus de liberdade: onde: = variância da amostra A = variância da amostra B gl1 = nA – 1 (numerador) gl2 = nB – 1 (denominador)

47 Teste de Hipótese para Variâncias
Pode-se recorrer a um teste bicaudal ou monocaudal. Em geral, estamos interessados em testar a diferença. e Se F > FSc ou F < FIc , para gl1 e gl2, então rejeita-se H0. Caso contrário, aceita-se H0. A distribuição F não é simétrica e, portanto, não possui a área da cauda superior, FS, igual a área da cauda inferior, FI. Neste caso, a regra de decisão é: Na prática colocamos no numerador a variância de maior valor e concentramos a decisão na cauda superior.

48 Teste de Hipótese para Variâncias
Situação 3: Deseja-se comparar a variância da creatinina de dois grupos de pacientes. Particularmente, testar se eles são estatisticamente diferentes, assumindo-se  de 5%. As variâncias observadas são apresentadas na tabela abaixo: Tabela F  FSc(6,7) = 4,95. Como F < FSc, não rejeitamos H0. As variâncias são consideradas iguais.

49 Teste de Hipótese Para Dados Pareados

50 Teste t para Dados Pareados
Dados pareados são aqueles registrados em pares (o indivíduo é controle de si mesmo). A mesma variável é medida em dois tempos distintos (“antes-e-depois”) ou em topografias diferentes no mesmo indivíduo. Exemplo 1: Um estudo compara o efeito de uma pomada oftálmica com o de simplesmente higienizar o olho. Um grupo de pacientes usa, durante um período, a pomada no olho direito, enquanto o olho esquerdo recebe apenas o anti-séptico. Exemplo 2: Deseja-se verificar o desempenho de um tratamento. Um grupo de pacientes é examinado antes do início do tratamento. Após a conclusão do mesmo, são novamente examinados.

51 Estatística do Teste t Pareado
Como as observações estão relacionadas, construímos o teste sobre as diferenças observadas em cada par. Seja Di a diferença (no mesmo indivíduo) entre as observações registradas, para n pares. A média das diferenças de todos os indivíduos chamamos , e o desvio-padrão das diferenças de SD . onde D é a média populacional, sobre a qual desejamos inferir.

52 Teste t Pareado Situação 5: Um hipnótico foi aplicado em um grupo de pacientes que tinham se submetido anteriormente a um tratamento padrão. Foi observado o número de horas de sono de cada paciente nos dois momentos. Deseja-se testar se a diferença média observada é não nula, considerando-se um nível de significância de 5%. e

53

54


Carregar ppt "Inferência Estatística e Teste de Hipóteses"

Apresentações semelhantes


Anúncios Google