Distribuição Normal Propriedades: 1 - Uma distribuição normal é unimodal (uma moda), simétrica (lado direito e esquerdo são idênticos) e tem a forma de um sino, com a altura máxima coincidindo com a média; 2 - Uma distribuição normal é contínua, onde “X” é assumido ser uma variável contínua; 3 - Uma distribuição normal é assimptótica ao eixo “X”: quanto mais a curva se afasta da média, mais próximo ela chega do valor zero; mas nunca chega ao valor zero absoluto. 4 - A área sob a curva totaliza 1, portanto, …
Distribuição Normal Área = 1 … portanto, é possível estimar a propabilidade de ocorrência de eventos … com base na área sob a curva
Distribuição Normal Padrão Onde: = 0 = 1 Distribuição Normal Padrão +/- 1 desvio padrão = 68,2% +/- 2 desvios padrão = 95,5% +/- 3 desvios padrão = 99,7%
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,500 0,504 0,508 0,512 0,516 0,520 0,524 0,528 0,532 0,536 0,10 0,540 0,544 0,548 0,552 0,556 0,560 0,564 0,567 0,571 0,575 0,20 0,579 0,583 0,587 0,591 0,595 0,599 0,603 0,606 0,610 0,614 0,30 0,618 0,622 0,626 0,629 0,633 0,637 0,641 0,644 0,648 0,652 0,40 0,655 0,659 0,663 0,666 0,670 0,674 0,677 0,681 0,684 0,688 0,50 0,691 0,695 0,698 0,702 0,705 0,709 0,712 0,716 0,719 0,722 0,60 0,726 0,729 0,732 0,736 0,739 0,742 0,745 0,749 0,752 0,755 0,70 0,758 0,761 0,764 0,767 0,770 0,773 0,776 0,779 0,782 0,785 0,80 0,788 0,791 0,794 0,797 0,800 0,802 0,805 0,808 0,811 0,813 0,90 0,816 0,819 0,821 0,824 0,826 0,829 0,831 0,834 0,836 0,839 1,00 0,841 0,844 0,846 0,848 0,851 0,853 0,855 0,858 0,860 0,862 1,10 0,864 0,867 0,869 0,871 0,873 0,875 0,877 0,879 0,881 0,883 1,20 0,885 0,887 0,889 0,891 0,893 0,894 0,896 0,898 0,900 0,901 1,30 0,903 0,905 0,907 0,908 0,910 0,911 0,913 0,915 0,916 0,918 1,40 0,919 0,921 0,922 0,924 0,925 0,926 0,928 0,929 0,931 0,932 1,50 0,933 0,934 0,936 0,937 0,938 0,939 0,941 0,942 0,943 0,944 1,60 0,945 0,946 0,947 0,948 0,949 0,951 0,952 0,953 0,954 1,70 0,955 0,956 0,957 0,958 0,959 0,960 0,961 0,962 0,963 1,80 0,964 0,965 0,966 0,967 0,968 0,969 0,970 0,971 1,90 0,972 0,973 0,974 0,975 0,976 0,977 2,00 0,978 0,979 0,980 0,981 0,982 2,10 0,983 0,984 0,985 0,986 2,20 0,987 0,988 0,989 2,30 0,990 0,991 0,992 2,40 0,993 0,994 2,50 0,995 2,60 0,996 2,70 0,997 2,80 0,998 2,90 0,999 3,00 3,10
Cálculo da Área Distribuição Normal Padrão Para calcular a área: - adiciona as área se os valores “z”estão em lados opostos da média; - subtrai se os valores estão do mesmo lado da média. Distribuição Normal: a mais usada em estatística indutiva ...
Probabilidade e Distribuição Estatística Distribuição estatística: distribuição que representa todos os resultados possíveis de um particular evento. Ex: soma de dois dados Qual a probabilidade de 10, 11 e 12? Soma Freq/Total Probabilidade 10 3/36 .083 11 2/36 .056 12 1/36 .028 P(10 ou 11 ou 12) = P(10) + P(11) + P(12) = .083 + .056 + .028 = .167
Qual é a probabilidade de ocorrência de um valor maior que 80 Distribuição Normal e Distribuição Estatística Distribuição Normal: N =15.000 = 60 = 10 Qual é a probabilidade de ocorrência de um valor entre 50 e 60? 1 desvio padrão => 0,3413 ou 34,13% Qual é a probabilidade de ocorrência de um valor maior que 80 ou menor que 40? 2 desvios padrão = 0,0228 ou 2,28%, então >80 ou < 40 = 0,0228 + 0,0228 = 0,0456 ou 4,56 % z80 = +2 z40 = - 2
Onde: = 0 = 1 Distribuição Normal Padrão Valores de “z” Variáveis observadas na prática apresentam valores cujas áreas não estão tabeladas … entretanto é possível transformar valores observados (x) em valores de z
Distribuição Normal padronizada e, portanto, com área conhecida ... onde: x = valores da variável observada = média = desvio padrão Distribuição Normal Padrão Valores de “z” Distribuição Normal padronizada e, portanto, com área conhecida ...
Estatística Aplicada à Motricidade Teste de Hipóteses J. A. Barela & E. Kokubun Encontro #2
nós precisamos de estatística INFERENCIAL (indutiva) Aula anterior … foi discutido estatística descritiva entretanto ... nós precisamos de estatística INFERENCIAL (indutiva) permite tirar conclusões probabilisticas sobre uma população com base em resultados verificados em amostras retiradas desta população Estatística Inferencial:
Estatística Inferencial tem dois objetivos: testar hipóteses estimar parâmetros População com Parâmetros Amostra com Estatística* Distribuição Estatística* Probabilidade Seleção Aleatória Inferência * estatísitica => formulações teóricas
Para utilizar estatística inferencial: 1 - A amostra precisa ser selecionada aleatoriamente; 2 - Qualquer estimativa da amostra deve ser comparada com estimativas baseadas em pressupostos de uma distribuição (geralmente normal); 3 - Baseada nesta comparação e a probabilidade associada com resultados esperados quando a amostra é obtida aleatoriamente, inferências podem ser realizadas sobre parâmetros (população).
valor do parâmetro hipotético Realizar inferências sobre a natureza da população com base em observações de amostras retiradas desta população (estatística inferencial). Teste de Hipóteses Não rejeita a hipótese Qual é a magnitude da diferença entre o valor observado e o parâmetro hipotético? População: valor do parâmetro hipotético Amostra: valor observado (estatístico) Rejeita a hipótese aleatoriamente Selecionada =455 X=535 DIFERENÇA PEQUENA DIFERENÇA GRANDE
Envolve quatro passos: Teste de Hipótese Envolve quatro passos: 1 - Formular a hipótese; 2 - Decidir o critério para rejeitar esta hipótese; 3 - Computar o teste estatístico 4 - Decidir se rejeita ou aceita a hipótese
1 - Formulação de hipótese Teste de Hipótese 1 - Formulação de hipótese Hipótese: conjectura sobre um ou mais parâmetros da população a ser testada Hipótese nula H0 Hipótese de nenhum relacionamento ou diferença Ex: H0: = 455 ou H0: - 455 = 0 Hipótese que cobre o possível resultado não coberto pela hipótese nula Hipótese alternativa Ha Ex: Ha: 455 ou Ha: - 455 0 A hipótese alternativa geralmente considera a hipótese da pesquisa e pode ser aceita somente se a a hipótese nula for rejeitada
2 - Critério para Rejeição da Hipótese Teste de Hipótese 2 - Critério para Rejeição da Hipótese O quão diferente as médias precisam ser para que a hipótese nula seja rejeitada? Resposta relacionada a três conceitos 1 - erros no teste de hipóteses 2 - nível de significância 3 - região de rejeição
Erros no Teste de Hipóteses 2 - Critério para Rejeição da Hipótese Erros no Teste de Hipóteses Quatro possíveis decisões testando hipóteses: 1 - Uma hipótese verdadeira é rejeitada 2 - Uma hipótese verdadeira não é rejeitada 3 - Uma hipótese falsa não é rejeitada 4 - Uma hipótese falsa é rejeitada Erro Tipo I Decisão correta Erro Tipo II Decisão correta
Erros no Teste de Hipóteses 2 - Critério para Rejeição da Hipótese Erros no Teste de Hipóteses Hipótese Nula é Verdadeira Hipótese Nula é Falsa Decisão Correta Probabilidade: 1 - (poder estatístico) Rejeita Hipótese Nula ERRO TIPO I Probabilidade: Decisão Correta Probabilidade: 1 - ERRO TIPO II Probabilidade: Não Rejeita Hipótese Nula Problema: Não é possível eliminar a possibilidade de realizar um erro no teste de hipótese MAS é possível controlar um erro ou outro!!!
Erros no Teste de Hipóteses 2 - Critério para Rejeição da Hipótese Erros no Teste de Hipóteses As condições específicas da situação experimental determinam que tipo de erro é mais sério Exemplo: Erro Tipo I: nova droga não é melhor mas H0 é rejeitada => nova droga será usada Testando duas drogas: D1 - nova droga caríssima D2 - droga utilizada H0: D1 = D2 Erro Tipo II: nova droga é melhor mas H0 é aceita => nova droga não será usada
Nível de Significância Teste de Hipótese 2 - Critério para Rejeição da Hipótese Nível de Significância ou alpha () é definido como a probabilidade de realizar um erro do Tipo I no teste de hipóteses (uma hipótese verdadeira é rejeitada) = 0,05 e 0,01 são os mais utilizados em nossa área o pesquisador assume o risco que a decisão de rejeitar a hipótese pode estar incorreta 5% ou 1% das vezes, respectivamente.
Região de Rejeição Influência do alpha Teste de Hipótese 2 - Critério para Rejeição da Hipótese Região de Rejeição Representa a proporção da área na distribuição amostral que é igual à probabilidade de rejeição da hipótese nula, se ela é verdadeira Influência do alpha = 0,05 = 0,01 A região de rejeição é ___________ com =0,05 do que com =0,01, portanto, será
Influência da Hipótese Teste de Hipótese Região de Rejeição Bidirecional H0: = 455 Ha: 455 Valores críticos = 1.96 =0,05 H0: = 455 Ha: < 455 Unidirecional Ha: > 455 Valor crítico = + 1.645 Valor crítico = - 1.645
Teste de Hipótese Valores Críticos do Teste Estatístico (mais comuns) usando uma distribuição normal Nível de Significância Nível de Significância Valores Críticos Teste de 2-caudas Teste de 1-cauda do Teste Estatístico .20 .10 1.282 .10 .05 1.645 .05 .025 1.960 .02 .01 2.326 .01 .005 2.576 .001 .0005 3.291
Teste de Hipótese 2 - Critério para Rejeição da Hipótese Região de Rejeição Representa a proporção da área na distribuição amostral que é igual à probabilidade de rejeição da hipótese nula se ela é verdadeira Exemplo: Amostra com distribuição normal = 455 x = 8,33 = 0,05 - x = (455 - 8,33) = 446,67 - 2x = (455 - 2 * 8,33) = 438,33 + x = (455 + 8,33) = 463,33 + 2x = (455 + 2 * 8,33) = 471,67 Problema: Qual é a área entre 2x? A resposta é 0,9544, acima de 95%.
Região de Rejeição - 1,96x = 455 - (1,96 * 8,33) = 438,67 Critério para Rejeição da Hipótese Teste de Hipótese Região de Rejeição Exemplo: Amostra com distribuição normal = 455 x = 8,33 = 0,05 - 1,96x = 455 - (1,96 * 8,33) = 438,67 + 1,96x = 455+ (1,96 * 8,33) = 471,33 Onde: 1,96 corresponde a 0,025 da área - Valor Tabela de Dist. Normal Região de rejeição: área da distribuição que representa os valores da amostra que são improváveis se a hipótese nula é verdadeira Região de aceite: área dos valores prováveis se a hipótese nula é verdadeira
2 - Critério para Rejeição da Hipótese Teste de Hipótese 2 - Critério para Rejeição da Hipótese Que tipo de erro? Erro Tipo I Erro tipo II Poder estatístico … mais tarde Nível de Significância? = 0,05 = 0,01 Região de Rejeição Bidirecional Unidirecional
3 - Computando o Teste Estatístico Teste de Hipótese 3 - Computando o Teste Estatístico Exemplo: = 455 n = 144 X = 535 = 100 Erro Padrão da Média 1 - Calcular o escore padrão (z calculado) A média da amostra observada (X=535) está 9,6 erros padrão acima da média da população (455).
Teste de Hipótese 4 - Decidindo sobre a H0 Exemplo: = 455 n = 144 X = 535 = 100 A média da amostra observada (X=535) está 9,6 erros padrão acima da média da população (455). Uma vez que o valor observado (+9,6) excede o valor crítico (1,96), a probabilidade é menor que 0,05 que a média da amostra teria ocorrido por change se a hipótese nula fosse verdadeira (p<0,05). A hipótese nula é rejeitada e. consequentemente, a hipótese alternativa é aceita
A hipótese nula é aceita Teste de Hipótese 4 - Computando o Teste Estatístico Outro Exemplo: = 455 n = 144 X = 465 = 100 1,2 Uma vez que o valor observado (+1,2) está abaixo do valor crítico (1,96), a probabilidade é maior que 0,05 que a média da amostra teria ocorrido por chance se a hipótese nula fosse verdadeira (p>0,05). A hipótese nula é aceita
Distribuição “t” Student Teste de Hipótese Distribuição “t” Student Para amostra pequena: distribuição difere da distribuição normal distribuição muda com o tamanho da amostra aproxima da normal conforme o tamanho da amostra aumenta Gosset (1906) e Gosset & Fischer (1926): fórmula para estas distribuições As distribuições “t” são famílias de distribuições simétricas e com formas de sino que mudam conforme o tamanho da amostra muda
Distribuição “t” Student Teste de Hipótese Distribuição “t” Student Graus de Liberdade: é o número de observações menos o número de restrições colocados sobre eles Ex: a média de 2 números = 50, então apenas um número precisa ser conhecido para que o outro possa ser determinado n-1= 2 -1 = 1 gl
Distribuição “t” Student Teste de Hipótese É realizado da mesma forma que usando uma distribuição normal. Apenas a área sob a curva é ajustada de acordo com os Graus de Liberdade (Tabela A2) Gl = 15 Gl acima de 120, distribuição normal e “t” são consideradas iguais
Se uma hipótese nula é falsa “Power” Poder estatístico Se uma hipótese nula é falsa ERRO TIPO II (não rejeitar uma hipótese falsa) probabilidade Decisão Correta probabilidade 1 - (rejeitar uma hipótese falsa) Poder estatístico: probabilidade de rejeitar a hipótese nula quando ela é falsa (1-) PROBLEMA: e, consequentemente, 1- podem ser determinados apenas quando valores forem especificados para ambas hipóteses: nula e alternativa
Poder estatístico do teste em determinar essa diferença de 10 pontos Exemplo: = 455 n = 144 = 100 =0,05 unidirecional Poder estatístico Necessidade de especificar valores para H0 e Ha: H0: = 455 Ha: = 465 Poder estatístico do teste em determinar essa diferença de 10 pontos Valor padrão para o valor crítico da amostra: + 1,645x = 455+ (1,645 * 8,33) = 468,70 =455 468,70
468,70 =455 z=0,44 =465 Poder estatístico Área cinza () = 0,67 (cont. exemplo anterior) =455 468,70 Área cinza () = 0,67 Área clara (1-)= 0,33 z=0,44 =465 Poder estatístico: 0,33 (33%) probabilidade de detectar uma diferença de 10 pontos
“Power” Poder estatístico Fatores que afetam: Natureza da direção da Ha: (uni- ou bi-direcional) Nível de significância () Tamanho da amostra (n) Tamanho do efeito (effect size)
Natureza da direção da Ha Poder estatístico Natureza da direção da Ha (mesmo exemplo anterior mas bi-direcional) área (esquerda)=0,4992 área (direita)=0,2764 Com todos os fatores constantes, testes unidirecionais têm poder estatístico maior que bi-direcionais = 0,4992 + 0,2764 = 0,7756 1- = 1 - 0,7756 = 0,2244 (22%)
Nível de significância () Poder estatístico Nível de significância () (mesmo exemplo anterior unidirecional mas com =0,1) área (esquerda)=0,5 área (direita)=0,0319 = 0,5 + 0,0319 = 0,5319 1- = 1 - 0,5319 = 0,4681 (46%) Com todos os fatores constantes, aumentando o valor de , aumenta o poder estatístico
Poder estatístico Tamanho da amostra (n) Erro Padrão da Média n=576 Exemplo anterior: = 455 n = 144 X = 465 = 100 Exemplo novo: = 455 n = 576 X = 465 = 100
(exemplo anterior unidirecional, =0,05, mas n=576) Poder estatístico Tamanho da amostra (n) (exemplo anterior unidirecional, =0,05, mas n=576) área (esquerda)=0,2734 = 0,5 - 0,2734 = 0,2266 1- = 1 - 0,2266 = 0,7734 (77%) Com todos os fatores constantes, aumentando o tamanho da amostra (n) o erro padrão diminui, aumenta o poder estatístico
(exemplo anterior unidirecional, =0,05, n=100, mas X=475) Poder estatístico Tamanho do efeito (exemplo anterior unidirecional, =0,05, n=100, mas X=475) área (esquerda)=0,2764 = 0,5 - 0,2764 = 0,2236 1- = 1 - 0,2236 = 0,7764 (77%) Com todos os fatores constantes, aumentando o tamanho do efeito, aumenta o poder estatístico