Professor Antonio Carlos Coelho CONTABILOMETRIA EAC-303 Professor Antonio Carlos Coelho
Revisão Estatística Descritiva MÉDIA AMOSTRAL Com freqüência de observações
Revisão Estatística Inferencial Média Populacional
Revisão Estatística Descritiva Variância Amostral
Revisão Estatística Inferencial Variância Populacional
Revisão Estatística Desvio Padrão
Revisão Estatística Coeficiente de Variação Erro Padrão
Revisão Estatística Escore Padronizado
Exercício para a Revisão eventos X Y Z 1 2 3 (2) 5 7 4 (3) 6 Exercício para a Revisão
Distribuição de Probabilidade Testes de Hipótese
Distribuição de Probabilidade Discreta Contínua Y = f(X) = freqüência relativa; densidade de probabilidade X = Variável sob estudo, com média e demais parâmetros populacionais Padronizada → Ver escore padronizado
Distribuição Normal Função Densidade
Freqüência/Densidade
Função Densidade
Probabilidade Acumulada
Distribuição Amostral Padronização para inferência
Hipóteses Básicas
Intervalo de Confiança Conceitos Básicos Intervalo de Confiança representa um intervalo estimado, construído com base na média da amostra, pelo qual pode ser especificada a probabilidade de o intervalo incluir a média da população.
IC = x z X ou IC = x z sX Conceitos Básicos O grau de confiança associado a um intervalo de confiança indica a percentagem de tais intervalos que incluiriam o parâmetro que está sendo estimado. IC = x z X ou IC = x z sX Os Intervalos de Confiança mais utilizados são de 90%, 95% e 99%.
Nível de Significância Conceitos Básicos Nível de Significância Interpretação de Inferências Estatísticas = Nível de Significância Erro tipo I () – probabilidade de rejeitar a hipótese nula quando é verdadeira – falso positivo.
Conceitos Básicos Poder Estatístico Erro tipo II () – probabilidade de falha na rejeição da hipótese nula quando a mesma é falsa. Poder Estatístico – probabilidade da correta rejeição da hipótese nula quando a mesma pode ser rejeitada (1 - ).
é o valor que separa a região de rejeição da região de aceitação. Conceitos Básicos VALOR CRÍTICO: é o valor que separa a região de rejeição da região de aceitação. Para um teste de qualidade do ajuste, este valor determina se deve aceitar ou rejeitar a distribuição proporcionada. O teste de hipótese permite avaliar os resultados da Pesquisa. Também permite controlar ou medir a incerteza envolvida na decisão.
Teste de Hipótese - Resumo Decisão Estatística Realidade Não há diferenças Há diferenças Aceita H0 1 - α Intervalo Confiança Erro tipo II Rejeita H0 Erro Tipo I 1 - Poder Estatístico
Erro tipo I e tipo II São negativamente relacionados. Quanto maior o erro tipo I (), menor o erro tipo II (). Quanto mais o erro tipo I se torna mais restritivo (próximo a 0), mais o erro tipo II aumenta. Reduzindo o erro tipo I faz com que o poder do teste estatístico diminua.
Poder Estatístico Não depende apenas de , mas de 3 fatores: I – Estimação do grau em que o fenômeno estudado existe na população (por exemplo: correlação). Quanto maior o grau, maior o poder estatístico.
Poder Estatístico II: propriamente dito. Quanto maior o , menor o poder estatístico. Com = 0,05, o poder estatístico é maior do que = 0,01, por exemplo. = 0 – censo. Em tese o erro é nulo. = 0,05 – para 95% dos testes, o resultado é correto. = 0,01 – para 99% dos testes, o resultado é correto.
Poder Estatístico III: tamanho da amostra. Quanto maior a amostra, maior a tendência de haver mais poder estatístico. Entretanto, amostras grandes demais fazem com que efeitos pequenos sejam estatisticamente relevantes até que para amostras enormes fazem com que tudo fique relevante.
CORRELAÇÃO E COVARIÂNCIA
Comparativo da valorização do índice Bovespa e Ações da Petrobras GRÁFICOS DE DISPERSÃO Comparativo da valorização do índice Bovespa e Ações da Petrobras
GRÁFICOS DE DISPERSÃO Comparativo do crescimento da candidatura Lula e a saída de capitais via conta CC-5 (em US$ MM)
Comparativo da cotação do US$ e importações (em US$ MM) GRÁFICOS DE DISPERSÃO Comparativo da cotação do US$ e importações (em US$ MM)
Covariância e Correlação A covariância mede a força do relacionamento entre duas variáveis em termos absolutos A correlação linear procura medir o grau de relacionamento linear entre variáveis aleatórias X e Y .
Correlação
Correlação O instrumento de medida da correlação linear é dado pelo coeficiente r de correlação de Pearson. -1 < r < +1
å å å å å Ux Uy UxUy Ux Uy Cálculo de r =(X-Xmédio) = (X-Xmédio)2 = (Y-Ymédio) = (Y-Ymédio)2 Para cálculo de covariância e variância. å UxUy = (X-Xmédio).(Y-Ymédio)
Cálculo de r r = SXY / (S2XX S2YY ) 1/2 Variância de X = S2XX = (Ux)2 = X2 _ (X)2 n-1 n Variância de Y = S2YY = (Uy)2 = Y2 _ (Y)2 n-1 n Covariância de X,Y= SXY = (Ux.Uy) = X.Y _ (X).(Y) n n Há outras formas de calcular. Stevenson apresenta como o produto do somatório dos escores padronizados das duas variáveis. Ora, aqui se divide a covariância pelos desvios padrão. O escore padronizado é o resíduo de cada observação dividido pelo desvio padrão. r = SXY / (S2XX S2YY ) 1/2
Coeficiente de Correlação Linear
Esta técnica só é válida se aceitarmos as seguintes hipóteses: r de Pearson Esta técnica só é válida se aceitarmos as seguintes hipóteses: Tanto x quanto y são variáveis aleatórias contínuas (não se permite selecionar certos valores de x e depois avaliar y, pois ambos devem variar livremente); A distribuição de freqüência conjunta é normal (distribuição normal bivariada).
Propriedades de r O coeficiente de correlação de uma variável com ela mesma é igual a um. Se as variáveis X e Y forem estatisticamente independentes, então o coeficiente de correlação destas variáveis será igual a zero.
Propriedades de r Se o resultado do coeficiente de correlação das variáveis X e Y for igual a zero, não se pode afirmar que as duas variáveis sejam estatisticamente independentes.
Linearidade e Causalidade