Cássio Luís Fernandes de Oliveira Quimiometria Parte 2 Estatística aplicada a métodos analíticos e controle de equipamentos Cássio Luís Fernandes de Oliveira
Introdução Estatística Ciência da obtenção, tratamento e interpretação dos dados Ferramenta necessária para transformação dos dados em informação frente à variação inerente aos dados A ESTATÍSTICA NÃO PODE SUBSTITUIR O CONHECIMENTO TÉCNICO E O BOM SENSO
Coloque isso na cabeça Todas as medidas possuem um erro experimental. Nunca é possível ter certeza absoluta de um resultado. A estatística fornece ferramentas que possibilitam conclusões com uma grande probabilidade de estarem corretas e de rejeitar conclusões que sejam improváveis.
Distribuição Gaussiana Se um experimento é repetido várias vezes e o erro é puramente aleatório, então os resultados tendem a se agrupar em torno de um valor médio. Quanto mais se repete um experimento, mais os resultados se aproximam de uma curva idealmente suave. Distribuição Gaussiana
Distribuição Gaussiana Frequência com que as medidas aparecem no intervalo Intervalo dos valores medidos
Exemplo de um resultado “caseiro”
Conceitos básicos População: qualquer conjunto de n indivíduos ou valores, finitos ou infinitos. Amostra: conjunto de n elementos extraídos de uma população para se fazer inferência sobre a população. Parâmetro: qualquer característica da população. Estatística: qualquer característica da amostra. Representa uma estimativa do parâmetro com um grau de probabilidade ou incerteza associado. Estatística descritiva: conjunto de características ou estatística que permitem descrever numericamente um conjunto de dados através de medidas da tendência central e de dispersão dos dados. Grau de liberdade: número de termos independentes utilizados no cálculo de uma estatística. Inferência ? Exemplo
Valor Médio O valor médio de um conjunto de medidas é obtido pela média aritmética – também é chamado de média ou valor verdadeiro.
Valor Médio - Exemplo Foram feitas 5 medidas que resultaram em: 0,50; 0,51; 0,48; 0,54; 0,40. Qual o valor médio?
Mede como os dados estão agrupados em torno da média. Desvio-padrão, s Mede como os dados estão agrupados em torno da média. Quanto menor for o desvio padrão mais próximos da média estarão agrupados os dados Um experimento que produz um pequeno desvio padrão é mais preciso do que aquele que com grande desvio padrão.
Desvio-padrão - Exemplo Foram feitas 5 medidas que resultaram em: 0,50; 0,51; 0,48; 0,54; 0,40. Qual o desvio padrão? O valor médio já foi calculado anteriormente = 0,486 xi 0,50 0,0140 0,000196 0,51 0,0240 0,000576 0,48 -0,0060 0,000036 0,54 0,0540 0,002916 0,40 -0,0860 0,007396 0,011120
Desvio-padrão – Exemplo (continuação)
Variância A variância é o quadrado do desvio padrão: No exemplo anterior a variância seria de:
Desvio Padrão Relativo O desvio padrão relativo (também chamado de coeficiente de variação) é expresso em porcentagem do valor médio:
Distribuição normal e desvio padrão Quanto menor o desvio padrão maior é o agrupamento das medidas em torno da média = maior precisão. Quanto maior o desvio padrão menor é o agrupamento das medidas em torno da média = menor precisão Exemplo: Supor que foram feitas “n” pesagens, usando-se três balanças diferentes, cujas médias foram de 10 g. Embora a média para as três balanças sejam iguais, a precisão delas podem ser diferentes: supor que em uma balança tenha se obtido desvio padrão de 1, outra de 2 e na outra de 5. Qual as formas da distribuição normal de cada balança???
Distribuição normal e desvio padrão Gauss
Distribuição normal e desvio padrão Conclusão: O DESVIO PADRÃO MEDE A LARGURA DA CURVA GAUSSIANA Em qualquer curva Gaussiana 68,3% da área se situa entre:
Em qualquer curva Gaussiana 95,5% da área se situa entre:
Distribuição t de Student e o Intervalo de confiança A distribuição de Student considera uma situação ideal de uma distribuição normal, onde as medidas experimentais seriam, no máximo, os resultados expressos por ela. É uma ferramenta estatística utilizada com muita frequência para expressar INTERVALOS DE CONFIANÇA e para comparação de resultados de experimentos diferentes.
Distribuição t de Student e o Intervalo de confiança Os valores do teste t de Student dependem do nível de confiança desejado nas medidas (50%, 90%, 95%, 99%, etc.) e do grau de liberdade da medida (número de repetições). Os valores de t de Student aumenta quando se faz pouca repetições e aumenta quando se aumenta o nível de confiança exigido.
Distribuição t de Student e o Intervalo de confiança
Cálculo do Intervalo de confiança A partir de um número limitado de medidas não se pode determinar a média “real”, µ, de uma população. O que se pode determinar é a média e o desvio padrão das amostras. O intervalo de confiança é uma expressão condicionante de que a média “real” provavelmente esteja em uma posição dentro de uma certa distância da média medida, .
Exemplo de aplicação O teor de carboidratos de uma amostra foi determinado como: 12,6, 11,9, 13,0, 12,7 e 12,5 g por 100g de amostra através de análises repetidas. Calcular o intervalo de confiança de 50% e 90% para o teor de carboidratos.
Exemplo de aplicação Passo 1- Calcular a média das amostras. Passo 2 – Calcular o desvio padrão das amostras. Passo 3 – Calcular t de Student para 50% e 90%. O t de Student para 4 (n-1=5-1=4) graus de liberdade para 50% é igual a 0,741 e o de 90% é de 2,132 ?
Passo 4- Aplicar na equação do intervalo de confiança. Exemplo de aplicação Passo 4- Aplicar na equação do intervalo de confiança.
FIM DA PARTE I
Ajudas Inferência: ato de inferir; Inferir - in.fe.rir-(lat inferre) vtd. Deduzir por meio de raciocínio, tirar por conclusão ou conseqüência.
Exemplo Chegou ao laboratório 1 litro de água do Rio Batalha para análise de Cl-. Quem é a população? O que é a amostra? Qual é o parâmetro? População: O Rio Batalha todo ou parte dele. Amostra: 1 litro de água do Rio Batalha (considera-se que este volume é representativo de todo o rio ou parte dele) Parâmetro: a concentração de Cl-.