A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

XVIII CONGRESSO ANUAL DA SPE – SPE2010

Apresentações semelhantes


Apresentação em tema: "XVIII CONGRESSO ANUAL DA SPE – SPE2010"— Transcrição da apresentação:

1 XVIII CONGRESSO ANUAL DA SPE – SPE2010
ESTUDO COMPARATIVO ENTRE TRÊS MÉTODOS DE IMPUTAÇÃO PAULO TADEU MEIRA E SILVA DE OLIVEIRA CASIMIRO JAIME ALFREDO SEPÚLVEDA MUNITA

2 INTRODUÇÃO peças arqueológicas de cerâmica ou argilas foram
coletadas por arqueólogos de diversos sítios arqueológicos espalhados pelo país. enviadas ao IPEN para serem irradiadas no reactor de pesquisa por AAIN obtendo para cada peça medida de concentração de diferentes elementos químicos radioativos (neste trabalho de 14 elementos), e por fim; Com esses dados é feita a análise estatística com objetivos como: caracterizar se essas peças se são de um mesmo local ou de locais diferentes.

3 IMPUTAÇÃO Valores faltantes: consiste em valores que não foram medidos devido a problemas ou falhas de leitura pela aparelhagem do laboratório e que necessitam de serem substituidos por um valor consistente, com a finalidade de completar a matriz das amostras, para ser utilizada na interpretação dos dados. Neste trabalho foram estudados 3 procedimentos de imputação: Por distribuição normal univariada Por distribuição normal multivariada Por decomposição do valor singular (DVS)

4 Imputação pelo valor normal univariado.
Consiste em substituir os valores das concentrações faltantes de cada variável pelo valor estimado a partir de uma variável normal univariada, das concentrações das outras amostras da mesma variável.

5 Passo 1: Aplicar para todos os dados a transformação log base 10;
Passo 2: Calcular para cada variável a média e o desvio padrão; Passo 3: Simular no aplicativo R 1000 simulações de de dados de distribuição normal univariada com média e desvio padrão de cada variável obtidos no passo 2; Passo 4: Ordenar na ordem crescente cada uma das variáveis; Passo 5: Considerar como valor de cada variável, o valor obtido na posição 3,5% para cada uma das 1000 simulações, e por fim; Passo 6: Calcule a média para cada uma das variáveis entre as 1000 simulações, e por fim, calcule o antilog e obtemos os valores a serem considerados para imputação dos dados perdidos.

6 b) Imputação por valor normal multivariado.
Neste procedimento estima-se a media e matriz de dispersão como um valor das medias amostrais de uma matriz de covariância usando todos os dados. Utilizam-se estas estimativas para verificar que os valores de concentração transformados por log base 10 são normais multivariados pára um vetor de média e matriz de variância-covariância e obtém milhões de vetores, ordena cada coluna em ordem crescente e considera o vetor que esteja no percentil 2,5 acima.

7 c) Imputação pelo método de decomposição do valor singular (DVS)
Consiste na substituição do valor faltante pelo valor estimado a partir do método de decomposição do valor singular, que considera a decomposição da matriz dos valores das variáveis dos scores das componentes principais

8 Aplicação foram utilizados dados de concentrações elementares de Ce, Cr, Cs, Eu, Fe, Hf, La, Lu, Na, Sc, Tb, Th, U e Yb determinadas por análise por ativação com neutrons instrumental em 28 peças de fragmentos cerâmicos de um sítio arqueológico

9 Considerando todas as peças conjuntamente
Resultados Considerando todas as peças conjuntamente Elementos original norm. Univar. norm. Mult. DSV Na(%) 0.05 0.03 0.10 Lu 0.30 0.27 0.29 U 2.69 2.66 3.69 3.78 Yb 1.82 1.84 1.91 2.02 La 22.91 23.51 24.40 24.44 Th 10.47 10.06 11.17 12.73 Cr 47.86 48.80 51.79 53.07 Cs 2.88 3.96 3.16 7.25 Sc 11.22 11.81 10.12 11.98 Fe(%) 2.51 2.45 3.30 3.15 Eu 0.60 0.62 0.82 0.85 Ce 44.67 44.37 50.98 55.98 Hf 4.68 5.06 6.59 6.56 Tb 0.37 0.39 0.43 0.40

10 Gráfico de dendrograma aplicando método de
WARDS e distancia euclidiana ao quadrado. grupo 2 grupo1 grupo 3

11 Apenas grupo 1 Elementos original norm. Univar. norm. Mult. DSV Na(%)
0.05 0.04 Lu 0.30 0.28 0.34 U 2.88 2.84 2.98 3.79 Yb 1.82 1.76 1.94 2.04 La 22.91 21.35 24.46 20.61 Th 10.47 10.36 11.30 12.81 Cr 47.86 48.04 52.23 60.36 Cs 5.25 5.47 6.41 6.23 Sc 11.22 11.06 11.96 13.32 Fe(%) 2.51 2.50 2.71 3.11 Eu 0.60 0.59 0.66 0.72 Ce 44.67 40.84 47.13 55.98 Hf 4.68 4.72 5.63 6.72 Tb 0.37 0.31 0.41 0.43

12 Apenas grupo 2 Elementos original norm. Univar. norm. Mult. DSV Na(%)
0.07 0.10 Lu 0.34 0.33 0.49 U 3.47 3.15 2.80 3.80 Yb 2.40 2.33 2.32 3.83 La 32.36 27.82 30.37 40.68 Th 12.02 10.00 12.47 12.66 Cr 56.23 49.16 56.15 64.83 Cs 4.68 2.67 9.80 Sc 14.45 13.29 13.46 14.13 Fe(%) 2.63 2.59 3.11 3.05 Eu 1.15 0.97 0.88 1.20 Ce 72.44 58.50 54.93 81.48 Hf 6.03 5.27 6.55 9.08 Tb 0.60 0.51 0.52 0.93

13 Conclusão O método que apresentou melhor desempenho foi o de imputação por normal univariada seja considerando todas as amostras e considerando apeans os grupos 1 e 2 alocados a partir da análise de conglomerados.

14 Bibliografia BARROSO, L.P. (1995). Imputação de dados em painéis para populações finitas. Tese de doutorado, IME-USP. BAXTER, M.J. (1994) Exploratory multivariate analysis in archaeology. Edimburgh. University Press Ltd Edimburgh, Great Britain BÉRGAMO, G. C. (2007). Imputação múltipla livre de distribuição utilizando a decomposição por valor singular em matriz de interação. Tese de doutorado, ESALQ-USP HAIR, J. F.; BLACK, W. C.; BARBIN, B. J.; ANDERSON, R. (2008). Análise Multivariada de Dados. Editora Bookman, sexta edição, Porto |Alegre-RS.


Carregar ppt "XVIII CONGRESSO ANUAL DA SPE – SPE2010"

Apresentações semelhantes


Anúncios Google