A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS.

Apresentações semelhantes


Apresentação em tema: "Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS."— Transcrição da apresentação:

1 Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS Novembro 2011

2 Introdução É a técnica mais conhecida da estatística multivariada; Pode ser utilizada para geração de índices e agrupamento de indivíduos; Cada componente principal é uma combinação linear de todas as variáveis originais; São independentes entre si; É importante ter uma visão conjunta de todas ou quase todas as técnicas da estatística multivariada para resolver a maioria dos problema práticos.

3 Construção da matriz de dados (Matriz X) Matriz de dados para p variáveis e n indivíduos; Características observadas são : X 1, X 2, X 3,..., X p ; A matriz é de ordem n x p.

4 Matriz de Covariância, S Obtida a partir da matriz X de dados de ordem n x p; É uma estimativa da matriz de covariância Σ da população π; A matriz S é simétrica e de ordem p x p.

5 Padronização dos dados Média zero e variância 1 Média qualquer e variância 1

6 Variáveis Padronizadas A matriz Z é igual a matriz de correlação R da matriz de dados X;

7 Considerações sobre a padronização Normalmente partimos da matriz padronizada; O resultado a partir da matriz S pode ser diferente do resultado a partir da matriz R. A padronização só dever ser feita quando as unidades das variáveis observadas não são as mesmas.

8 Determinação dos Componentes Principais Os componentes principais são determinados resolvendo-se a equação característica da matriz S ou R, isto é:

9 Autovalores da matriz R λ 1, λ 2, λ 3,..., λp são as raízes da equação característica da matriz R ou S, então: λ 1, λ 2, λ 3,..., λp podem se autovalores da matriz R ou S;

10 Autovetores Para cada autovalor λi existe um autovetor: ip 2i 1i i a a a a ~

11 Componente principal Y i Sendo o autovalor = λ i, então o i-ésimo componente principal é dado por: pip22i11ii XaXaXaY

12 Propriedades dos Componentes Principais A variância do componente principal Y i é igual ao valor do autovalor λ i : O primeiro componente é o que apresenta maior variância e assim por diante: ii YarV ˆ )Y(arV ˆ )Y( V ˆ )Y( V ˆ p21

13 Propriedades dos Componentes Principais Total de variância das variáveis originais = somatório dos autovalores = total de variância dos componentes principais: )Y(arV ˆ )X( V ˆ iii Os componentes principais não são correlacionados entre si: 0Y,YovC ˆ ji

14 Importância de cada componente principal Medida pela porcentagem de variância de cada componente em relação ao total 100 Straço 100 YarV ˆ Y V ˆ C i p 1i i i p 1i i i i

15 Número de componentes Não existe um modelo estatístico; O número de ser aquele que acumula 70% ou mais de proporção da variância total. pkonde%70100 YarV ˆ Y V ˆ Y V ˆ k 1i i k1

16 Interpretação dos componentes Verifica-se o Grau de influência que cada variável Xj tem sobre o componente Yi. j j1 1 j 1 j11YXj1,j XarV a X V ˆ Y V ˆ arYXCorr

17 Interpretação dos componentes Verifica-se o peso ou loading de cada variável sobre o componente p p1 p XarV a w, X V a w, X V a w

18 Escores dos componentes Organização dos dados Trat (Indiv) Variáveis Escores dos componentes principais X1X1 X2X2...XpXp Y1Y1 Y2Y2 YkYk 1X 11 X 12...X 1p Y 11 Y 12...Y 1k 2X 21 X 22...X 2p Y 21 Y 22...Y 2k nX n1 X n2 X np Y n1 Y n2...Y nk

19 Escores do primeiro componente para n tratamentos e p variáveis O escore é o valor da cominação linear; Y n1 =componente 1 do tratamento n para p variáveis.

20 Exemplo de Aplicação Variáveis originais observadas (X1 e X2) e padronizados (Z1 e Z2). Duas variáveis para cinco tratamentos (k=5). Tratamentos Variáveis originaisVariáveis padronizadas X1X1 X2X2 Z1Z1 Z2Z ,38276, ,86086, ,14364, ,23134, ,90465,5788 Variância17,50190,50 11

21 Padronização da Variância Os dados serão padronizados para variância 1:

22 Matriz de Correlação Elementos da diagonal principal igual a 1. Significa a correlação entre mesmas variáveis; Elementos fora da diagonal principal igual a 0,5456. Significa a correlação entre as variáveis (X1,X2).

23 Autovalores da matriz de correlação São os elementos fora da diagonal principal da matriz. Significa a variância de cada componente principal. λ 1 = 1,5456 e λ 2 = 0,4544

24 Traço da matriz de correlação Somatório dos elementos da diagonal da matriz. Significa o total de variância. Traço(R) = 1+1=2

25 Primeiro autovetor da matriz de correlação São os coeficientes das variáveis padronizadas Z1, Z2. Y1 é a combinação linear de Z1, Z2 que denominamos de primeiro componente principal

26 Resultados da análise Variância, ponderação, correlação, % de variância e % de variância acumulada dos componentes principais. CPVariância (λ) PonderaçãoCorrelação entre Zj eYi % de variância % de variância acumulada dos Y i Z1Z1 Z2Z2 Z1Z1 Z2Z2 Y11,54560,707 0,879 77,28 Y20,4544-0,7070,707-0,4760,47622,72100,00

27 Escores dos componentes principais Tratamentos Componentes principais Y1Y1 Y2Y2 122,16-12,32 222,04-13,12 320,25-13,90 419,20-12,24 520,85-12,96

28 Gráfico de dispersão Permite visualizar se os componentes principais (Y is ) são capazes de discriminar indivíduos da população ( ) utilizando características (X i ) Segundo componente (Y2) Primeiro componente (Y1)

29 Aula prática com o programa computacional SAS Material didático: Disciplina: Análise Multivariada Aplicada as Ciências Agrárias.Aula prática: com SAS.


Carregar ppt "Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS."

Apresentações semelhantes


Anúncios Google