Análise Estatística Multivariada

Slides:



Advertisements
Apresentações semelhantes
Prof. José Junior Barreto TEORIA DOS DETERMINANTES
Advertisements

A = ( 3 ) , logo | A | = 3 Determinantes
Prof. Darlan Marcelo Delgado
DETERMINANTES de Ordem n (n > 3).
Amintas engenharia.
Matrizes especiais Matriz linha Matriz do tipo 1 x n, ou seja, com uma única linha. Por exemplo, a matriz A =[ ], do tipo 1 x 4. Matriz coluna.
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
Métodos Analíticos – Particularização para a equação de Laplace
Determinantes Determinante é um número real associado a uma matriz quadrada. Notação: det A ou |A|. Determinante de uma Matriz Quadrada de 1ª Ordem. Seja.
Análise de regressão linear simples: abordagem matricial
1.1. VARIÁVEIS DE ESTADO SISTEMAS III
Universidade Federal de Ouro Preto (UFOP)
Reconhecimento de Padrões PCA David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência.
Reconhecimento de Padrões Principal Component Analysis (PCA) Análise dos Componentes Principais David Menotti, Ph.D. Universidade.
Linguagem Orientada a Matrizes COB 727
CoKrigagem Procedimento geoestatístico segundo o qual diversas variáveis regionalizadas podem ser estimadas em conjunto, com base na correlação espacial.
A Teoria dos Determinantes
O que você deve saber sobre
FUNÇÃO MODULAR.
Determinantes SilvanaWBenvenutti Turma:301
Outras Transforações de Imagens
MATRIZES É uma tabela disposta em “m” linhas e “n” colunas.
Amintas engenharia.
Determinantes.
Espaço Vetorial Introdução Definição de Espaço Vetorial Subespaço
MECÂNICA - ESTÁTICA Vetores Forças Cap. 2.
Estabilidade e Estacionariedade em Séries Temporais
Campus de Caraguatatuba
Análise de Componentes Principais
MECÂNICA - ESTÁTICA Cabos Cap. 7.
MECÂNICA - DINÂMICA Exercícios Cap. 13, 14 e 17. TC027 - Mecânica Geral III - Dinâmica © 2013 Curotto, C.L. - UFPR 2 Problema
Norma e produto interno
Dependência e Independência Linear e Produto Vetorial
Conceitos fundamentais
MECÂNICA - ESTÁTICA Vetores Forças Cap. 2.
Matemática para Economia III
Aula 8 e 9: Determinantes (continuação)
Matemática para Economia III
Revisão De Alguns Conceitos Básicos
Cálculo Numérico / Métodos Numéricos
Cálculo Numérico / Métodos Numéricos
Função de uma Variável Aleatória
Grandezas Vetoriais & Operações com Vetores
Estatística e Probabilidade
Conceitos fundamentais
Análise Fatorial Factor analysis.
Revisão do conceito de matrizes
Progressão Geométrica Matrizes Questão nº01  Na P.G., a posição do termo é...
Sistema de equações lineares
Computação Gráfica Aula 3 Transformações Geométricas
Álgebra Vetorial e Linear para Computação
TRANSFORMAÇÕES DE TENSÕES
Aula 6 - Método não-experimental ou de seleção não-aleatória
Cálculo Numérico / Métodos Numéricos
Aula 8: Determinantes (continuação)
Campus de Caraguatatuba
Campus de Caraguatatuba
MÚLTIPLOS GRAUS DE LIBERDADE
Seleção de atributos Mariana Pinheiro Bento IA368Q.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Componentes Principais Camilo Daleles Rennó
Regressão e Previsão Numérica.
Análise Estatística Multivariada
Análise de Componentes Principais
GEOMETRIA ANALITICA VETORES.
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Componentes.
Álgebra Vetorial e Linear para Computação
Hidrodinâmica Aula 03 (1 0 Sem./2016) 1. Movimento relativo próximo a um ponto Considere que a velocidade no ponto P e no tempo t é u. Próximo a este.
DETEÇÃO E ESTIMAÇÃO Aula 19: Deteção Gaussiana – Parte 2.
Regressão Linear (aula 14 – Parte 2).
Álgebra Linear Tipos Especiais de Operadores Lineares
Transcrição da apresentação:

Análise Estatística Multivariada ACA226 – Climatologia II, Depto Ciências Atmosféricas, IAG/USP Prof. Humberto Rocha Análise Estatística Multivariada Técnica das Componentes Principais (CP) (ou Funções Ortogonais Empíricas) Motivação variáveis hidroclimatológicas do sistema climático : grande quantidade muitas vezes correlacionadas entre si uma tecnica estatistica que, sem perder as informação relevantes, viabiliza: Interpretação do sistema de variáveis como um todo, seus padrões dominantes de variabilidade Reduzir a interpretação a um número de variáveis menor, ou seja: prover variaveis não correlacionadas entre si (limitação da técnica de regressão) diminuir a redundância de informação Climatologia II - ACA226 (Iag/USP)

Se i = j então tem-se a variância: Revisão A função covariância de duas variáveis aleatórias xi e xj, como séries temporais no tempo k=1,n Se i = j então tem-se a variância: Climatologia II - ACA226 (Iag/USP)

Revisão 2. A matriz de covariância Σ Representação matricial de todas as combinações possíveis de covariâncias no vetor X de séries temporais de v.a. X = (x1,x2,...xp), no tempo k=1,n é a matriz quadrática (p x p) definida como   Como s12 = s21, por ex, a matriz é simétrica Climatologia II - ACA226 (Iag/USP)

rij Revisão 3. Matriz de Correlação Outra matriz importante nos cálculo das CP é a matriz de correlação. O coeficiente de correlação entre duas variáveis Xi e Xj é definido como rij Se i = j, então   A matriz de correlação é r11 = r22 = ... rpp = 1 define a diagonal da matriz Climatologia II - ACA226 (Iag/USP)

Revisão 4. Variáveis Independentes O coeficiente de correlação linear é   Se Xi e Xj não tem relação (ou proporção) linear entre si, β = 0 Assim   Se xi e xj são variáveis independentes (não relacionadas) então cov(xi,xy) = 0 Contudo, o oposto nem sempre é verdadeiro. Climatologia II - ACA226 (Iag/USP)

Y= λ X (2) Revisão 5. Problema de autovetores e Autovalores Seja um vetor (de 2 dimensões por exemplo ) X = (x1,x2) Uma transformação linear em X, obtida por uma matriz A (conhecida) que obtem o vetor Y, Y= A X (1) e seja equivalente a um vetor paralelo a X (ou seja, multiplicado por uma constante λ, desconhecida) Y= λ X (2) tem como solução possíveis os valores de λ, chamados autovalores, e de X como o autovetor associado (calculado) a λ, onde A é chamada de matriz de transformação. Climatologia II - ACA226 (Iag/USP)

Determinação dos autovalores e autovetores De (1) e (2) A X = λ X ↔ (A – λ I) X = 0 (3) Definindo-se a matriz A e a matriz identidade I, temos a11x1 + a12x2 – λx1 = 0 (a11 - λ) x1 + a12x2 = 0 a21x1 + a22x2 – λx2 = 0 a21x1 + (a22 - λ)x2 = 0 Então em (3) ↔ A solução do sistema tem solução para λ ≠ 0 que exige det (A – λ I) = 0, ou seja   e que é chamada de equação característica da matriz A , com soluções (chamadas características) que são os autovalores λ1 e λ2. Climatologia II - ACA226 (Iag/USP)

os autovetores Xi são lineares independentes, portanto Em (3), para cada λi obtem-se um autovetor associado Xi, ou seja, (no exemplo i=1,2) formam-se os pares (λ1, X1) e (λ2,X2), com as seguintes propriedades: os autovetores Xi são lineares independentes, portanto formam uma base vetorial, são ortogonais entre si; nenhum Xk pode ser expresso em função de outro Xj; cov(Xk,Xj)k≠j = 0 Revisão 6. Variância de um Sistema Def: a Variância total do Sistema (V) de Y = f(x1,x2) dependente das v.a. x1 e x2 na relação linear y = (a1x1 + a2x2) é definida como V = Var(y) = Var(a1x1+a2x2) = a12Var(x1) + a22Var(x2)+2a1a2cov(x1,x2) Climatologia II - ACA226 (Iag/USP)

= matriz de covariância de X a’ = matriz transposta de a Ou na forma genérica (i=1, ..,p)   mostra-se que   = matriz de covariância de X a’ = matriz transposta de a Demonstração: Climatologia II - ACA226 (Iag/USP)

Na diagonal principal vem   Na 1ª diagonal por ex Nas diagonais em geral Portanto cqd Climatologia II - ACA226 (Iag/USP)

Componentes principais : definição e determinação Seja o sistema (V) de Y = f(X1,X2,..,Xp ) de p variáveis independentes, com n eventos cada (no tempo por ex), as CP serão determinadas com o fim de reter o máximo de informação das variáveis (X1,..,Xp) transformando-as em outras p variáveis Y1, Y2,...Yp, onde se: garanta a sua ortogonalidade de Yi (i=1,p) ; retenha somente k variáveis mais importantes (k<p), Y1,...,Yk ; (c) Possa interpretar a importância de cada Xi (i=1,p) nas CP. As CP são definidas como o conjunto de vetores Y = (Y1,Y2,...,Yp ) , formado por p combinações lineares de X tal que com o vetor Climatologia II - ACA226 (Iag/USP)

Cálculo das Componentes principais Objetivo: maximizar Var(Yi) onde e que Var(Y1) > Var(Y2) > ... > Var(Yp) Para a 1ª CP Var(Y1) = l1’(Σ l1) onde Σ = matriz covariancia de X l1’ = (l11,l21,...,lp1) , transposto de l1 maximizar (var(Y1)) = max(l1’(Σ l1)) condição de contorno: l1’ l1=1 seja então Q1 = l1’ (Σ l1) e introduzimos um multiplicador lagrangiano λ1 Q1 = l1’(Σ l1) + λ1 - λ1l1’l1 ↔ Q1 = l1’(Σ l1) + λ1(1 - l1’l1) max(Q1) leva a Vetores unitários garantem maximização não ocorra simplesmente por multiplicação de uma constante Eq. Característica da matriz com p-pares solução (λ1, l1), mas para obter uma solução única de l1 vem: das p soluções possíveis, toma-se o maior λ1 e o l1 associado Climatologia II - ACA226 (Iag/USP)

b) Construção de cada CP (chamada também de factor) é a) Procedimento de cálculo : dada matriz de covariância Σ de X = (X1, .., Xp) calculam-se os p pares (autovalor, autovetor) = (λ1, l1) ,..., (λp, lp) Identifica-se a 1ª CP no maior λ1, e assim sucessivamente a 2ª CP até k-esima CP tal que (λ1 > λ2 > ... > λp ) b) Construção de cada CP (chamada também de factor) é O coeficiente lk1 é o “peso” (chamado de loading) da variável Xk na 1ª CP relativamente aos demais; pode ser positivo ou negativo (proporção direta ou indireta) infere-se a importância de cada Xk (serve como critério para selecionar variáveis em um modelo de regressão linear múltipla, por ex.) Climatologia II - ACA226 (Iag/USP)

Propriedades Com a matriz de covariância , a equação característica | Σ - λ I|=0 define-se a matriz dos coeficientes das componentes principais U e a matriz L U’ Σ U = L , onde As colunas de U , (u1, u2,...un) são os auto-vetores da matriz Σ Os elementos da diagonal de L , (λ 1, λ 2...λ n) são os autovalores da matriz Σ A variância total do sistema é dada por e a variância explicada pela i-ésima CP é Portanto escolhe-se somente as k primeiras CPs (Y1,Y2,...,Yk), (k>p) que respondam pela maior parte da variância total, para fins de interpretação. Climatologia II - ACA226 (Iag/USP)

Exemplo 1 : duas séries temporais Dia T 1 T 2 1 10 10.7 2 10.4 9.8 3 9.7 4 10.1 5 11.7 11.5 6 11.0 10.8 7 8.7 8.8 8 9.5 9.3 9 9.4 9.6 11 10.5 12 9.2 9.0 13 11.3 11.6 14 15 8.5 Exemplo 1 : duas séries temporais Temperatura média diária em 2 estações próximas, T1 e T2, durante 15 dias Matriz de covariância determinando a equação característica Com soluções λ1 = 1.44 e λ2 = .086 Climatologia II - ACA226 (Iag/USP) Climatologia II - ACA226 (Iag/USP)

variância do sistema = soma dos auto-valores = 1.44 + .09 = 1.53 auto-vetores li obtidos pela solução da equação Para λ1 = 1.44 Para λ2 = .086 analogamente variância do sistema = soma dos auto-valores = 1.44 + .09 = 1.53 variância explicada pela 1ª CP = 1.44/1.53 = 0.94 (ou ~94%) variância explicada pela 2ª CP = 0.09 /1.53 = 0.06 ( ou ~6,0%) Climatologia II - ACA226 (Iag/USP)

Interpretação geométrica das CPs : rotação de eixos no sistema de coordenadas centrado na média =(10,10) definem-se eixos de variação: Na 1ª CP l11=0.72 = cosseno do ângulo abscissa c/1º eixo (linha azul sólida), cos(43,65o)=0.72; Na 2ª CP l21=-0.69 = cosseno do ângulo abscissa c/2º eixo (linha verde), cos(90o+46,35o)=-0.69 é Ortogonal ao 1º eixo regressão linear de T2 =f (T1) indicada linha preta 46,35o Variavel T2 Variavel T1 Climatologia II - ACA226 (Iag/USP)

Eixo u = direção principal de variação entre X1 e X2 Eixo v = 2a direção principal assim as direções u e v são chamadas de Componentes Principais. 2o autovetor 1o autovetor

Exemplo 2: com 3 variáveis

Exemplo 3 - Aplicação em campos espaciais Variáveis: série histórica de precipitação (acumulado em pentadas) 1979 a 2010 (=2336 pêntadas) Fonte: GPCP (Adler et al., 2003) Disposição: grade regular na America do Sul (60S a10N ; 90W a 30W ) com 24 pontos em x, 28 pontos em y, 2336 pontos em t Cada ponto é uma variável (no total p=24x28 = 672 variáveis), e cada um é uma série temporal com n=2336 eventos, ou seja, Climatologia II - ACA226 (Iag/USP)

1º CP 18.6% da variância explicada 2º CP 7.8% da variância explicada Climatologia II - ACA226 (Iag/USP)

Reconstrução temporal das CPs Coeficiente temporal do 1º CP Coeficiente temporal do 2º CP Coeficiente temporal do 3º CP Coeficiente temporal do 4º CP Climatologia II - ACA226 (Iag/USP)

Reconstrução da Série = CP x coeficiente temporal Dados originais de Precipitação pentadal Reconstrução da Série = CP x coeficiente temporal evento 25-maio-1984 evento 25-maio-1984 Climatologia II - ACA226 (Iag/USP)