A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Análise de Dados de Área Parte 3 - Análise Exploratória.

Apresentações semelhantes


Apresentação em tema: "Análise de Dados de Área Parte 3 - Análise Exploratória."— Transcrição da apresentação:

1 Análise de Dados de Área Parte 3 - Análise Exploratória

2 Análise Exploratória Definição –Conjunto de ferramentas estatísticas gráficas e descritivas direcionado ao descobrimento de padrões em dados. ESDA (Exploratory Spatial Data Analysis). Coleção de técnicas para descrever e visualizar distribuições espaciais, identificar situações atípicas, descobrir padrões de associação espacial, clusters e sugerir regimes espaciais ou formas de heterogeneidade espacial (Anselin).

3 Técnicas de Análise Exploratória Indicadores Globais de Autocorrelação –suposição: estacionariedade (função da distância). –Ex: variograma, correlograma, etc. Indicadores Locais de Associação Espacial –Ressaltam as situações atípicas (outliers ). –Ex: Mapa de LISA, gráfico de espalhamento de Moran. Indicadores multivariados da associação espacial –generalização do variograma em múltiplas dimensões

4 Proximidade espacial Na geoestatística: distância euclidiana. Principal diferença para objetos áreas, é na formalização da proximidade espacial! –Qual distância de São José à Jacareí? 10 mim, 15 km ou são colados. Depende!

5 proporção da fronteira pelo perímetro. Exemplos de medidas LLLL L w - w ij w ji - média ponderada!

6 distância linear entre centróides dos obejtos. Exemplos de medidas para d > limiar para d limiar inverso da distância linear.

7 Existência de fronteira comum. Exemplos de medidas P1 faz fronteira com P4 P2 não tem fronteira com P4

8 Matriz de Proximidade wwww wwww wwww wwww W w ij : distância do objeto i ao objeto j.

9 Matriz de Proximidade Espacial Conteúdo –Matriz (n x n) W, cujos elementos w ij representa uma medida de proximidade entre O i e O j Critérios:- w ij =1, se O i toca O j w ij = 1, se dist( O i, O j ) < h w ij = l ij /l i, onde l ij é o tamanho da fronteira entre O i e O j e l i é o perímetro de O i A B C D E A B C D E A B C D E

10 Média Espacial Móvel O Método de Média Espacial Móvel é uma técnica que explora o valor médio i do atributo na região de estudo (primeira ordem). Seu estimador é definido como: onde: W ij é a matriz de proximidade. y i é o valor do atributo em cada área. n é o número de polígonos (áreas).

11 Média Espacial Móvel A B C D Antes A B C D 14,66 16,0 16,0 19,66 Depois

12 Agrupamento estatístico Média Espacial Móvel Efeito de suavização

13 Média Espacial Móvel Regiões onde existe disparidade entre o valor do atributo e o valor da média local indicam pontos de transição entre regimes espaciais. Atributo Média local

14 Indicadores Globais de Autocorrelação Espacial Explorar a dependência espacial Autocorrelação espacial. –Mede o quanto o valor observado de um atributo numa região é independente dos valores desta mesma variável nas localizações vizinhas. Indicadores Globais –Moran, Geary, Variograma Indicadores Locais –Local Moran, Local Geary

15 Variabilidade Espacial: Variograma Passo1: Transformar mapas poligonais em amostras

16 h h h h h h h Vetor distância h Variabilidade Espacial: Variograma Passo2 : Medir a Variância no Espaço Para cada par Z(x) e Z(x+h), separados por um vetor distância h, medimos a variância entre eles

17 Variograma para Dados de Área Gerar Centróides a partir de Áreas Modelar o Variograma Interpolar uma Superfície (se desejar)

18 VARIOGRAMAS DO I.C.V.

19 ÍNDICE DE CONDIÇÃO DE VIDA ICV = 1 ICV = 0

20 VARIOGRAMAS DO I.D.H.

21 forma genérica: Forma genérica dos índices onde: ij w : medida de proximidade entre objetos i e j ij a :expressão que representa a associação entre os atributos do objeto i com os demais objetos de sua vizinhança. n j ij i aw wa ij j n i n local global

22 xxxx ji zz ij Moran (covariância) 2 ji xx 2 ji zz Geary (variância) jij xxoux zouzz jij G ou G* (média móvel) n j ij i aw wa ij j n i n Forma genérica dos índices Quando aij é da forma:

23 Indice Global de Moran onde: – n corresponde ao número de áreas, – y i é o valor do atributo considerado na área i, – representa o valor médio do atributo na região de estudo, – w ij são os pesos atribuídos conforme a conexão entre as áreas i e j.

24 Indicadores Globais Moran Qual o significado do índice global de Moran ( I ) ? Como interpretar a equação acima ? Qual sua siginificância ou validade estatística ? Como avaliar ?

25 Índice Globais de Moran É análogo ao coeficiente de correlação convencional, porque têm em seu numerador um termo que é produto de momento. Como um coeficiente de correlação, os valores de I também variam de -1 a +1, quantificando o grau de autocorrelação espacial existente. -1 autocorrelação espacial negativa ou inversa. 0 significa aleatoriedade +1 significa autocorrelação espacial positiva ou direta.

26 Indicadores Globais de Autocorrelação Espacial Consideremos o exemplo que segue: A B C D A B C D A B C D Matriz de Proximidade

27 A equação de I pode ser simplificada [ N ( =0 e =1)] e alteramos W, de forma que a soma dos elementos de cada linha seja igual a 1. Indicadores Globais de Autocorrelação Espacial A B C D A B C D A B C D A 0 1/2 1/2 0 B 1/3 0 1/3 1/3 C 1/3 1/3 0 1/3 D 0 1/2 1/2 0

28 Indicadores Globais de Autocorrelação Espacial A B C D A 0 1/2 1/2 0 B 1/3 0 1/3 1/3 C 1/3 1/3 0 1/3 D 0 1/2 1/2 0 A B C D z A = 0,5628 z C = 1,1257 z D = -1,5479 z B = -0,1407 w ij z i z j M ij * =

29 Avaliação da siginificância do índice de Moran ( I ). Para estimar a significância de I, será preciso associar a este uma distribuição estatística, para tanto, duas abordagens são possíveis: Teste de pseudo-significância (experimento aleatório). Distribuição aproximada (hipótese da normalidade). Significância do Índice de Moran

30 A validade estatística do índice de Moran ( I ) sob o teste de pseudo-significância. Se o índice I efetivamente medido corresponder a umextremo da distribuição simulada, então trata-se de evento com significância estatística. Indicadores Globais de Autocorrelação Espacial Distribuição simulada extremo

31 Para um número suficiente de sub-regiões o índice I tem uma distribuição amostral que é aproximadamente normal, dada por: onde: n = número de regiões, I de Moran: Validade Estatística 0 Normal Padrão 1,96-1,96 95% Índice Moran Normalizado

32 Mapeando a Violência: Dados de Área Fonte: Carvalho, M. S., FIOCRUZ - RJ

33 ES MG RJ SP distância auto-correlação Indicadores Globais de Autocorrelação Espacial Fonte: Carvalho, M. S., FIOCRUZ - RJ

34 Diagrama de Espalhamento de Moran Este diagrama relata espacialmente o relacionamento entre os valores do vetor de desvios Z ( ) e os valores das médias locais WZ, indicando diferentes regimes espaciais presentes nos dados. I é equivalente a tg 0 0 z WZ Reta de regressão de WZ em Z Q3Q3Q3Q3 Q3Q3Q3Q3 Q2Q2Q2Q2 Q2Q2Q2Q2 Q1Q1Q1Q1 Q1Q1Q1Q1 Q4Q4Q4Q4 Q4Q4Q4Q4 Nesta formulação, I equivale ao coeficiente de regressão linear, ou seja a inclinação da reta de regressão.

35 Diagrama de Espalhamento de Moran 0 0 zWZ Q3Q3Q3Q3 Q3Q3Q3Q3 Q2Q2Q2Q2 Q2Q2Q2Q2 Q1Q1Q1Q1 Q1Q1Q1Q1 Q4Q4Q4Q4 Q4Q4Q4Q4 Q 1 (val. [+], médias [+]) e Q 2 (val. [-], médias [-]) Indicam pontos de associação espacial positiva, no sentido que uma localização possui vizinhos com valores semelhantes. Q 3 (val. [+], médias [-]) e Q 4 (val. [-], médias [+]) Indicam pontos de associação espacial negativa, no sentido que uma localização possui vizinhos com valores distintos. Nota:- os pontos localizados em Q 3 e Q 4 podem ser vistos como extremos, tanto por estar afastados da reta de regres- são linear, como por indicar regiões que não seguem o mes- mo processo de dependência espacial das demais observa- ções. Estes pontos marcam regiões de transição entre regi- mes espaciais distintos.

36 Autocorrelação Espacial O Diagrama de Espalhamento de Moran pode ser apresentado na forma de um mapa coroplético bidimensional, no qual cada polígono é apresentado indicando-se seu quadrante no diagrama de espalhamento. 0 0 z WZ Q 3 = HL Q 2= LL Q 1= HH Q 4 = LH São Paulo Atributo considerado percentagem de idosos

37 Indicadores Locais de Associação Espacial (LISA) Como vimos anteriormente o estimador de autocorrelação espacial, Moran ( I ), fornece um valor único como medida da associação espacial. Por outro lado, muitas vezes é necessário examinar padrões numa escala maior. Neste caso, é preciso utilizar indicadores locais de associação espacial que possam ser associados a diferentes localizações de uma variável distribuída espacialmente. A utilização destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento sobre o processos que dão origem a dependência espacial.

38 Índices locais (LISA): –Permitem avaliar diferentes regimes espaciais existentes na área de estudo. –Medem a associação espacial entre uma observação i e sua vizinhança. –Requisitos ( Anselin ) A soma dos índices locais deve ser proporcional ao índice global. Indicar a significância da associação espacial para cada observação. Introdução

39 Indicadores Locais de Associação Espacial (LISA) Os indicadores locais de associação espacial, produzem um valor específico para cada objeto. Isto acarreta a identificação de: – Clusters: objetos com valores de atributos semelhantes, – Outliers: objetos anómalos, – A presença de mais de um regime espacial. Tem que atender a dois objetivos: –Permitir a identificação de padrões de associação espacial significativos; –Ser uma decomposição do índice global de associação espacial.

40 Índice local de Moran Formulação:

41 Indicadores locais I i de Moran (Anselin, 1996) Indicadores locais G i e G i * (Getis e Ord, 1992) O indicador local de Moran I i é assim definido: I i > 0 clusters de valores similares (altos ou baixos). I i < 0 clusters de valores distintos (Ex: uma localização com valores altos rodeada por uma vizinhança de valores baixos). Normalizando as variáveis o indicador reduz-se a: Indicadores Locais de Associação Espacial (LISA)

42 De forma similiar aos indicadores globais, a significância do índice local de Moran ( I i ) deve ser avaliado, utilizando hipótese de normalidade ou simulação de distribuição por permutação aleatória nos valores dos atributos (Anselin, 1995). Uma vez determinada a significância estatística de Moran ( I i ) é muito útil gerar um mapa indicando as regiões que apresentam correlação local significativamente diferente do resto dos dados. Este mapa é denominado por Anselin (1995) de LISA MAP. Na geração do LISA MAP, os índices locais I i são classificados como: –não significantes –com significância de 95% (1,96 ), 99% (2,54 ) e 99,9% (3,2 ).

43 Os indicadores locais G i e G i * (Getis e Ord, 1992): onde: –w ij valor na matriz de proximidade para região i com a região j em função da distância. –x i e x j são os valores dos atributos considerados nas áreas i e j. –d é distância entre pontos –n o número de áreas (polígonos) NOTA: a estatística G i, inclui no numerador a soma de todos os valores de todos vizinhos dentro de uma distância d do ponto considerado. G i * difere de G i por incluir a localização visitada. Indicadores Locais de Associação Espacial (LISA)

44 Os indicadores locais G i e G i * (Getis e Ord, 1992): onde: –w ij valor na matriz de proximidade para região i com a região j em função da distância. –x i e x j são os valores dos atributos considerados nas áreas i e j. –d é distância entre pontos –n o número de áreas (polígonos) Indicadores Locais de Associação Espacial (LISA)

45 Indicadores Locais de Autocorrelação Espacial Bolsões de exclusão/inclusão social em São Paulo não signif. 95% sign. 99% sign.

46 Indicadores Locais de Associação Espacial (LISA) Uma outra forma de análise é através do mapa denominado Moran Map (Anselin, 1999). Neste caso, os índices locais I i são associados ao diagra-ma de espalhamento de Moran. não significantes Q1 [HH] Q2 [LL] % I d o s o s Nota: este resultado apresenta somente as regiões para os quais os valores de,foram considerados significantes (com intervalo >95%). Nota: este resultado apresenta somente as regiões para os quais os valores de I i,foram considerados significantes (com intervalo >95%).


Carregar ppt "Análise de Dados de Área Parte 3 - Análise Exploratória."

Apresentações semelhantes


Anúncios Google