Análise de Dados de Área

Slides:



Advertisements
Apresentações semelhantes
VIII Espectroscopia luz luz Método envolve: excitação detecção Fontes
Advertisements

SISTEMA BINÁRIO Hardware de Computadores. SISTEMA BINÁRIO Hardware de Computadores.
Espelhos planos e esféricos
PGF5001 – Mecânica Quântica 1 Prof. Emerson Passos.
CLIMATOLOGIA NO BRASIL
Estatística Aplicada à Motricidade
INTRODUÇÃO À GEOMETRIA DO ESPAÇO-TEMPO
MÉTRICA ds2=dx2+dy2 Distância entre dois pontos numa superfície
VI: EQUILÍBRIO RADIATIVO
GEOMETRIA DE ESPAÇOS CURVOS
(projetado sobre o plano)
Ronaldo E. De Souza Depto. Astronomia, IAG/USP. Como podemos ter uma percepção das distâncias astronômicas em termos da nossa experiência diária? Unidade.
FA-023 – Adequação Trator-implemento
Prof. Dr. Helder Anibal Hermini
Desempenho de Tratores aula 3
1. Equivalência entre portas 2. Derivação de expressões booleanas 3
Protocolos Criptográficos. Múltiplas chaves em RSA Para RSA, escolhe-se dois números, e e d, tal que e. d = 1 mod (p-1).(q-1) Entretanto, também pode-se.
Introdução ao SPRING Extras Dicas.
Registro de Carta Topográfica
Processamento de Imagens
Técnicas de Processamento Imagens
Diretoria de Ensino – Região de Mogi Mirim. Questões de múltipla escolha: elaboradas por professores e analisadas por especialistas; pré-testadas; realiza.
Banco de Dados I Profa. Jiani Cardoso 2/2005
O Fluxo de Testes © Alexandre Vasconcelos
Análise Espacial Análise de Padrões de Área
Regionalização via Skater
Estatística: Aplicação ao Sensoriamento Remoto SER 202 Aula 01 - ANO 2013 Camilo Daleles Rennó
Análise de Regressão com Dados Espaciais: Uma Breve Introdução
FERRAMENTAS DA QUALIDADE
"Tudo o que acontece, acontece em algum lugar." Gilberto Câmara - INPE Gilberto Câmara - INPE.
Modelos Digitais de Terreno
Introdução à Estatística
Técnicas de Amostragem
Sistemas de Tutoria Inteligente (STI) Visam proporcionar instrução de forma adaptada a cada aprendiz. STIs adaptam o processo de instrução a determinadas.
CES-11 LAB 03 Bitmap Quadtree
CARACTERIZAÇÃO DE PARTÍCULAS
Transferência de Calor por Radiação Térmica
TA 733 A – Operações Unitárias II Transferência de Calor
Probabilidade Modelo matemático para incerteza Desenvolvimento relativamente recente –Cardano (século XVI) –Pascal (século XVII) Peter Bernstein, Against.
Probabilidade e Esperança Condicional
Intervalos de confiança Sejam X 1, X 2, …, X n i.i.d. com distribuição F. Um intervalo de confiança de nível 1– para é um par de estatísticas [T 1 (X),
Variáveis Aleatórias Uma variável aleatória associa um número real a cada resultado de um experimento aleatório. Mais precisamente…
Probabilidade Modelo matemático para incerteza Desenvolvimento relativamente recente –Cardano (século XVI) –Pascal (século XVII) Peter Bernstein, Against.
Estatística Dados valores (amostras) de variáveis aleatórias X 1, X 2,..., X n, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.
Modelos de Iluminação e Tonalização
BlastPhen Aluno: Ricardo Nishikido Pereira
Já definimos o coeficiente angular de uma curva y = f(x) no ponto onde x = x 0. Derivadas Chamamos esse limite, quando ele existia, de derivada de f em.
Teorema do Confronto Se não pudermos obter o limite diretamente, talvez possamos obtê-lo indiretamente com o teorema do confronto. O teorema se refere.
Interpolação Introdução Conceito de Interpolação
Aritmética de ponto flutuante Erros
Sistemas Lineares Parte 2
Resolução de Sistemas Lineares- Parte 1
Desempenho A rápida taxa de melhoria na tecnologia de computadores veio em decorrência de dois fatores: avanços na tecnologia utilizada na construção.
Marco Antonio Montebello Júnior
Função Exponencial.
Introdução à Probabilidade
ESTATÍSTICA DESCRITIVA
PRODUTOS E FATORES: UMA QUESTÃO NOTÁVEL Professor: Graciano Pianezzer Beletti.
Cartografia.
Frações Professor: Graciano Pianezzer Beletti.
PHD5873/04-1 PHD 5873 Complementos de Hidrologia Aula 3 – Séries Sintéticas de Vazões EPUSP, 07 de outubro de 2003 Prof. Dr. José Rodolfo Scarati Martins.
PHD5873/03-1 PHD 5873 Complementos de Hidrologia Aula 3 – Métodos Estatísticos EPUSP, 30 de setembro de 2003 Prof. Dr. José Rodolfo Scarati Martins.
Análise do Desempenho dos Modelos
PREVALÊNCIA DE SÍNDROME METABÓLICA EM PROFISSIONAIS MOTORISTAS.
Curso de Programação em C++
Visão Computacional Shape from Shading e Fotométrico Eséreo
Robótica: Sistemas Sensorial e Motor
Introdução Ciência da Computação estudo de algoritmos –ÊNFASE ao estudo de DADOS armazenamento manipulação refinamento (a partir de dados cru) estrutura.
1 Seja o resultado de um experimento aleatório. Suponha que uma forma de onda é associada a cada resultado.A coleção de tais formas de ondas formam um.
8. Uma Função de duas Variáveis Aleatórias
Transcrição da apresentação:

Análise de Dados de Área Parte 3 - Análise Exploratória

Análise Exploratória Definição Conjunto de ferramentas estatísticas gráficas e descritivas direcionado ao descobrimento de padrões em dados. ESDA (Exploratory Spatial Data Analysis). “Coleção de técnicas para descrever e visualizar distribuições espaciais, identificar situações atípicas, descobrir padrões de associação espacial, clusters e sugerir regimes espaciais ou formas de heterogeneidade espacial” (Anselin).

Técnicas de Análise Exploratória Indicadores Globais de Autocorrelação suposição: estacionariedade (função da “distância”). Ex: variograma, correlograma, etc. Indicadores Locais de Associação Espacial Ressaltam as situações atípicas (“outliers” ). Ex: Mapa de LISA, gráfico de espalhamento de Moran. Indicadores multivariados da associação espacial generalização do variograma em múltiplas dimensões

Proximidade espacial Na geoestatística: distância euclidiana. Principal diferença para objetos áreas, é na formalização da proximidade espacial! Qual distância de São José à Jacareí? 10 mim, 15 km ou “são colados” . Depende!

Exemplos de medidas = w + L proporção da fronteira pelo perímetro. 4 3 2 1 14 L w + = - wij ¹ wji - “média ponderada!”

Exemplos de medidas inverso da distância linear. distância linear entre centróides dos obejtos. para d > limiar para d £ limiar inverso da distância linear.

Exemplos de medidas Existência de fronteira comum. P1 faz fronteira com P4 P2 não tem fronteira com P4

Matriz de Proximidade wij : “distância” do objeto i ao objeto j. ú û ù ê ë é = 44 43 42 41 34 33 32 31 24 23 22 21 14 13 12 11 w W wij : “distância” do objeto i ao objeto j.

Matriz de Proximidade Espacial Conteúdo Matriz (n x n) W , cujos elementos wij representa uma medida de proximidade entre Oi e Oj Critérios:- wij =1, se Oi toca Oj wij = 1, se dist(Oi, Oj) < h wij = lij/li, onde lij é o tamanho da fronteira entre Oi e Oj e li é o perímetro de Oi A B C D E A B C D E A 0 1 0 1 0 B 1 0 1 1 1 C 0 1 0 0 1 D 1 1 0 0 1 E 0 1 1 1 0

Média Espacial Móvel O Método de Média Espacial Móvel é uma técnica que explora o valor médio mi do atributo na região de estudo (primeira ordem). Seu estimador é definido como: onde: Wij é a matriz de proximidade. yi é o valor do atributo em cada área. n é o número de polígonos (áreas).

Média Espacial Móvel A A B B C C D D Antes Depois 20 19,66 15 24 16,0 14,66 16,0 19,66 Depois

Agrupamento estatístico Média Espacial Móvel Agrupamento estatístico Média Espacial Móvel Efeito de suavização

Média Espacial Móvel Regiões onde existe disparidade entre o valor do atributo e o valor da média local indicam pontos de transição entre regimes espaciais. Atributo Média local

Indicadores Globais de Autocorrelação Espacial Explorar a dependência espacial Autocorrelação espacial. Mede o quanto o valor observado de um atributo numa região é independente dos valores desta mesma variável nas localizações vizinhas. Indicadores Globais Moran, Geary, Variograma Indicadores Locais Local Moran, Local Geary

Variabilidade Espacial: Variograma Passo1: Transformar mapas poligonais em amostras

Variabilidade Espacial: Variograma Passo2 : Medir a Variância no Espaço Para cada par Z(x) e Z(x+h), separados por um vetor distância h, medimos a variância entre eles • h Parte 1: definições, conceitos, os quatro universos de representação, modelagem de dados; Parte 2: estrutura dual, bancos de dados relacionais, consulta espacial; Parte 3: aspectos interdisciplinares, modelagem matemática, integração de dados, generalização; Parte 4: principais operadores, álgebra de mapas, LEGAL, menus e formulários x linguagem de alto nível; Parte 5: apresentação dos detalhes de alguns projetos tipicamente ambientais e cadastrais. Vetor distância h h a

Variograma para Dados de Área Gerar Centróides a partir de Áreas Modelar o Variograma Interpolar uma Superfície (se desejar)

VARIOGRAMAS DO I.C.V.

ÍNDICE DE CONDIÇÃO DE VIDA ICV = 1 ICV = 0

VARIOGRAMAS DO I.D.H.

Forma genérica dos índices global local å = G n j ij i a w G = å w a ij j n i onde: ij w : medida de proximidade entre objetos i e j a :expressão que representa a associação entre os atributos do objeto i com os demais objetos de sua vizinhança. ij

Forma genérica dos índices å å å G = w a G = w a i ij ij ij ij j i j Quando aij é da forma: ( ) ( ) x - x x - z z Moran (covariância) x i j i j ( ) ( ) x - x 2 z - z 2 Geary (variância) i j i j ( ) ( ) x ou x + x z ou z + z G ou G* (média móvel) j i j j i j

Indice Global de Moran onde: n corresponde ao número de áreas, yi é o valor do atributo considerado na área i, representa o valor médio do atributo na região de estudo, wij são os pesos atribuídos conforme a conexão entre as áreas i e j.

Indicadores Globais Moran Qual o significado do índice global de Moran ( I ) ? Como interpretar a equação acima ? Qual sua siginificância ou validade estatística ? Como avaliar ?

Índice Globais de Moran É análogo ao coeficiente de correlação convencional, porque têm em seu numerador um termo que é produto de momento. Como um coeficiente de correlação, os valores de I também variam de -1 a +1, quantificando o grau de autocorrelação espacial existente. -1 autocorrelação espacial negativa ou inversa. 0 significa aleatoriedade +1 significa autocorrelação espacial positiva ou direta.

Indicadores Globais de Autocorrelação Espacial Consideremos o exemplo que segue: Matriz de Proximidade A B C D 5 24 15 20 A B C D A 0 1 1 0 B 1 0 1 1 C 1 1 0 1 D 0 1 1 0

Indicadores Globais de Autocorrelação Espacial A equação de I pode ser simplificada [N(m=0 e s2=1)] e alteramos W, de forma que a soma dos elementos de cada linha seja igual a 1. A B C D A 0 1 1 0 B 1 0 1 1 C 1 1 0 1 D 0 1 1 0 A B C D A 0 1/2 1/2 0 B 1/3 0 1/3 1/3 C 1/3 1/3 0 1/3 D 0 1/2 1/2 0

Indicadores Globais de Autocorrelação Espacial zA = 0,5628 zC = 1,1257 zD = -1,5479 zB = -0,1407 A B C D A 0 1/2 1/2 0 B 1/3 0 1/3 1/3 C 1/3 1/3 0 1/3 D 0 1/2 1/2 0 A B C D 5 24 15 20 wij zi zj Mij * =

Significância do Índice de Moran Avaliação da siginificância do índice de Moran (I). Para estimar a significância de I, será preciso associar a este uma distribuição estatística, para tanto, duas abordagens são possíveis: Teste de pseudo-significância (experimento aleatório). Distribuição aproximada (hipótese da normalidade).

Indicadores Globais de Autocorrelação Espacial A validade estatística do índice de Moran (I) sob o teste de pseudo-significância. Se o índice I efetivamente medido corresponder a um “extremo” da distribuição simulada, então trata-se de evento com significância estatística. Distribuição simulada extremo extremo

I de Moran: Validade Estatística Para um número suficiente de sub-regiões o índice I tem uma distribuição amostral que é aproximadamente normal, dada por: onde: n = número de regiões, Índice Moran Normalizado Normal Padrão 95% -1,96 1,96

Mapeando a Violência: Dados de Área Fonte: Carvalho, M. S., 1998. FIOCRUZ - RJ

Indicadores Globais de Autocorrelação Espacial 100 200 300 400 500 600 RJ SP -0.2 0.0 0.2 0.4 0.6 auto-correlação ES MG 0.6 0.4 0.2 0.0 -0.2 100 200 300 400 500 600 Fonte: Carvalho, M. S., 1998. FIOCRUZ - RJ distância

Diagrama de Espalhamento de Moran Este diagrama relata espacialmente o relacionamento entre os valores do vetor de desvios Z ( ) e os valores das médias locais WZ, indicando diferentes regimes espaciais presentes nos dados. WZ Q4 Q1 Reta de regressão de WZ em Z a I é equivalente a tg a Nesta formulação, I equivale ao coeficiente de regressão linear, ou seja a inclinação da reta de regressão. Q2 Q3 z

Diagrama de Espalhamento de Moran Q1 (val. [+], médias [+]) e Q2 (val. [-], médias [-]) Indicam pontos de associação espacial positiva, no sentido que uma localização possui vizinhos com valores semelhantes. z WZ a Q3 Q2 Q1 Q4 Q3 (val. [+], médias [-]) e Q4 (val. [-], médias [+]) Indicam pontos de associação espacial negativa, no sentido que uma localização possui vizinhos com valores distintos. Nota:- os pontos localizados em Q3 e Q4 podem ser vistos como extremos, tanto por estar afastados da reta de regres- são linear, como por indicar regiões que não seguem o mes-mo processo de dependência espacial das demais observa- ções. Estes pontos marcam regiões de transição entre regi- mes espaciais distintos.

Autocorrelação Espacial O Diagrama de Espalhamento de Moran pode ser apresentado na forma de um mapa coroplético bidimensional, no qual cada polígono é apresentado indicando-se seu quadrante no diagrama de espalhamento. São Paulo WZ Q4 = LH Q1= HH a Q2= LL Q3 = HL Atributo considerado percentagem de idosos z

Indicadores Locais de Associação Espacial (LISA) Como vimos anteriormente o estimador de autocorrelação espacial, Moran (I), fornece um valor único como medida da associação espacial. Por outro lado, muitas vezes é necessário examinar padrões numa escala maior. Neste caso, é preciso utilizar indicadores locais de associação espacial que possam ser associados a diferentes localizações de uma variável distribuída espacialmente. A utilização destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento sobre o processos que dão origem a dependência espacial.

Introdução Índices locais (LISA): Permitem avaliar diferentes regimes espaciais existentes na área de estudo. Medem a associação espacial entre uma observação i e sua vizinhança. Requisitos (Anselin) A soma dos índices locais deve ser proporcional ao índice global. Indicar a significância da associação espacial para cada observação.

Indicadores Locais de Associação Espacial (LISA) Os indicadores locais de associação espacial, produzem um valor específico para cada objeto. Isto acarreta a identificação de: “Clusters”: objetos com valores de atributos semelhantes, “Outliers”: objetos anómalos, A presença de mais de um regime espacial. Tem que atender a dois objetivos: Permitir a identificação de padrões de associação espacial significativos; Ser uma decomposição do índice global de associação espacial.

Índice local de Moran Formulação:

Indicadores Locais de Associação Espacial (LISA) Indicadores locais Ii de Moran (Anselin, 1996) Indicadores locais Gi e Gi * (Getis e Ord, 1992) O indicador local de Moran Ii é assim definido: Ii > 0 “clusters” de valores similares (altos ou baixos). Ii < 0 “clusters” de valores distintos (Ex: uma localização com valores altos rodeada por uma vizinhança de valores baixos). Normalizando as variáveis o indicador reduz-se a:

Indicadores Locais de Associação Espacial (LISA) De forma similiar aos indicadores globais, a significância do índice local de Moran (Ii) deve ser avaliado, utilizando hipótese de normalidade ou simulação de distribuição por permutação aleatória nos valores dos atributos (Anselin, 1995). Uma vez determinada a significância estatística de Moran (Ii) é muito útil gerar um mapa indicando as regiões que apresentam correlação local significativamente diferente do resto dos dados. Este mapa é denominado por Anselin (1995) de “LISA MAP”. Na geração do LISA MAP, os índices locais Ii são classificados como: não significantes com significância de 95% (1,96s), 99% (2,54s) e 99,9% (3,2s).

Indicadores Locais de Associação Espacial (LISA) Os indicadores locais Gi e Gi * (Getis e Ord, 1992): onde: wij valor na matriz de proximidade para região i com a região j em função da distância. xi e xj são os valores dos atributos considerados nas áreas i e j. d é distância entre pontos n o número de áreas (polígonos) NOTA: a estatística Gi, inclui no numerador a soma de todos os valores de todos vizinhos dentro de uma distância d do ponto considerado. Gi * difere de Gi por incluir a localização visitada.

Indicadores Locais de Associação Espacial (LISA) Os indicadores locais Gi e Gi * (Getis e Ord, 1992): onde: wij valor na matriz de proximidade para região i com a região j em função da distância. xi e xj são os valores dos atributos considerados nas áreas i e j. d é distância entre pontos n o número de áreas (polígonos)

Indicadores Locais de Autocorrelação Espacial 95% sign. 99% sign. não signif. “Bolsões” de exclusão/inclusão social em São Paulo

Indicadores Locais de Associação Espacial (LISA) Uma outra forma de análise é através do mapa denominado “Moran Map” (Anselin, 1999). Neste caso, os índices locais Ii são associados ao diagra-ma de espalhamento de Moran. Nota: este resultado apresenta somente as regiões para os quais os valores de Ii ,foram considerados significantes (com intervalo >95%). não significantes Q1 [HH] Q2 [LL] % I d o s o s