A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2016 Variáveis Aleatórias Camilo Daleles Rennó

Apresentações semelhantes


Apresentação em tema: "Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2016 Variáveis Aleatórias Camilo Daleles Rennó"— Transcrição da apresentação:

1 Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2016 Variáveis Aleatórias Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/

2 Variável  atributo Em qualquer tipo de estudo, há sempre a necessidade de se focar em um ou mais atributos (características) dos elementos que compõem esta população (  ) Estes atributos constituem as variáveis de estudo 2

3 Tipos de Mensuração  atributo nominal ordinal intervalar proporcional (racional) cor (azul, verde, amarelo, branco, cinza) ranking (ótimo, bom, regular, ruim, péssimo) temperatura (Celsius, Fahrenheit, Kelvin) distância (metros, quilômetros) (zero representa apenas uma posição na escala) (zero representa ausência do atributo) 3 Por uma conveniência matemática, este atributo deveria ser representado por números que podem ser combinados e/ou sumarizados através de inúmeras manipulações algébricas: somatório, produtório, mínimo, média, mediana, etc

4 Variável Aleatória  atributo Definição: variável aleatória é uma função que associa cada elemento de  a um número. variável aleatória discreta contínua Aplicações: Estudar distribuições Definir estatísticas descritivas representativas Buscar tendências e/ou discrepâncias Realizar comparações entre populações Verificar suposições / Testar hipóteses 4

5 Variável Aleatória  K1K2K1K2 K1C2K1C2 C1K2C1K2 C1C2C1C2 X : número de caras em 2 lances de moeda 012 X(CC) = 0 X(KC) = X(CK) = 1 X(KK) = 2 P(X = 0) = P(CC) P(X = 1) = P(KC  CK) P(X = 2) = P(KK) X(  ) (imagem) Experimento: jogar 2 moedas e observar o resultado ( K = cara e C = coroa) OBS: em P(X = x), a natureza funcional da v.a. foi suprimida. De fato, a expressão mais correta seria P(    | X(  ) = x ). por definição, os valores de uma v.a. são sempre mutuamente exclusivos 5

6 Variável Aleatória Discreta Definição: uma v.a. é discreta quando o conjunto de valores possíveis (imagem) for finito ou infinito numerável. P(X = x i )  0 para todo i Função de Probabilidade Função de Distribuição Acumulada para todo j onde x j  x P(X = x 2 ) x2x2 x F(x)F(x) 1 0 x f(x)f(x) 0 P(X ≤ x 3 ) x3x3 6

7 Variável Aleatória Discreta Exemplos: a)jogar um dado X : ponto obtido no dado X = {1, 2, 3, 4, 5, 6} X : = 1 se ponto for igual a 6 X: = 0 caso contrário X = {0, 1} b)jogar 5 moedas (ou uma moeda 5 vezes) X : número de caras em 5 lances X = {0, 1, 2, 3, 4, 5} c)jogar uma moeda até tirar uma cara X : número de jogadas até tirar uma cara (incluindo-se a cara) X = {1, 2, 3,...} X : número de coroas até tirar uma cara X = {0, 1, 2,...} 7

8 Variável Aleatória Discreta Exemplos: d)sortear um ponto de uma imagem (8bits) X : valor de nível de cinza X = {0, 1,..., 255} X : = 1 se valor de nível de cinza for menor que 100 X: = 0 caso contrário X = {0, 1} e)sortear 5 pontos em um mapa pedológico X : número de pontos correspondentes à classe Argissolo X = {0, 1, 2, 3, 4, 5} f)sortear pontos em um mapa de vegetação até que se encontre a classe Cerrado X : número de pontos sorteados (incluindo-se o ponto da classe Cerrado) X = {1, 2, 3,...} X : número de pontos sorteados (excluindo-se o ponto da classe Cerrado) X = {0, 1, 2,...} 8

9 Variável Aleatória Contínua Definição: uma v.a. é contínua quando o conjunto de valores possíveis (imagem) for inumerável. Se o conjunto imagem é inumerável, não há sentido em falar de valores específicos e portanto: P(X = x) = 0 Qual a probabilidade de se escolher uma pessoa qualquer com 1,7567234309... metros de altura? 9

10 Variável Aleatória Contínua Definição: uma v.a. é contínua quando o conjunto de valores possíveis (imagem) for inumerável. Função de Distribuição Acumulada Se o conjunto imagem é inumerável, não há sentido em falar de valores específicos e portanto: P(X = x) = 0 Função Densidade de Probabilidade (fdp) P(a < X < b)  0 x f(x)f(x) ab 0 x 0 F(x)F(x) 1 c P(X < c) 10

11 Variável Aleatória Contínua Exemplos: a) X : distância entre dois pontos X = [0,+  [ b) X : distância vertical de um ponto, relativa a uma superfície plana pré-definida X = ]- ,+  [ c) X : reflectância de um objeto X = [0,1] 11

12 Caracterização de uma Variável Aleatória XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 Variável X Variável Y YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 12

13 Medidas de Tendência Central Calcular o ponto de equilíbrio da distribuição Média  XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 13

14 YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 Medidas de Tendência Central Calcular o ponto de equilíbrio da distribuição Média  14

15 Medidas de Tendência Central Média v.a. discretas v.a. contínuas 15

16 Medidas de Tendência Central mediana = 2 YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 Y P(Y  y)P(Y  y) 10,10 20,55 30,77 40,92 50,98 61,00 Identificar o ponto que divide a distribuição em duas partes iguais (equiprováveis) Mediana 16

17 XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 X P(X  x)P(X  x) 1 20,25 30,50 40,75 50,90 61,00 Medidas de Tendência Central mediana = 3,5 Identificar o ponto que divide a distribuição em duas partes iguais (equiprováveis) Mediana 17

18 Medidas de Tendência Central Mediana v.a. discretas v.a. contínuas 18

19 Medidas de Tendência Central Identificar o(s) valor(es) que ocorre(m) com a maior frequência Moda moda = 2 YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 19

20 Medidas de Tendência Central Identificar o valor mais freqüente Moda moda = {3, 4} XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 OBS: 2 modas (bimodal) 3 modas (trimodal) muitas modas (multimodal) não definida modas “locais” 20

21 Medidas de Tendência Central Moda v.a. discretas v.a. contínuas 21

22 Caracterização de uma Variável Aleatória XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 Variável X Variável Y YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 22

23 Medidas de Dispersão X máx - X mín = 5 Analisar a variação total da v.a. Amplitude Total Y máx - Y mín = 5 23

24 XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 Medidas de Dispersão Analisar os desvios da v.a. em relação à média 0 =  = 1 X -  XP(X = x) -2,510,10 -1,520,15 -0,530,25 0,540,25 1,550,15 2,560,10 24

25 XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 Medidas de Dispersão Analisar os desvios absolutos da v.a. em relação à média 1,2 |X -  | XP(X = x) 2,510,10 1,520,15 0,530,25 0,540,25 1,550,15 2,560,10 Desvio Absoluto Médio 25

26 YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 Medidas de Dispersão Analisar os desvios absolutos da v.a. em relação à média 0,948 |Y -  | YP(Y = y) 1,6810,10 0,6820,45 0,3230,22 1,3240,15 2,3250,06 3,3260,02 Desvio Absoluto Médio 26

27 Medidas de Dispersão Desvio Absoluto Médio v.a. discretas v.a. contínuas OBS: apresenta o inconveniente de ser de difícil manipulação matemática 27

28 Medidas de Dispersão Analisar os desvios quadráticos da v.a. em relação à média 2,05 Variância (  2 ) XP(X = x) 10,10 20,15 30,25 4 50,15 60,10 (X -  ) 2 XP(X = x) 6,2510,10 2,2520,15 0,253 4 2,2550,15 6,2560,10 28

29 Medidas de Dispersão Analisar os desvios quadráticos da v.a. em relação à média 1,318 Variância (  2 ) YP(Y = y) 10,10 20,45 30,22 40,15 50,06 60,02 (Y -  ) 2 YP(Y = y) 2,82210,10 0,46220,45 0,10230,22 1,74240,15 5,38250,06 11,02260,02 29

30 Medidas de Dispersão Variância v.a. discretas v.a. contínuas OBS: Desvio Padrão (  ) é a raiz quadrada da Variância (  possui a mesma unidade de X ) 30

31 Medidas de Dispersão Quando duas ou mais variáveis são comparadas quanto a sua dispersão, a variância (ou o desvio padrão) não pode ser utilizada se estas variáveis possuem diferentes unidades. Exemplo: X é altura (m) e Y é biomassa (kg) Neste caso, adota-se uma medida adimensional: Coeficiente de Variação. mede a variação relativa a média. adimensional. pode ser expresso em porcentagem (pode ter valores maiores que 100%). não pode ser utilizado quando  = 0 31

32 Momentos v.a. discretav.a. contínua Momento (ordinário) de ordem k: Momento centrado (na média) de ordem k v.a. discretav.a. contínua OBS: média = 1 o momento = esperança (matemática) = valor esperado de X variância = 2 o momento centrado = esperança da diferença quadrática de X em relação a média Uma v.a. pode também ser caracterizada através dos momentos, calculados a partir de sua distribuição lê-se: k -ésimo momento de X ou Esperança (matemática) da k -ésima potência de X 32

33 Outras medidas 33 Quantil quartil ( Q i ): divide a distribuição em 4 partes (mediana = 2 o quartil) distância interquartil: 3 o quartil - 1 o quartil (prob = 50%) decil ( D i ): divide a distribuição em 10 partes (mediana = 5 o decil) percentil ( P i ): divide a distribuição em 100 partes (mediana = 50 o percentil) Curtose (achatamento) Assimetria (obliquidade) C = 3 ou C ' = 0,263 mesocúrtica (distr. Normal) A = 0 ou A ' = 0 simétrica A < 0 ou A ' < 0 assimétrica à esquerda (média < mediana < moda) A > 0 ou A ' > 0 assimétrica à direita (média > mediana > moda) OBS: Excesso de curtose = C  3 ou C '  0,263 ( mede a diferença em relação à distr. Normal) C < 3 ou C ' < 0,263 platicúrtica C > 3 ou C ' > 0,263 leptocúrtica

34 Assimetria e Curtose 34 C = 3 (mesocúrtica) A = 0 (simétrica) média mediana moda C = 1,99 (platicúrtica) A = 0 (simétrica) média mediana moda C = 4,77 (leptocúrtica) A = -1,19 (assimétrica à esquerda) C = 5,01 (leptocúrtica) A = 0 (simétrica) média mediana moda C = 4,77 (leptocúrtica) A = 1,19 (assimétrica à direita)

35 Transformação e Combinação de V.A. Suponha que uma v.a. seja obtida através de uma transformação de uma outra v.a. ou através da combinação de várias v.a., é possível conhecer a média (esperança) e a variância desta nova v.a. em função da(s) média(s) e variância(s) da(s) v.a. da(s) qual(is) ela se originou? Principais transformações/combinações: onde o e g são constantes 35

36 Propriedades da Esperança e Variância Ex: + 3 = X123456 P(X = x)0,100,150,25 0,150,10 Y456789 X123456 P(X = x)0,100,150,25 0,150,10 36

37 Propriedades da Esperança e Variância 37

38 Propriedades da Esperança e Variância Ex: X123456 P(X = x)0,100,150,25 0,150,10 Y369121518 X123456 P(X = x)0,100,150,25 0,150,10 * 3 * 9 = 3 2 38

39 Propriedades da Esperança e Variância 39

40 Y = {?,..., ?}Y = {2,..., 12} Propriedades da Esperança e Variância X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 123456 1234567 2345678 3456789 45678910 56789 11 6789101112 X W 123456P(W = w i ) 10,10 20,45 30,22 40,15 50,06 60,02 P(X = x i )0,100,150,25 0,150,101 X W Distribuição Conjunta de X e W 40

41 Propriedades da Esperança e Variância considerando que X e W sejam independentes X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 Y = {?,..., ?}Y = {2,..., 12} 123456 1234567 2345678 3456789 45678910 56789 11 6789101112 X W 123456P(W = w i ) 1 0,0100,0150,025 0,0150,010 0,10 2 0,0450,06750,1125 0,06750,045 0,45 3 0,0220,0330,055 0,0330,022 0,22 4 0,0150,02250,0375 0,02250,015 0,15 5 0,0060,0090,015 0,0090,006 0,06 6 0,0020,0030,005 0,0030,002 0,02 P(X = x i )0,100,150,25 0,150,101 X W Distribuição Conjunta de X e W 41

42 Propriedades da Esperança e Variância X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 - - - - - - - 42

43 Propriedades da Esperança e Variância X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 covariância entre X e W 43

44 Propriedades da Esperança e Variância X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 44

45 Propriedades da Esperança e Variância X123456 P(X = x)0,100,150,25 0,150,10 W123456 P(W= w)0,100,450,220,150,060,02 --- - - - + - - se X e W são independentes: 45

46 Propriedades da Esperança e Variância Resumo: (independentes) 46

47 Brilho e Contraste Média: 29,07 Variância: 62,14 Imagem original ( I ) Banda TM3/Landsat Em Processamento de Imagens, é comum se referir à média como brilho e variância como contraste. Uma imagem de baixo brilho é uma imagem escura, ou seja, sua média é baixa. Por outro lado, uma imagem de alto brilho é uma imagem clara, com média alta. Uma imagem de baixo contraste é uma imagem cujos alvos são de difícil distinção, possuindo baixa variância. Por outro lado, uma imagem de alto contraste possui alvos bem distintos (objetos claros e escuros), possuindo assim alta variância. 47

48 Brilho e Contraste Média: 79,07 Variância: 62,14 Média: 129,07 Variância: 62,14 Média: 29,07 Variância: 62,14 Imagem original ( I ) Banda TM3/Landsat I nova = I + 50 I nova = I + 100 48

49 Brilho e Contraste Média: 58,14 Variância: 248,55 Média: 116,29 Variância: 994,21 Média: 29,07 Variância: 62,14 Imagem original ( I ) Banda TM3/Landsat I nova = 2*I I nova = 4*I 49

50 Média: 35,36 Variância: 1553,45 I nova = 5*I - 110 Brilho e Contraste Média: 224,64 Variância: 1553,45 Média: 29,07 Variância: 62,14 Imagem original ( I ) Banda TM3/Landsat I nova = -5*I + 370 50

51 Aplicações em Imagens Exemplo 1: Tem-se uma imagem qualquer com média 100 e variância 150. Deseja- se aumentar o contraste dessa imagem, aumentando-se sua variância para 600. Qual deve ser o ganho aplicado nessa imagem? Qual será a média da imagem após a aplicação desse ganho? I nova = gI + o alterar brilho (média) alterar contraste (variância) 51

52 Aplicações em Imagens Exemplo 2: Tem-se uma imagem qualquer com média 100 e variância 150. Deseja- se aumentar o contraste dessa imagem, aumentando-se sua variância para 600, sem alterar seu brilho (ou seja, mantendo a média em 100). Quais devem ser o ganho e o offset aplicados nessa imagem? I nova = gI + o alterar brilho (média) alterar contraste (variância) 52

53 Aplicações em Imagens A aplicação de um ganho e um offset sobre uma imagem representada por inteiros como, por exemplo, imagens de 8 bits (256 níveis de cinza), pode resultar em valores não inteiros. 53 Observações: Se I = 78 então I nova = 54,92 Este resultado pode ser convertido para inteiro por truncamento ou por arredondamento, ou seja, para 54 ou 55 respectivamente O resultado pode estar fora do escopo permitido para aquele tipo de imagem Se I = 249 então I nova = 275,51 Se I = 10 então I nova = -32,8 Geralmente, estes resultados são “saturados” no zero (se negativo) ou 255 (se maior que 255 ). Nesses casos, os valores de média e variância da imagem resultante podem não corresponder aos valores teóricos. Exemplo:

54 Aplicações em Imagens 54 MinMaxMédiaDesv.Pad. TM5823588,1034,30 TM41514581,4716,95 TM33221251,2816,09 ganhooffset TM51,903-89,440 TM43,400-163,200 TM33,355-104,013 TeóricoMinMaxMédiaDesv.Pad. TM5-74,22357,7678,2265,27 TM4-112,20329,80113,8157,64 TM33,36607,3068,0453,98 RealMinMaxMédiaDesv.Pad. TM5025580,2961,44 TM40255118,1944,04 TM3325567,7553,82


Carregar ppt "Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2016 Variáveis Aleatórias Camilo Daleles Rennó"

Apresentações semelhantes


Anúncios Google