Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2017 Teoria da amostragem Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/

Slides:



Advertisements
Apresentações semelhantes
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Advertisements

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Teoria da amostragem Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Teoria da amostragem Camilo Daleles Rennó
Análise de dados Experimentais: Utilização dos Programas Estatísticos
RISCOS. Processo de identificação de perigos Observação, descrição e a classificação.
Teoria de Filas – Aula 4 Aula de Hoje Variáveis aleatórias contínuas Valor esperado de uma variável aleatória Aula Passada Variáveis aleatórias discretas.
Testes de hipótese com uma amostra. Teste de hipótese  Um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro.
Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1.
Classificação não supervisionada de imagens. Classificação de imagens Consiste na identificação de tipos de cobertura de solos, de acordo com os padrões.
Amostragem Cuidados a ter na amostragem Tipos de amostragem
TÉCNICAS DE AMOSTRAGEM – Unidade 2 Professor Marcelo Menezes Reis
O que é Estatística? Introdução ao CEQ
Estatística aplicada a ensaios clínicos
Comparação de proporções
ESTATÍSTICA AULA 03 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
TABULAÇÃO DE DADOS AULA 3.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Técnicas de Reamostragem Camilo Daleles Rennó
TÉCNICAS DE AMOSTRAGEM AMOSTRAGENS NÃO PROBABILÍSTICAS
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Inferência Estatística Camilo Daleles Rennó
O OBJETIVO FUNDAMENTAL DA DISCIPLINA
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Análise de Agrupamento Camilo Daleles Rennó
Medidas de Dispersão Aula 8.
“ASSOCIAÇÃO EDUCACIONAL FANUEL” GUARDA MIRIM DE TELÊMACO BORBA
HEP 175 – Bioestatística Aula 13 Estimação de uma média populacional com variância conhecida e desconhecida.
Prof. Dr. Adolpho Walter Pimazoni Canton
Profa Dra. Denise Pimentel Bergamaschi
DIFERENÇAS ENTRE PESQUISAS POR AMOSTRAGEM E POPULAÇÃO AULA 2
ESTATÍSTICA Aula 5.
ESTATÍSTICA AULA 06 ANÁLISE EXPLORATÓRIA DE DADOS II – Unidade 4
Probabilidade e Estatística Aplicadas à Contabilidade I
TMEC011 – ESTATÍSTICA APLICADA
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
ESTATÍSTICA AULA 01 CONCEITOS E PLANEJAMENTO DE PESQUISA – Unidade 1
O PROCESSO DE MEDIÇÃO.
Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno
Desenhos de Estudo em Epidemiologia Ocupacional
NOÇÕES DE TESTE DE HIPÓTESES (I)
Ajustamento de Observações
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança (Extra) Camilo Daleles Rennó
TESTES DE HIPÓTESES.
ESTATÍSTICA BÁSICA. Por quê? Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender um conjunto de dados.
CÁLCULOS ESTATÍSTICOS - CE
Planning and Economic Data
Ms.Rosebel Trindade Cunha Prates
9. Testes de Hipóteses Paramétricos
Processamento Digital de Imagens
Introdução às distribuições normais AULA 5. Propriedades de uma distribuição normal Suas média, mediana e moda são iguais. Tem forma de sino e é simétrica.
Ch. 6 Larson/Farber Estatística Aplicada Larson Farber 6 Intervalos de confiança.
Estatística: Conceitos Básicos
AULA 2 ESTATÍSTICA DANIEL PÁDUA.
FUNDAMENTOS DA ESTATÍSTICA
Amostragem: Concepção e Procedimento
Procedimentos antes e após coleta dos dados
CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos
Tópicos a serem desenvolvidos
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Estimação Pontual Camilo Daleles Rennó
Capítulo 8 Seleção da amostra. Capítulo 8 Seleção da amostra.
Tópicos a serem desenvolvidos
Estatística amintas paiva afonso.
Amostragem e estimadores
População e Amostra Estatística Aplicada à Educação
Processo de identificação de riscos Observação, descrição e a classificação.
Noções de Amostragem Denise Duarte Depto de Estatística ICEx- UFMG.
UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Intervalo de Confiança Camilo Daleles Rennó
Prof. Sidomar
Políticas Públicas de Saúde Bioestatística - Amostragem
DETERMINAÇÃO DE PERDAS DE ÁGUA POR SUBMEDIÇÃO COM A UTILIZAÇÃO DO ÍNDICE DE DESEMPENHO DA MICROMEDIÇÃO (IDM)
Curso Superior de Engenharia Elétrica e de Produção Faculdade Maurício de Nassau Cabo Professora: Aline Dantas ESTATÍSTICA.
GRUPO EDUCACIONAL UNIGRANRIO
Transcrição da apresentação:

Estatística: Aplicação ao Sensoriamento Remoto SER 204 - ANO 2017 Teoria da amostragem Camilo Daleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/

Algumas Considerações... É importante ter consciência de que dominar as técnicas estatísticas não é suficiente para garantir o sucesso de uma análise, ou seja, conseguir chegar a conclusões “interessantes”. De forma geral, para que as análises estatísticas sejam válidas, as amostras devem representar a população, ou seja, a menos que discrepâncias ocorram devido ao acaso, as amostras devem reproduzir as mesmas características da população considerando a variável estudada. É fundamental que as amostras sejam obtidas por processos adequados de modo a evitar que erros grosseiros possam comprometer a análise dos dados.

Algumas Considerações... Em muitos casos, é bastante tentador que as observações mais convenientes sejam as selecionadas para compor uma amostra ou então aplicar algum tipo de critério (ou julgamento) no momento dessa seleção. Nesses casos, pode-se introduzir algum tipo de tendência que poderá causar uma super ou subestimativa dos parâmetros de interesse. A identificação (e descrição) desta tendência é quase sempre difícil (ou impossível) de ser feita após a coleta dessas amostras. Assim, para se evitar esse tipo de problema, o ideal é que a seleção das amostras seja feito através de algum processo aleatório, de modo que qualquer elemento da população tenha igual chance de ser escolhido para compor a amostra.

Censo ou Amostragem? Por que fazer Censo? a população é pequena ou amostragem indicada é quase tão grande quanto a população necessita-se de uma precisão completa (não é permitido nenhum erro) os dados de toda população já se encontram disponíveis Por que fazer Amostragem? a população é infinita (ou muito grande) os custos de obtenção das medidas são elevados (análises muito caras) o tempo para caracterização da população é muito longo deseja-se aumentar a representatividade, amostrando-se diferentes subgrupos necessita-se melhorar a precisão das medidas (mais cuidado na obtenção dos dados) a obtenção das medidas requer a destruição das amostras (p. ex: biomassa)

Amostragem Toda amostragem requer planejamento a) O que quero caracterizar neste estudo? algum parâmetro específico (média, variância, etc), distribuição espacial, variação temporal? b) Qual é a unidade amostral apropriada para o estudo? quem é o elemento da população (unidade amostral)? c) Como estas amostras devem ser coletadas? qual é a variabilidade espacial e temporal? quais fatores podem influenciar nos resultados? d) Quantas amostras são necessárias? qual é a precisão exigida? quanto tempo e recurso disponho?

Unidade Amostral A unidade amostral representa a menor entidade identificada na população e é considerada o objeto de estudo. Em um mapa, por exemplo, a unidade amostral pode ser: pontos simples (ou pixels numa imagem) sorteio aleatório é facilitado mesmo com GPS, a localização precisa pode ser difícil de ser alcançada pode induzir a erros em regiões heterogêneas grupos de pontos ou pixels considera a informação contextual minimiza problemas de georreferenciamento deve representar áreas homogêneas (deve-se evitar áreas de transição) deve ser contabilizado como apenas uma observação e portanto deve-se adotar uma medida representativa para o grupo (média, mediana, etc) polígonos (ou objetos) mesmos benefícios encontrados em grupos de pontos dificilmente há correspondência espacial perfeita com a realidade grupos de polígonos útil quando os polígonos são muito pequenos

Tipos de Amostragem Como amostrar? amostragem probabilística X não probabilística Amostragem probabilística: cada elemento da população tem uma probabilidade (não nula) de ser escolhido em geral, todos elementos têm a mesma probabilidade de ser escolhido 02 04 03 01

Tipos de Amostragem Como amostrar? amostragem probabilística X não probabilística Amostragem probabilística: cada elemento da população tem uma probabilidade (não nula) de ser escolhido em geral, todos elementos têm a mesma probabilidade de ser escolhido 39 39 76 01 25 44 36 07 15 29 11 53 82 02 98 09

Tipos de Amostragem Como amostrar? amostragem probabilística X não probabilística Amostragem não probabilística: escolha a esmo (ex: estudo sobre a variabilidade no DAP em talhões de reflorestamento de eucalipto) amostragem restrita aos elementos que se tem acesso (ex: estudo sobre ocorrência de focos de dengue em casas de veraneio) impossibilidade de sorteio (ex: estudo sobre qualidade de água num rio) amostragem intencional ou por julgamento (ex: estudo sobre o comportamento social de machos adultos de muriquis) voluntários (ex: estudo sobre a eficácia de uma nova vacina contra febre amarela)

Amostragem Aleatória Simples Escolhe-se n elementos de uma população de tamanho N amostra = {X1, X2, ..., Xn} Exemplo: escolher 10 pixels de uma imagem 13x17 etapas: rotular cada pixel com um código único sortear aleatoriamente 10 códigos (tabelas ou geradores de números aleatórios) identificar os pixels selecionados OBS: método mais simples rotulação dos elementos pode ser dispendiosa pressupõe população homogênea não garante representatividade pois alguns grupos (mais raros) podem não ser sorteados

Amostragem Aleatória Estratificada Primeiramente a população (N) é dividida em L sub-populações (estratos) com N1, N2, ..., NL elementos. Para cada estrato, escolhe-se ni elementos aleatoriamente, totalizando n elementos. todos iguais proporcionais a Ni tamanho ótimo (considera a variabilidade) Exemplo: escolher 10 pixels de uma imagem 13x17 etapas: selecionar um estrato rotular cada pixel com um código único sortear aleatoriamente ni códigos (tabelas ou geradores de números aleatórios) identificar os pixels selecionados repetir o processo para todos os estratos OBS: garante menor variabilidade garante melhor representatividade pressupõe estratos homogêneos requer conhecimento prévio sobre os estratos

Amostragem Sistemática Se os elementos da população já se encontram ordenados segundo algum critério, pode-se selecionar um elemento qualquer e escolher um “passo” que definirá qual será o próximo elemento escolhido. 1 10 20 passo = 5 Exemplo: escolher pixels de uma imagem 13x17 com passos 5 em x e 4 em y etapas: escolher aleatoriamente um pixel na célula 5x4 superior esquerda com base nesse pixel, definir uma grade com espaçamento de 5x4 elementos identificar os pixels selecionados OBS: amostra-se uniformemente todo o espaço garante-se 1 amostra por célula (5x4 no exemplo acima) pode-se não conseguir o valor exato de amostras pretendidas desaconselhado para ordenações periódicas

Amostragem Sistemática Não Alinhada A ideia é semelhante da amostragem sistemática mas, nesse caso, tenta-se aleatorizar os passos de modo a desalinhar as amostras sorteadas. Ainda assim, garante-se apenas uma amostra para cada célula Exemplo: escolher pixels de uma imagem 13x17 com passos máximos de 5 em x e 4 em y etapas: a cada célula 5x4 da primeira linha, definir um passo em y a cada célula da primeira coluna, definir um passo em x identificar os pixels selecionados

Outras Amostragens Amostragem em múltiplos estágios talhões amostragem sistemática dentro do talhão Amostragem por conglomerados conglomerados amostra-se todos (ou alguns) elementos do conglomerado

Tamanho de Amostra Quanto amostrar? depende: da variabilidade original dos dados (maior variância  maior n) da precisão requerida no trabalho (maior precisão  maior n) do tempo disponível (menor o tempo  menor n) do custo da amostragem (maior o custo  menor n) Em geral, é calculado com base no parâmetro que se deseja estimar e leva em consideração as incertezas inerentes a esta estimação: a) variação “natural” dos dados (variância populacional) b) erros do tipo I e II

Tamanho da Amostra - + - + Média Proporção erro máximo de estimativa Proporção - + erro máximo de estimativa

Tamanho da Amostra Correção para populações finitas (quando a amostra representa mais que 5% da população) n = tamanho de amostra sem correção N = tamanho da população n' = tamanho de amostra corrigido Para média: Para proporção:

Tamanho da Amostra Exemplo: Deseja-se estimar a exatidão de um mapa de modo que o valor estimado não ultrapasse em 8% a exatidão verdadeira (para mais ou para menos), utilizando-se um nível de confiança de 95%. Suponha que a exatidão verdadeira é de 80%. No pior caso (maior variância), a exatidão verdadeira seria de 50%.

Tamanho da Amostra Pode também considerar também o erro  (tipo II) Exemplo para proporção Hipóteses H0 : p = p0 H1: p < p0 p1 H1 p0 H0 Considerando H1verdadeira (p = p1)

Tamanho da Amostra Exemplo: Deseja-se testar se a exatidão de um mapa é no mínimo de 85%, adotando-se 5% de nível de significância. Deseja-se, ainda, fixar a probabilidade em 6% de se aceitar um mapa com 81% de exatidão (erro tipo II). 0,85 H0 0,81 H1 H0 : p = 0,85 H1: p = 0,81