A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Mestrado Profissional em Gestão Ambiental

Apresentações semelhantes


Apresentação em tema: "Mestrado Profissional em Gestão Ambiental"— Transcrição da apresentação:

1 Mestrado Profissional em Gestão Ambiental
Simulações Gráficas e Numéricas Interativas Aplicadas ao Meio Ambiente Marco Domingues

2 Introdução à estatística
Definição da estatística. ‰Classificação de dados. ‰Planejamento de experimentos.

3 O QUE É ESTATÍSTICA ? A estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais.

4 O QUE É ESTATÍSTICA ? Estudos observacionais Experimentos
Ex: acompanhar o desempenho produtivo com a aplicação de um plano de manejo sustentável para o solo de uma região. Experimentos Ex: alterar as variáveis do processo de forma proposital para verificar seus efeitos nos resultados.

5 Processo iterativo das pesquisas empíricas ?
Dados Informações Novos conhecimentos, novos problemas

6 Como vamos estudar estatística neste curso?
Técnicas de amostragem e planejamento de experimentos Coleta de observações ou dados Análise exploratória dos dados Extrair informações das observações Estudos probabilísticos Modelar fenômenos aleatórios verificados nos dados observados e explicá-los

7 Como vamos estudar estatística neste curso?
Inferências estatísticas Realizar generalizações da análise de amostras para a população de onde elas foram extraídas. Modelos de simulação computacional Criação de modelos de simulação aplicados a problemas ambientais

8 Algumas definições importantes?
Tipos de experimento Se tomarmos um determinado sólido, sabemos que a uma certa temperatura haverá a passagem para o estado líquido: Experimento Determinístico. Quais as chances das vendas de uma empresa crescerem? Existem dois resultados possíveis: as vendas crescem ou não crescem: Experimento aleatório

9 Algumas definições importantes?
Exemplos O aumento da produção industrial automotiva eleva a percepção de congestionamento urbano: Experimento Determinístico. Estima-se que uma tartaruga marinha bote entre 60 e 120 ovos por ninho. Qual será a quantidade de ovos da próxima ninhada? : Experimento aleatório

10 Algumas definições importantes?
População conjunto de todos os resultados. Amostra subconjunto da população Exemplo: Em um levantamento perguntou-se a 3002 adultos da cidade de Recife se liam as notícias na Internet pelo menos uma vez por semana. 600 adultos responderam sim.

11 Algumas definições importantes?
Parâmetro É uma medida numérica que descreve alguma característica de uma população. Estatística É uma medida numérica que descreve alguma característica de uma amostra.

12 Algumas definições importantes?
Exemplo - Parâmetro Na cidade de Recife há 534 botões que os pedestres podem acionar nos cruzamentos de ruas. Descobriu-se em um levantamento que 77% deles não funcionam. O número 77% é um parâmetro pois se baseia na população inteira dos 534 botões de tráfego para pedestre.

13 Algumas definições importantes?
Exemplo - Estatística Com base numa amostra de 877 executivos pesquisados na cidade de São Paulo, descobriu-se que 45% deles não contratariam alguém que cometesse um erro tipográfico em sua solicitação de emprego. Esse número de 45% é uma estatística, pois se baseia em uma amostra, não na população inteira de todos os executivos.

14 Algumas definições importantes?
Amostragem Processo de seleção de amostra. Amostra aleatória simples O processo de seleção de elementos é feito por sorteio, fazendo com que todos os elementos da população tenham a mesma chance de ser escolhidos.

15 Algumas definições importantes?
Exemplo Considere uma indústria processadora de sucos de frutas. Ao receber um carregamento de laranjas, os técnicos fazem inspeção da qualidade nas frutas. Examinam uma amostra de 5 caixas, tomadas de forma aleatória dentre toda a população de caixas do carregamento.

16 Algumas definições importantes?
Algumas características (ou variáveis) podem ser observadas nas 5 caixas: Classificação das laranjas como: ótima, boa, regular, ruim ou péssima (qualitativo ou categórico) Número de laranjas não aproveitáveis por caixa (quantitativo) Peso de cada caixa de laranja Etc.

17 Algumas definições importantes?
Variável aleatória Pode ser entendida como uma variável quantitativa, cujo resultado depende de fatores aleatórios No exemplo das laranjas, ao contarmos o nº de laranjas não aproveitáveis em cada uma das caixas amostradas, temos um conjunto de 5 valores, digamos {4,6,2,3,0} que corresponde à amostra efetivamente observada da variável aleatória.

18 Algumas definições importantes?
Variável aleatória X = número de laranjas não aproveitáveis por caixa Estimativa – valor resultante do cálculo de uma estatística, quando usado para se ter uma ideia do parâmetro de interesse.

19 Algumas definições importantes?
Média Sejam n observações de uma variável aleatória, a média amostral é dada por

20 Algumas definições importantes?
Média Caso conheçamos todas as possíveis observações de X, a média populacional é dada por

21 Algumas definições importantes?
Desvios Em relação à média (medida de centro) Dados os valores das observações xi Xi - 4 3 1 6 2 -1 -3

22 Algumas definições importantes?
Desvios Em relação à média (medida de centro) 1 2 3 4 5 6

23 Algumas definições importantes?
Graus de Liberdade dos desvios Os valores dos n desvios não são nulos Os desvios têm soma nula Os desvios têm (n – 1) graus de liberdade

24 Algumas definições importantes?
Variância (amostral) Média aritmética dos desvios quadráticos (para eliminar os desvios negativos)

25 Algumas definições importantes?
Variância (populacional) Média aritmética dos desvios quadráticos (para eliminar os desvios negativos)

26 Algumas definições importantes?
Desvio padrão Raíz quadrada da variância e tem a mesma unidade dos dados

27 Algumas definições importantes?
Estimador não enviesado ou não viesado Ex: a média amostral é um estimador não enviesado da média populacional Significa que a média da amostra é um bom representante da média populacional

28 Algumas definições importantes?
Sabe-se que o chumbo tem alguns efeitos adversos à saúde. Foram coletadas medidas das qtde de Pb(em microgramas por metro cúbico) no ar. O máximo permitido é de 1,5µg/m3. Foram coletadas amostras da qtde de chumbo logo após a queda do WTC. 5,40; 1,10; 0,42; 0,73; 0,48; 1,10

29 Algumas definições importantes?
Utilize o R para calcular a média, mediana, moda e ponto médio

30 Operações estatísticas
Média aritmética mean(<nome do vetor>) Mediana median(<nome do vetor>) Desvio padrão sd(<nome do vetor>)

31 Exemplos Média aritmética Mediana Desvio padrão mean(peso) ou
Media = sum (peso) / length (peso) Mediana median(<nome do vetor>) ou hist (peso) Desvio padrão sd(peso) ou mediaPeso= sum (peso) / length (peso) sqrt (sum((peso - mediaPeso) ^ 2)/ (length (peso) - 1))

32 Operações estatísticas
Variância var (<nome do vetor>) Covariância cov(<nome do vetor 1>, <nome do vetor 2>) Correlação cor(<nome do vetor 1>, <nome do vetor 2>) Regressão simples lm (y~x)

33 Missing values Algumas operações podem retornar resultados “inexistentes”, chamados “missing values” Inf: infinito positivo -Inf: infinito negativo NaN: “Not a Number” NA: “Not Available”

34 Missing values Existem funções para testar se algum desses valores foi retornado is.finite(x) is.infinite(x) is.nan(x) onde x pode ser um vetor

35 exemplos is.finite (peso[5]) is.finite (peso[5]/0) is.na (peso[10])

36 Geração de números Uniformes Normais t-Student Qui-Quadrado
runif(n, min, max) Normais rnorm(n, média, desvio padrão) t-Student rt(n, graus de liberdade) Qui-Quadrado rchisq(n, graus de liberdade)

37 Geração de gráficos x=c(1:9) y=c(1:9) plot(x,y)
plot(x,y,xlab="valores de x", ylab="valores de y") plot(x,y,type="l")

38 Geração de gráficos x=rnorm(500,0,1) mean(x) median(x) sd(x) var(x)

39 Lendo arquivos de dados
O arquivo datafile.dat é composto pelos seguintes dados: tamanho_lote homens_hora

40 Lendo arquivos de dados
Ajustando o diretório de trabalho setwd("c:/tmp") Para ler arquivos com nomes de colunas na primeira linha, use dataset <- read.table ("datafile.dat", header=TRUE) Para obter os vetores dataset$tamanho_lote dataset$homens_hora

41 Lendo arquivos – parte II
Ajustando o diretório de trabalho setwd("c:/tmp") Para ler arquivos sem nomes de colunas na primeira linha, use dataset <- scan ("datafile2.dat", what=list (x=0,y=0)) Para obter os vetores dataset$x dataset$y

42 Lendo arquivos de dados
O arquivo datafile3.dat é composto por dados que representam o nome do aluno e a natureza do ensino de nível médio joao publico mario privado cristiano privado maria publico talita privado mariana privado adelia publico monique publico carlos privado bruno privado

43 Lendo arquivos – parte III
Ajustando o diretório de trabalho setwd(“c:/temp") Para ler arquivos com nomes de colunas na primeira linha, use dataset <- scan ("datafile3.dat", what=list (x="",y= "")) trabalho = scan("datafile2.dat", what=list (x=0,y=0)) Para obter os vetores dataset$x dataset$y

44 Lendo arquivos – parte IV
Para ler arquivos separados por vírgula ou ponto e vírgula, use dados <-read.csv("dados.csv", sep=";", dec=",",header=FALSE) Para obter os vetores dados$x dados$y

45 Entrando com dados no R Usando a função edit()
dados <- edit(data.frame())

46 Usando pacotes Carregando um pacote no workspace
library (<nome do pacote>) Site com pacotes de colaboradores Instalando pacotes options (CRAN=" Install.packages (“<nome do pacote>”)

47 Conselhos úteis Ler os manuais no site do projeto CRAN
Usar a página wiki do projeto CRAN Usar ao invés do google Aprender com os errros ?lm dá uma ajuda sobre a função lm. Ler arquivos de help pode ajudar bastante Assine a lista do R ( Crie seu script personalizado de bibliotecas

48 Mestrado Profissional em Gestão Ambiental
Simulações Gráficas e Numéricas Interativas Aplicadas ao Meio Ambiente Marco Domingues


Carregar ppt "Mestrado Profissional em Gestão Ambiental"

Apresentações semelhantes


Anúncios Google