A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Computacional

Apresentações semelhantes


Apresentação em tema: "Estatística Computacional"— Transcrição da apresentação:

1 Estatística Computacional
Docentes: Cristina Martins M. da Graça Temido

2 O que é a Estatística? A Estatística é a ciência que se ocupa de
obtenção de informação sobre características de uma população -- amostra tratamento da amostra inferência para a população a partir da amostra, usando resultados probabilísticos previsão da evolução futura de um fenómeno.

3 Técnicas de amostragem
Amostragem aleatória A amostra é seleccionada, usando algum processo aleatório, a partir de uma listagem de todos os elementos da população Todos os elementos da população têm a mesma probabilidade de fazer parte da amostra Tem as desvantagens relacionadas com as não-respostas Amostragem dirigida A amostra é seleccionada em função da disponibilidade e acessibilidade dos elementos da população ou da opinião de um grupo de conhecedores das características da população (aceitação de um produto que se encontra à venda no local do inquérito - a amostra coincide com os inquiridos que se mostram disponíveis para responder, análise da clareza de um texto didáctico com base na opinião de alguns alunos que o investigador pensa serem típicos da população estudantil a que o texto se dirige) Não ocorrem não-respostas A representatividade da amostra é posta em causa, devido à escolha particular dos inquiridos

4 Alguns métodos de amostragem aleatória
Amostragem aleatória simples A dimensão da amostra é fixada à partida A selecção dos elementos incluídos na amostra é efectuada a partir de uma sequência de números aleatórios (gerados por computador, método da lotaria, etc.) Amostragem sistemática Fixa-se um inteiro k e escolhe-se ao acaso um número m em {1,2,…,k}. A amostra é constituída pelos elementos com os nºs m, m+k, m+2k,... Amostragem estratificada Separam-se os elementos da população em estratos mutuamente exclusivos (sexo, idade, estado civil, profissão…). Selecciona-se uma amostra aleatória simples dentro de cada estrato.

5 Alguns métodos de amostragem aleatória
Amostragem por grupos Quando a população se encontra dividida em grupos que podem ser considerados microcosmos desta, seleccionam-se aleatoriamente alguns grupos e incluem-se na amostra todo os os elementos dos grupos seleccionados (estudo das condições de trabalho numa zona industrial) Amostragem multi-etapas Várias etapas dos processos anteriores (Distrito concelhos, freguesias ruas casas; dentro de cada casa inquirem-se pessoas de forma previamente fixada) Amostragem multi-fásica Selecciona-se aleatoriamente uma amostra e registam-se as respostas a uma primeira pergunta; de seguida averigua-se a disponibilidade ou capacidade de cada um daqueles inquiridos pertencer a uma sub-amostra que responderá a um inquérito mais específico.

6 Estatística descritiva vs inferencial
Estatística Descritiva: conjunto de métodos que visam resumir e descrever os dados obtidos – tabelas, gráficos e características numéricas Estatística Inferencial: conjunto de métodos que permitem fazer inferências para a população a partir de uma amostra.

7 População e Amostra Exemplos:
População (population) – conjunto de indivíduos ou objectos que apresentam uma ou mais características em comum que interessa estudar. Exemplos: A população de alunos da Universidade de Coimbra A hemoglobina no sangue dos Portugueses Amostra (sample) – subconjunto de elementos (unidades amostrais) extraídos – com uma metodologia estatística apropriada – da população. Censo ou recenseamento – amostra coincidente com população

8 Variáveis Variável – característica que pode variar de elemento para elemento de uma população. Uma amostra pode conter mais de uma característica para cada uma das unidades observadas. Exemplo: na população de alunos da Universidade de Coimbra podem interessar várias características dos indivíduos: peso, altura, número de disciplinas em que estão inscritos sexo grau de satisfação com o curso.

9 Tipos de dados Variáveis quantitativas (ou numéricas) – assumem valores intrinsecamente numéricos Exemplos: peso, altura, número de disciplinas em que estão inscritos Variáveis qualitativas (ou categóricas) – assumem valores intrinsecamente não numéricos sexo (nominal) grau de satisfação com o curso (ordinal)

10 Variáveis discretas e contínuas
Variáveis discretas – assumem um conjunto finito ou infinito numerável de modalidades. Exemplos: número de disciplinas em que estão inscritos número de peças observadas até aparecer uma com defeito Variáveis contínuas - assumem valores em intervalos reais. comprimentos, pesos, áreas, tempos, pressão sistólica (medidas)

11 Medidas amostrais Localização média (mean) mediana (median)
moda (mode) média aparada (trimmed mean) Máximo (maximum), Quantil (quantile) Quartil (quartile) Percentil (percentile) Mínimo (minimum)

12 Média A média pode ser pensada como o centro de massa dos valores das observações, ie, o ponto de equilíbrio após dispormos as observações sobre uma régua. Pontos afastados ou erros nas observações podem afastar a média do grosso das observações.

13 Mediana A mediana é a observação central, depois de ordenada a amostra. A mediana é mais robusta que a média a erros ou a observações afastadas.

14 Moda A moda é o valor ou valores tanto ou mais frequentes relativamente aos dois adjacentes Ao contrário do que acontece com a mediana e a média, uma amostra pode possuir mais do que uma moda.

15 Quartis Quartis – são os valores (Q1, Q2 e Q3) que dividem a amostra, depois de ordenada, em quatro partes iguais (ou aproximadamente iguais). Q2 coincide com a mediana.

16 Quantis e Percentis Quantil de ordem p (0≤ p ≤ 1) - é um valor, xp, que divide a amostra em duas partes, tal que à esquerda de xp está a proporção p da amostra e à direita a proporção 1-p. Percentil de ordem k (0≤ k ≤ 100) - é o quantil de ordem k/100

17 Dispersão amplitude (range),
distância inter-quartil (inter-quartile range), variância (variance), desvio padrão (standard deviation), coeficiente de variação (coefficient of variation),

18 Distância inter-quartil – é a diferença entre o 3º e o 1º quartis, Q3 - Q1.
No intervalo que vai de Q1 a Q3 encontram-se 50% das observações (as mais centrais).

19 Variância A variância é a média dos quadrados dos desvios das observações em relação à média da amostra. Habitualmente considera-se uma versão corrigida da variância

20 Desvio padrão Se tomarmos a raiz quadrada da variância obtemos o desvio padrão. Ao contrário da variância, é expresso na mesma unidade das observações. Nos programas de estatística e nas máquinas de calcular o que aparece são as versões corrigidas da variância e do desvio padrão. O desvio padrão e a variância podem ser fortemente afectados por erros ou observações muito afastadas.

21 Coeficiente de variação
O Coeficiente de variação é a razão entre o desvio padrão e a média, v = s / x. Trata-se de uma medida relativa de dispersão e por isso não tem unidades.

22 Coeficiente de assimetria (skweness)
Assimetria positiva Quase simetria Assimetria negativa Coef.ass. > Coef.ass. ~ Coef.ass. <0

23 Tabelas de frequências
Tabelas que resumem a informação contida na amostra: valores observados (ordenados ascendentemente), frequências absolutas e relativas.

24 Gráficos Gráfico circular (Pie) Diagrama de barras Histogramas
Diagramas de extremos e quartis (boxplots)

25 Histogramas Poucas classes Muitas classes

26 Diagrama de extremos e quartis
mediana Q Q3 outliers e extremos

27 Diagrama de extremos e quartis
Assimetria positiva Simetria Assimetria negativa

28 Variáveis bidimensionais
Dados qualitativos versus dados qualitativos Resumo da amostra Tabelas de contingência Diagramas de barras Associação entre as variáveis Nominal versus nominal ou ordinal Coeficiente de contingência de Pearson Coeficiente de contingência V de Cramer Ordinal versus ordinal Coeficiente tau-b de Kendall

29 Variáveis bidimensionais
Dados quantitativos versus quantitativos Resumo da amostra Tabelas de contingência Diagramas de barras Associação entre as variáveis Diagrama de dispersão Coeficiente de correlação de Pearson Recta de regressão


Carregar ppt "Estatística Computacional"

Apresentações semelhantes


Anúncios Google