Tratamento de Infomações

Slides:



Advertisements
Apresentações semelhantes
Separatrizes As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem ou separam a distribuição em partes iguais.
Advertisements

A CARTOGRAFIA TEMÁTICA E A ESTATÍSTICA
Estatística Descritiva Aula 02
Introdução à Estatística
Estatística 2 – Estatística Descritiva
Capítulo 5 Medidas Descritivas.
ALGUMAS MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS
Medidas de Posição Profa. Rossana Fraga Benites.
Estatística Marco Antônio.
Estatística Descritiva
Estatística e Probabilidade
Estatística Descritiva
Aula 0. Doces Lembranças de MAE0219
Estatística Descritiva (I)
MBA em Gestão de Empreendimentos Turísticos
Estatística Descritiva
ESTATÍSTICA DECRITIVA
SÉRIES ESTATÍSTICAS TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. De acordo com a Resolução.
Capítulo 10 - Estatística 10.1 Introdução:
ACOMPANHAMENTO ESTATÍSTICO DA QUALIDADE DO PRODUTO.
Medidas Descritivas ESTATISTICA Aula 5 PROF: CÉLIO SOUZA.
Descrição e Apresentação de Dados
Matemática Financeira
CURSO DE ARQUIVOLOGIA CCBSA - UEPB – Campus V
Parte II - Moda e Mediana
Estatística Descritiva
Série Geográfica (espaço).
Medidas Descritivas ESTATISTICA Aula 5 PROF: CÉLIO SOUZA.
MEDIDAS DE VARIABILIDADE, ASSIMETRIA E CURTOSE
Estatística Descritiva
GRÁFICOS ESTATÍSTICOS
Medidas Descritivas ESTATISTICA Aula 5 PROF: CÉLIO SOUZA.
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Definição de Estatística
Medidas Estatísticas.
Separatrizes Quartis Decis Percentis TIPOS:
Estatística Descritiva
BIOESTATÍSTICA Profª. Lúcia Helena Sagrillo Pimassoni Unidade 3
Noções de Estatística - I
Metodologia da Pesquisa em Ensino de Ciências I
IV - Descrição e Apresentação dos Dados
Estatística Descritiva
Introdução à Estatística
ESTASTÍSTICA APLICADA
Probabilidade Análise Exploratória de Dados: Medidas de Centro
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
Estatística Básica usando o José CARDOSO Neto Professor Associado Departamento de Estatística - UFAM 26 a 30 de outubro de 2015 IX.
MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
Matemática Financeira
1 Estatística Descritiva (I). 2 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação.
MEDIDAS DE POSIÇÃO MÉDIAS MODA MEDIANA QUARTIS PERCENTIS.
Freqüências simples ou absoluta:
MEDIDAS DE TENDÊNCIA CENTRAL
ESTATÍSTICA.
Variância A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios (lembremos que.
Professor: Jerry A. Domingos
MEDIDAS DE POSIÇÃO Representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal. As medidas de posições.
ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
Prof. Josenildo dos Santos MÉTODOS QUANTITATIVOS APLICADOS ÀS CIÊNCIAS CONTÁBEIS CONTABILIDADE ESTRATÉGICA 2º MÓDULO.
MIM 2011/2012 FMUC ESTATÍSTICA DESCRITIVA Bárbara Oliveiros Biomatemática.
Módulo 1 Estatística Básica.
Estatística Aplicada à Administração Prof. Alessandro Moura costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Profª Juliana Schivani MEDIDAS.
Marcos Antonio Estremote – Aula 2.  Estatística Descritiva:  Resumo ou descrição das características importantes de um conjunto conhecido de dados populacionais.
Profª Juliana Schivani MEDIDAS.
Profª Juliana Schivani MEDIDAS.
Utiliza-se a MoP para a análise da assimetria
MEDIDAS DESCRITIVAS Professor: Moisés Alberto Calle Aguirre.
Transcrição da apresentação:

Tratamento de Infomações Econômico-Fiscais

Departamento de Estatística Prof. Lorí Viali, Dr. Destat Departamento de Estatística

viali@pucrs.br www.pucrs.br/~viali/ 15 154 3320-3531 Ramal: 217

Conceitos Básicos

Coleção de números = estatísticas O número de carros vendidos no país aumentou em 30%. A taxa de desemprego atinge, este mês, 7,5%. As ações da Telebrás subiram R$ 1,5, hoje. Resultados do Carnaval no trânsito: 145 mortos, 2430 feridos.

Estatística: uma definição A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores decisões.

Estatística (divisão) Os procedimentos usados para organizar, resumir e apresentar dados numéricos. Descritiva A coleção de métodos e técnicas utilizados para estudar uma população baseado em amostras probabilísticas desta população. Indutiva

POPULAÇÃO Uma coleção de todos os possíveis elementos, objetos ou medidas de interesse.

CENSO Um levantamento efetuado sobre toda uma população é denominado de levantamento censitário ou simplesmente censo.

AMOSTRA Uma porção ou parte de uma população de interesse.

AMOSTRAGEM O processo de escolha de uma amostra da população é denominado de amostragem.

Univariada Multivariada PROBABILIDADE (Matemática) ESTATÍSTICA Trabalha com uma única característica dos dados PROBABILIDADE (Matemática) Univariada ESTATÍSTICA (Matemática Aplicada) Multivariada Trabalha com duas ou mais características dos dados

POPULAÇÃO (Censo) Erro Inferência B A I L D E Inferência AMOSTRA (Amostragem)

Estatística Descritiva Probabilidade Amostragem Estatística Indutiva

Estatística x Probabilidade Faces Probabilidades Freqüências 1 1/6 15 2 18 3 23 4 25 5 22 6 17 Total 120

O erro deve ser evitado ou então minimizado. Arredondamento Todo arredondamento é um erro. O erro deve ser evitado ou então minimizado.

Arredondar sempre para o mais próximo. Arredondamento Regra básica: Arredondar sempre para o mais próximo.

Exemplos: 1,456 1,45 1,46 1,454 1,475 1,48 1,485 1,48 É ímpar Aumenta Não aumenta

NOMINAL QUALITATIVAS ORDINAL DISCRETA QUANTITATIVAS CONTÍNUA Á E S NOMINAL QUALITATIVAS ORDINAL DISCRETA QUANTITATIVAS CONTÍNUA

Variável Qualitativa NOMINAL ORDINAL Sexo Religião Estado civil Curso Conceito Grau de Instrução Mês Dia da semana ORDINAL

Variável Quantitativa Número de faltas Número de irmãos Número de acertos DISCRETA Altura Área Peso Volume CONTÍNUA

Estatística Descritiva

ESTATÍSTICA DESCRITIVA Conjunto de dados: Amostra ou População Organização; Resumo; Apresentação.

Tendência ou posição central Um conjunto de dados é resumido de acordo com as seguintes características: Amostra ou População Tendência ou posição central Dispersão ou variabilidade Assimetria (distorção) Achatamento ou curtose

Tendência ou Posição Central Aritmética Geométrica Harmônica Quadrática Interna S i m p l e s As médias (a)

A média Aritmética

A média Geométrica

A média Harmônica

A média Quadrática

A média Interna É a mesma média aritmética só que aplicada sobre o conjunto onde uma parte dos dados (extremos) é descartada.

Exemplo Conjuntos mg mh 4 6 5 4,9 4,8 1 9 3 1,8 Médias

Relação entre as médias Dado um conjunto de dados qualquer, as médias aritmética, geométrica e harmônica mantém a seguinte relação:

Tendência ou Posição Central Aritmética Geométrica Harmônica Quadrática P o n d e r a s As médias (a)

A média Aritmética Ponderada

A média Geométrica Ponderada

A média Harmônica Ponderada

A média Quadrática Ponderada

-- Exemplo Produtos 12 2 20 Carne Cana Ceva Pão Total p01 p02 q 4,80 5,52 5 Cana 5,20 4,94 1 Ceva 0,80 0,92 12 Pão 1,50 2,10 2 Total -- 20

-- Exemplo P 1 2 3 4 Total p01 p02  p(0,t) 4,80 5,52 0,57 1,15 5,20 4,94 0,12 0,95 3 0,80 0,92 0,23 4 1,50 2,10 0,07 1,40 Total -- 1,00

Exemplo Média aritmética ponderada dos relativos (aumentos) será: Por este critério o aumento foi de 14,31%.

Exemplo Média geométrica ponderada dos relativos (aumentos) será: Por este critério o aumento foi de 13,90%.

Exemplo Média harmônica ponderada dos relativos (aumentos) será: Por este critério o aumento foi de 13,48%.

Tendência ou Posição Central A mediana (median) (b) É o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. me = [x(n/2) + x(n/2)+1]/2 se “n” é par me = x(n+1)/2 se “n” é ímpar

Tendência ou Posição Central Separatrizes (b) A idéia de repartir o conjunto de dados pode ser levada adiante. Se ele for repartido em 4 partes tem-se os QUARTIS, se em 10 os DECIS e se em 100 os PERCENTIS.

Exemplo Considere o seguinte conjunto: 1 -1 0 4 2 5 3 1 -1 0 4 2 5 3 Como n = 7 (ímpar), então x(n+1)/2 = x4 Ordenando o conjunto, tem-se: -1 0 1 2 4 3 5 Então: me = x4 = 2

Exemplo Se o conjunto for: 1 -1 0 4 2 5 3 -2 1 -1 0 4 2 5 3 -2 Tem-se: n = 8 (par) Então me = [xn/2+xn/2+1)]/2 = (x4 + x5)/2 Ordenando o conjunto, tem-se: -2 -1 0 1 2 3 4 5 me = (x4 + x5)/2 = (1 + 2)/2 = 1,50

Tendência ou Posição Central A moda (mode) É o(s) valor(es) do conjunto que mais se repete(m).

Exemplo Considere o conjunto 0 1 1 2 2 2 3 5 Então: mo = 2 0 1 1 2 2 2 3 5 Então: mo = 2 Pois, o dois é o que mais se repete (três vezes).

Exemplo Considere o conjunto: 0 1 1 2 2 3 5 Então: mo = 1 e mo = 2 0 1 1 2 2 3 5 Então: mo = 1 e mo = 2 Conjunto bimodal

Exemplo Considere o conjunto: 0 1 2 3 4 5 7 0 1 2 3 4 5 7 Este conjunto é amodal, pois todos os valores apresentam a mesma freqüência.

Dispersão ou Variabilidade (a) A amplitude (h) (b) O Desvio Médio (dma) (c) A Variância (s2) (d) O Desvio Padrão (s) (e) A Variância Relativa (g2) (f) O Coeficiente de Variação (s)

A Amplitude (range) h = xmáx - xmín Considere o conjunto: -2 -1 0 3 5 -2 -1 0 3 5 h = 5 – (-2) = 7

O dma (average deviation) Considere o conjunto: -2 -1 0 3 5 A média é:

Calculando os desvios: Tem-se: d1 = -2 – 1 = -3 d2 = -1 – 1 = -2 d3 = 0 – 1 = -1 d4 = 3 – 1 = 2 d5 = 5 – 1 = 4

Como pode ser visto a soma é igual a zero. Tomando o módulo vem:

A variância (variance) Se ao invés de tomar o módulo, elevarmos ao quadrado, tem-se:

A variância (variance) A variância de um conjunto de dados será:

É a raiz quadrada da variância O Desvio Padrão (standard deviation) É a raiz quadrada da variância

Se extrairmos a raiz quadrada teremos do resultado anterior teremos o desvio padrão:

O Coeficiente de Variação A Variância Relativa O Coeficiente de Variação

O coeficiente de variação do exemplo anterior, será:

Tratamento de Grandes Conjuntos de Dados

Grande Conjuntos de Dados Organização; Resumo; Apresentação. Amostra ou População

Dados Brutos Variável qualitativa

Defeitos em uma linha de produção Lascado Menor Desenho Maior Torto Esmalte ................... ....................

* Variável qualitativa * Dados organizados em uma distribuição de freqüências * Variável qualitativa *

Distribuição de freqüências Defeito Freqüência % Desenho 71 14,20 Esmalte 95 19,00 Lascado 97 19,40 Maior 70 14,00 Menor 83 16,60 Torto 57 11,40 Trincado 27 5,40 TOTAL 500 100

Freqüências (Tipos)

Absoluta SIMPLES Decimal Relativa Percentual Decimal Percentual Apresentação Apresentação FREQÜÊNCIAS Absoluta SIMPLES Decimal Relativa Percentual Absoluta ACUMULADAS Decimal Relativa Percentual

Freqüências: representação Valores fi Fi fri Fri 60 0,30 30 1 50 110 0,25 25 55 2 40 150 0,20 20 75 3 180 0,15 15 90 4 10 190 0,05 5 95 6 196 0,03 98 200 0,02 100 TOTAL — 1,00

Representação gráfica Diagrama de torta ou pizza (Pie Chart)

Dados Brutos Variável discreta

Número de irmãos dos alunos da turma 450 - Estatística - PUCRS - 2002/02 1 6 3 4 5 2

Distribuição de freqüências por ponto ou valores

Distribuição de freqüências por ponto ou valores da variável: “Número de irmãos dos alunos da turma 450” da disciplina: Probabilidade e Estatística PUCRS - 2002/02.

N0 de irmãos N0 de alunos 7 1 21 2 8 3 5 4 6  50

* Diagrama de colunas simples * Representação gráfica * Diagrama de colunas simples *

Diagrama de colunas simples da variável: Número de irmãos dos alunos da turma 450 Disciplina: Estatística, PUCRS - 2002/02

Resumo de uma Distribuição de freqüências por ponto ou valores

Medidas de tendência ou posição central

A média Aritmética Neste caso, a média a dada por:

Exemplo xi fi fixi 7 1 21 2 8 16 3 5 15 4 6 12  50 95

A média será, então:

A Mediana Como n = 50 é par, tem-se:

Exemplo Total de dados n = 50 (par) xi fi Fi 7 1 21 28 2 8 36 3 5 41 4 7 1 21 28 2 8 36 3 5 41 4 45 48 6 50  — Metade dos dados n/2 = 25

mo = valor(es) que mais se repete(m) A Moda mo = valor(es) que mais se repete(m)

Pois ele se repete mais vezes Exemplo xi fi 7 1 21 2 8 3 5 4 6  50 Pois ele se repete mais vezes A moda é igual a 1 (um)

Medidas de dispersão ou variabilidade

A Amplitude h = xmáx - xmín h = 6 - 0 = 6 irmãos

O Desvio Médio Neste caso, o dma será dado por:

Exemplo xi fi fi|xi - | 7 7.|0 – 1,90| = 13,30 1 21 7 7.|0 – 1,90| = 13,30 1 21 21.|1 – 1,90| = 18,90 2 8 8.|2 – 1,90| = 0,80 3 5 5.|3 – 1,90| = 5,50 4 4.|4 – 1,90| = 8,40 3.|5 – 1,90| = 9,30 6 2.|6 – 1,90| = 8,20  50 64,40

O dma será, então:

A Variância Neste caso, a variância será:

Exemplo xi fi fixi2 7 02.7 = 0 1 21 12.21 = 21 2 8 22.8 = 32 3 5 32.5 = 45 4 42.4 = 64 52.3 = 75 6 62.2 = 72  50 299

A variância será, então:

O desvio padrão será dado por:

O Coeficiente de Variação Dividindo a média pelo desvio padrão, tem-se o coeficiente de variação:

Dados Brutos Variável contínua

Idade (em meses) dos alunos da turma 450 da disciplina: Probabilidade e Estatística PUCRS - 2002/02

276 245 345 240 270 310 368 334 268 288 336 299 236 239 355 330 287 344 300 244 303 248 251 265 246 240 320 308 299 312 324 289 320 264 252 298 315 255 274 264 263 230 303 369 247 266 275 281 230 234

Distribuição de freqüências por classes ou intervalos

Distribuição por classes ou intervalos da variável “idade dos alunos da turma 450” da disciplina: Probabilidade e Estatística da PUCRS - 2002/02

Idades Número de alunos 230 |--- 250 12 250 |--- 270 9 270 |--- 290 8 290 |--- 310 7 310 |--- 330 6 330 |--- 350 5 350 |--- 370 3 Total 50

Representação gráfica * Histograma *

Histograma de freqüências da variável “Idade dos alunos da turma 450” de Probabilidade e Estatística da PUCRS - 2002/02

Medidas

Antes de apresentar as medidas, i Antes de apresentar as medidas, i. é, representantes do conjunto, é necessário estabelecer uma notação para alguns elementos da distribuição.

Simbologia

xi = ponto médio da classe; fi = freqüência simples da classe; lii = limite inferior da classe; lsi = limite superior da classe; hi = amplitude da classe.

O Ponto Médio da Classe xi fi 230 |--- 250 12 240 250 |--- 270 9 260 230 |--- 250 12 240 250 |--- 270 9 260 270 |--- 290 8 280 290 |--- 310 7 300 310 |--- 330 6 320 330 |--- 350 5 340 350 |--- 370 3 360  50 —

Medidas de tendência ou posição central

A Média da Distribuição xi fi fi. xi 240 12 2880 260 9 2340 280 8 2240 300 7 2100 320 6 1920 340 5 1700 360 3 1080  50 14260

Exemplo A média será:

A Mediana Neste caso, utilizam-se as freqüências acumuladas para identificar a classe mediana, i. é, a que contém o(s) valor(es) central(is).

Exemplo Total de dados n = 50 (par) xi fi Fi 230 |--- 250 12 230 |--- 250 12 250 |--- 270 9 21 270 |--- 290 8 29 290 |--- 310 7 36 310 |--- 330 6 42 330 |--- 350 5 47 350 |--- 370 3 50  — Metade dos dados n/2 = 25

Portanto, a classe mediana é a terceira. Assim i = 3 Portanto, a classe mediana é a terceira. Assim i = 3. A mediana será obtida através da seguinte expressão:

A Moda Neste caso é preciso inicialmente apontar a classe modal, i. é, a de maior freqüência. Neste exemplo é a primeira com fi = 12. Assim i = 1.

Exemplo i xi fi 1 230 |--- 250 12 2 250 |--- 270 9 3 270 |--- 290 8 4 230 |--- 250 12 2 250 |--- 270 9 3 270 |--- 290 8 4 290 |--- 310 7 5 310 |--- 330 6 330 |--- 350 350 |--- 370 —  50 Classe modal, pois fi = 12.

Portanto a moda poderá ser obtida através de uma das seguintes expressões:

Critério de King:

Critério de Czuber:

Medidas de dispersão ou variabilidade

A Amplitude h = xmáx - xmín h = 370 - 230 = 140 meses

O Desvio Médio Absoluto Neste caso, o dma será dado por:

Exemplo xi fi fi.|xi - | 240 12 12.|240 – 285,20| = 542,40 260 9 9.|260 – 285,20| = 226,80 280 8 8.|280 – 285,20| = 41,60 300 7 7.|300 – 285,20| = 103,60 320 6 6.|320 – 285,20| = 208,80 340 5 5.|340 – 285,20| = 274,00 360 3 3.|360 – 285,20| = 224,40  50 1621,60

O dma será, então:

A Variancia Neste caso, a variância será:

Exemplo xi fi fi. xi2 240 12 12.2402 = 691200 260 9 9.2462 = 608400 280 8 8.2802 = 627200 300 7 7.3002 = 630000 320 6 6.3202 = 614400 340 5 5.3402 = 578000 360 3 3.3602 = 388800  50 4 138 000

A variância será, então:

O desvio padrão será dado por:

O Coeficiente de Variação Dividindo a média pelo desvio padrão, tem-se o coeficiente de variação:

Medidas de Assimetria (Distorção) Skewness

Primeiro Coeficiente ( de Pearson) a1 = (Média - Moda) / Desvio Padrão Segundo Coeficiente ( de Pearson) a2 = 3.(Média - Mediana) / Desvio Padrão

CQA =[(Q3 - Q2) - (Q2 - Q1)]/(Q3 - Q1) Coeficiente Quartílico CQA =[(Q3 - Q2) - (Q2 - Q1)]/(Q3 - Q1) Coeficiente do Momento a3 = m3/s3, onde m3 = S(X - )3/n

Coeficiente = 0 Conjunto Simétrico Provão 2000 Curso: Odonto

Conjunto: Negativamente Assimétrico Coeficiente < 0 Conjunto: Negativamente Assimétrico Provão 2000 Curso: Jornalismo

Conjunto: Positivamente Assimétrico Coeficiente > 0 Conjunto: Positivamente Assimétrico Provão 2000 Curso: Eng. Elétrica

Medidas de Achatamento ou Curtose (Kurtosis)

Coeficiente de Curtose (momentos) a4 = m4/s4, onde m4 = S(X - )4/n

Conjunto: Mesocúrtico Coeficiente = 3 ou 0 Conjunto: Mesocúrtico Provão 2000 Curso: Odonto

Coeficiente > 3 ou (> 0) Conjunto: Leptocúrtico Provão 2000 Curso: Matemática

Coeficiente < 3 ou (< 0) Conjunto: Platicúrtico Provão 1999 Curso: Eng. Civil

Propriedades das Medidas

Suponha que o conjunto de dados “x” sofreu a seguinte transformação: y = a.x + b Então: