A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística – Conteúdo Programático

Apresentações semelhantes


Apresentação em tema: "Estatística – Conteúdo Programático"— Transcrição da apresentação:

1 Estatística – Conteúdo Programático
Conceitos básicos de Estatística e suas aplicações População, amostra, variáveis aleatórias Distribuição de freqüência Gráficos e séries estatísticas Medidas de Tendência Central: Separatrizes Medidas de dispersão e assimetria Probabilidade

2 Estatística – Bibliografia
SILVA, ERMES MEDEIROS DA. Estatística: para os cursos de Economia, Administração e Ciências Contábeis. v.1  São Paulo: Altas, 2008 KAZMIER, LEONARD J. Teoria e problemas de Estatística aplicada à Administração e Economia. Porto Alegre: Bookaman, 2007 MORETIN, LUIZ GONZAGA, Estatística Básica:Probabilidade. São Paulo: Makron do Brasil  LEVINE, DAVID M.;BERENSON, MARK L.; STEPHAN, DAVID.  Estatística: Teoria e Aplicações:usando Microsoft Excel em português. LTC – Livros Técnicos e Científicos:Rio de Janeiro, 2000 CRESPO, ANTONIO ARNOT, Estatística Fácil, ed.18, Saraiva:São Paulo, 2006.

3 Estatística – Bibliografia
STEVENSON, WILLIAM J. Estatística aplicada à Administração.  Harbra: São Paulo, 2001 LARSON, RON; FARBER BETSY, Estatística Aplicada, 2 ed., Pearson Education do Brasil : São Paulo, 2004 MONTGOMERY, DOUGLAS C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC, 2004 ANDERSON, DAVID R.;SWEENEY, DENNIS J.;WILLIAMS, THOMAS A. Estatística aplicada à Administração e Economia. Cengage Learning: São Paulo, 2008.

4 ESTATÍSTICA ? PRA QUÊ ?

5 ESTATÍSTICA Exemplo: Bolsa fechou em alta de 3,12 % com a Vale
Dólar cai para R$ 2,287 (disponível em 8/ago/2013) Dívida do BNDES com o Tesouro em BILHÕES DE REAIS Bi Bi Bi Revista Veja, edição 2329 nº 28 de 10/06/2013

6 ESTATÍSTICA - sentido comum
Segundo DPVAT: mortos no trânsito em 2012 Contra em 2007 em 2010 Dos mortos em 2012: 41% tinham entre 18 e 34 anos = 2x (mortes Boate Kiss) por semana Em : no trânsito por homicídio

7 ESTATÍSTICA - sentido comum
98% dos acidentes de trânsito são causados por ERRO ou NEGLIGÊNCIA humana. Principais causas: Usar o celular ao volante: ler mensagem de texto a 60 km/h = 76 metros às cegas 2) Dirigir alcoolizado = 21% acidentes, pelo menos um estava alcoolizado

8 ESTATÍSTICA - sentido comum
3) Dirigir colado na traseira do carro à frente: 12% acidentes nas estradas federais 4) Dirigir acima da velocidade permitida 12% acidentes 5) Deixar de usar cinto de segurança 60 km/h = kgs Revista Veja, edição 2333 nº 32 de 7/08/2013

9 ESTATÍSTICA Vem do latim “status” = Estado inicialmente envolvia:
compilações de dados e gráficos representativos dos vários aspectos de um estado ou país. taxa de mortalidade, taxa nascimento, renda, taxas de desemprego, etc.

10 ESTATÍSTICA É uma coleção de métodos para: planejar experimentos,
obter dados, organizar, resumir, analisar concluir sobre as informações coletadas

11 Estatística Ramo da matemática que analisa dados estatísticos
Estatística Descritiva Inferência Estatística

12 Aplicação na Administração (DOWNING, DOUGLAS;CLARK JEFFREY – ESTATÍSTICA APLICADA)
Uma firma que está se preparando para lançar um novo produto precisa conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer pesquisa de mercado entrevistando um número de residências escolhidas aleatoriamente. Poderá usar os resultados para estimar as preferências da população.

13 Aplicação na Administração
A venda de automóveis é influenciado por: - modelo - cor - poder aquisitivo, - concorrência -Através da análise de regressão pode-se determinar quais fatores têm efeitos mais importantes

14 Aplicação na Administração
Antes de lançar um novo remédio no mercado, é necessário fazer várias experiências para garantir que o produto é seguro e eficiente. Toma-se dois grupos tão semelhantes quanto possível, e dar o remédio a um grupo, mas não a outro. Verificar se os resultados nos dois grupos são diferentes. Determina-se que eventuais diferenças observadas são causadas pelo remédio ou por outros fatores

15 Aplicação na Administração
No recebimento de um grande embarque de mercadorias de um fornecedor, teremos de nos certificar de que o produto realmente satisfaz os requisitos de qualidade acordados. Inspeciona-se uma amostra de itens escolhidos aleatoriamente inferindo-se sobre a qualidade de todo o lote

16 Aplicação na Administração
Auditor: verificar livros de uma firma para certificar que os lançamentos refletem a situação financeira da companhia. Em vez de examinar todos os documentos originais (notas de venda, ordens de compra, requisições), verifica-se apenas uma amostra de documentos escolhidos aleatoriamente, inferindo o resultado sobre toda a população

17 Estatística tem objeto e métodos próprios
não tem um objetivo em si mesma. tem como função auxiliar as outras ciências, sendo portando considerada um método científico de trabalho não é uma ciência.

18 Estatística UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos: Física Química Economia Biologia Engenharia Medicina Ciências Sociais Ciências Administrativas, etc.

19 Estatística Estatística pode ser dividida em duas partes:
.Estatística Descritiva - cuida da: Organização descrição dos dados experimentais; .Estatística Indutiva - cuida da: análise interpretação dos dados

20 Estatística Conceitos fundamentais: POPULAÇÃO AMOSTRA

21 População (Universo Estatístico)
conjunto de elementos com pelo menos uma característica comum. Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem. Exemplo: Vamos estudar o desempenho dos estudantes em 2011. POPULAÇÃO = todos os estudantes de 2011

22 População - Universo Estatístico
COMO DEFINIR UMA POPULAÇÃO? A quem interessa este resultado? Se o analista dos resultados for o responsável pelos cursos Administração, será que interessa a ele o desempenho dos alunos de Engenharia? Devemos procurar as características que interessam ao analista dos resultados

23 População - Universo Estatístico
Os alunos do curso “ X ” em 2013 Os alunos do curso “ X “ em 2013 que cursam o 4º semestre; a cada item, estamos especificando cada vez mais as características das pessoas a serem observadas, restringindo a “população” objeto de nossos estudos.

24 Levantamento definida as características da POPULAÇÃO, o passo seguinte é o levantamento de dados acerca das características objeto de estudo. PERGUNTA-SE... Deve-se pesquisar dados de toda a população?

25 Levantamento Em grande parte das vezes não é conveniente e em muitas vezes é impossível E Por que?

26 Levantamento TEMPO: as informações devem ser obtidas com rapidez
PRECISÃO: as informações devem ser corretas CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível.

27 Amostra Outros motivos para se tomar uma amostra
Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados. Testes destrutivos exame de sangue de um paciente trabalho extenso: anotações erradas

28 Amostra Devemos então delimitar nossas observações a uma parte da população, isto é, a uma amostra proveniente dessa população. AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.

29 Amostra A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo. Logicamente a indução não traz resultado exato, dando margem a erro.

30 Amostra A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade.

31 Amostra Quanto maior a amostra, mais confiáveis serão as induções ?
erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem.

32 POPULAÇÃO E AMOSTRA POPULAÇÃO: AMOSTRA: CENSO:
é uma coleção completa de todos os elementos a serrem estudados AMOSTRA: é um subconjunto da população CENSO: é uma coleção da dados relativos a todos os elementos de uma população:

33 Variável Antes de tudo, é necessário que se tenham bem definidas quais características deverão ser verificadas. Ex.: Alunos de Administração. (Universo Estatístico ou População). Dentro da população, é preciso definir quais as características que nos interessa averiguar Ex. idade, sexo, estado civil, etc. A escolha da variável dependerá dos objetivos do estudo estatístico.

34 Variável é o conjunto de resultados possíveis de um fenômeno.
é a característica ou propriedade da população que está sendo medida. Ex.: População: moradores de uma cidade Variável : número de filhos População: alunos de Administração Variável : sexo

35 Variável População: moradores de um prédio Variável : peso
CLASSIFICAÇÃO DA VARIÁVEL pode ser: A) QUANTITATIVA A DISCRETA A CONTÍNUA B) QUALITATIVA B NOMINAL B ORDINAL

36 A - Variáveis Quantitativas
quando pode ser expressa em números. Ex: quantidade de valores de notas de uma moeda quantidade de sabores de refresco duração de uma bateria de telefone celular número de ossos existentes em um animal

37 A - Variáveis Quantitativas
A.1. - Quantitativas DISCRETAS: quando os valores podem assumir apenas determinados valores e resultam de uma contagem. O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex: valores das cédulas da moeda brasileira número de filhos dos casais de Lins

38 A - Variáveis Quantitativas
A.2. - Quantitativas CONTÍNUAS: quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor. Obtido por medição. Ex; peso de um paciente altura tempo de vôo entre duas cidades

39 B - Variáveis Qualitativas
quando a variável é não numérica ou definida através de atributos, categorias. Ex: sexo religião naturalidade cor dos olhos

40 B - Variáveis Qualitativas
B qualitativas NOMINAIS: não tem ordenamento nem hierarquia; Ex: sexo dos pacientes da clínica; tipo de convênio utilizado. B.2. - qualitativas ORDINAIS: existe uma ordem, uma hierarquia; Ex: presidente, diretor, gerente, etc... Classificação: bom, regular, ruim.

41 ESCALA DE MEDIÇÃO DAS VARIÁVEIS
ESCALA NOMINAL: dão nome a uma categoria ou classe. Os dados não podem ser dispostos em um esquema ordenado. Ex: Respostas do tipo “sim”, “não” ou “indeciso” Procedência de qual cidade (Lins, Promissão, etc.) não se faz cálculos (ex: tirar a média) algumas vezes são atribuídos números aos dados para serem inseridas no computador: 0 - sim; 1 - não, 2 - indeciso. Neste caso são apenas rótulos e não podem ser efetuados cálculos com estes números.

42 ESCALA DE MEDIÇÃO DAS VARIÁVEIS
ESCALA ORDINAL: dão nome e uma ordem a uma categoria ou classe. Diferença entre os valores dos dados não podem ser determinadas ou não fazem sentido. Ex: grau de instrução:1= sem instrução; 2 = ensino fundamental; 3 = ensino médio, 4 = superior; 5 = Mestre; 6 = Doutor. Não mantém a propriedade dos números: embora 3 seja maior do que 2, não significa que = 5. Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3.

43 ESCALA DE MEDIÇÃO DAS VARIÁVEIS
ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado. Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º. Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário. ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO: Apresenta um ZERO absoluto Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs.

44 Variáveis DEPENDENTES E INDEPENDENTES
Variável Independente: é a que influencia, determina ou afeta outra variável; referida como fator determinante, condição ou causa para ocorrência de determinada resposta. Variável dependente: a sua resposta varia em virtude dos diferentes valores que a variável independente pode assumir; modificando-se a variável independente, altera-se o valor da variável dependente.

45 Variáveis DEPENDENTES E INDEPENDENTES
Variável Independente (VI): é o antecedente; Variável dependente(VD): é o conseqüente Variável Independente Variável Dependente idade comprimento sexo Resistência física

46 Variáveis DEPENDENTES E INDEPENDENTES
Como detectar se uma variável é dependente ou independente ? Critério de sucetibilidade à influência: Variável dependente é alterada ou influenciada pela variável independente: Ex: dependente: predisposição a problemas cardíacos independente: sexo

47 Variáveis DEPENDENTES E INDEPENDENTES
Critérios para identificar o sentido de influência entre as variáveis dependente e independente ? 1) Ordem temporal: o que ocorre depois não pode influenciar o que aconteceu antes. Ex: V. independente V. dependente Aumento do U$ em relação ao R$ Aumento dos preços dos combustíveis

48 Variáveis DEPENDENTES E INDEPENDENTES
2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não são sujeitas a influências. Ex: suscetibilidade a certas doenças está associada ao sexo do indivíduo; variáveis bioquímicas em animais e no homem são dependentes da idade. Peso do recém-nascido está relacionado com a ordem de nascimento.

49 CO-VARIÁVEIS Em todo experimento existe:
variável dependente: a ser analisada; variável independente: que são fatores que influenciam os resultados da variável dependente; determinam as condições sob os quais a variável dependente é obtida. Podem interferir nos resultados da pesquisa

50 CO-VARIÁVEIS é um fator que o pesquisador procura neutralizar intencionalmente em uma investigação, com a finalidade de impedir que interfira na análise da relação entre as variáveis independentes e dependentes

51 Tabela Primitiva Dado um levantamento de dados estatísticos de uma variável quantitativa, como por exemplo, a altura dos alunos , que tenha dado os seguintes valores (em cm.):

52 Tabela Primitiva Notamos que a tabela não está numericamente organizada. A esta tabela denominamos TABELA PRIMITIVA. com os dados dispostos desta maneira é difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento. Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente.

53 ROL Concluímos que a menor estatura é de 154 e a maior é de 185. A amplitude é de = 31. A leitura da tabela fica mais clara. A esta tabela organizada denominamos ROL.

54 Estatística Resumindo:
TABELA PRIMITIVA: é a tabela onde o conjunto de elementos não foram numericamente ordenados. ROL: a tabela onde os dados foram numericamente ordenados de forma crescente ou decrescente.

55 Distribuição de Freqüência
Para facilitar a análise dos dados: vamos ordenar em colunas colocando o número de vezes que aparece repetido. TABULAR: é registrar quantas vezes o termo aparece no rol. Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados

56 Distribuição de Freqüência
Estaturas dos alunos Altura freqüência Altura freqüência 154 1 165 1 155 2 166 1 157 2 167 1 158 1 168 2 160 2 170 1 154 1 172 2 Fonte: Dados fictícios

57 Distribuição de Freqüência
Estaturas dos alunos de um determinado curso Altura freqüência 173 1 174 2 175 1 179 1 181 1 185 1 total 24

58 Distribuição de Freqüência
Para facilitar a análise dos dados obtidos, agrupar os valores em intervalos de classes (principalmente para variáveis contínuas). Assim dividimos nossa distribuição em INTERVALOS DE CLASSE INTERVALO DE CLASSE: é a forma de agrupar valores.

59 Distribuição de Freqüência
ALUNOS DE DETERMINADO ANO Altura freqüência total Fonte: Dados fictícios

60 Distribuição de Freqüência
CLASSES DE FREQÜÊNCIA São intervalos de variação da variável As classes são representadas simbolicamente por “ i ” Assim o intervalo define a 3ª classe i = 3 A distribuição é formada por 8 classes

61 Distribuição de Freqüência
As classes são: 1ª classe: 2ª classe 3ª classe 4ª classe 5ª classe 6ª classe 7ª classe 8ª classe

62 Distribuição de Freqüência
LIMITES DE CLASSE São os extremos de cada classe. Temos li = limite inferior da classe ls = limite superior da classe Referente à 3ª classe temos: li = 162 inclui limite inferior lS = 166 exclui limite superior

63 Distribuição de Freqüência
É o número de ocorrências em que uma única característica é observada. FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi) São os valores que representam o número de dados de classe é resultante da contagem. Ex: Na 3ª classe a freqüência foi igual a 2, ou seja duas pessoas têm estatura entre 162 a 166 cm (exclusive).

64 Distribuição de Freqüência
FREQÜÊNCIA ACUMULADA (Fac ou Fi ) É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes. FREQÜÊNCIA RELATIVA ( Fr ) É dado pela razão da freqüência simples e a freqüência total. Fr = freqüência simples (f i) freqüência total

65 Distribuição de Freqüência
FREQÜÊNCIA RELATIVA PERCENTUAL (Fr %) Fr % = Fr x 100 PONTO MÉDIO ( PM ) É o ponto que divide o intervalo de classe em duas partes iguais. PM = li + ls 2

66 Distribuição de Freqüência
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) AT=limite superior máximo-limite inferior mínimo No nosso exemplo AT = = 32 AMPLITUDE DE UM INTERVALO DE CLASSE ( h ) h = limite superior da classe - limite inferior da classe h = ls - li

67 Quantos elementos foram pesquisados?
Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo) Isto representa quantos porcento do total? Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)? Quantas pessoas têm altura inferior a 170? Quantos porcento têm altura de no mínimo 160? Quantos porcento têm altura abaixo de 180? Qual a classe (faixa de altura) de maior freqûëncia? Quantos porcento esta classe representa do total? Qual a classe de menor freqüência? Quantos alunos representam? Se for sorteado um elemento ao acaso, qual a probabilidade deste elemento ter altura mínima de 170? Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de 170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170? Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou igual a 160, qual a probabilidade dele ter altura acima de 170?

68 Histograma

69 Polígono de Freqüências

70 Variáveis qualitativas
GRÁFICOS Variáveis qualitativas

71 Variáveis Qualitativas
Defeitos em um lote de peças Defeitos quantidade Cor Mancha Risco Espessura Textura total Fonte: Dados fictícios

72 Gráfico de colunas

73 Gráfico de barras

74 Gráfico de setores ou “pizza”

75 Pequenas quantidades de causas
Diagrama de Pareto POUCOS TIPOS DEFEITOS MAIORIA DAS PERDAS Se identificados; pode-se eliminar a maiorias das perdas concentrando-se nestas causas principais Pequenas quantidades de causas

76 Diagrama de Pareto No controle de qualidade
Dr. J.M Juran demonstrou que em muitos casos: a maior parte dos defeitos decorrem de um número relativamente pequeno de causas.

77 Variáveis Qualitativas
Defeitos em um lote de peças Defeitos ( %) ( % ) acumulada Cor % % Mancha % % Risco % % Espessura % % Textura % % total % Fonte: Dados fictícios

78 Diagrama de Pareto

79 MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO

80 Estatística Medidas de posição Medidas de variabilidade ou dispersão
ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO: Medidas de posição Medidas de variabilidade ou dispersão

81 Medidas de Tendência Central
É um valor calculado para um grupo de dados usado para descrever esses dados. Tipicamente, desejamos que o valor seja representativo de todos os valores do grupo os dados observados tendem, em geral, a se agrupar em torno dos valores centrais.

82 Medidas de Tendência Central
São Medidas de Tendência Central: média; mediana; moda

83 1 - MÉDIA ARITMÉTICA definida como a soma dos valores dividida pelo número de elementos. Sua aplicação é seguramente a mais usada podem ser: Média para dados simples Média para dados agrupados Média para dados agrupados em classes.

84 1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população: 
Exemplo: Dado um a idade de 5 crianças Xi (idade) : 4; 6; 8; 10; 12 média - x = X = ∑xi n sendo “ n “ o número de elementos Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos.

85 1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população: 
Exemplo: Notas de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 X = 20 X = =

86 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) amostra: (X) população: 
Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma: X =  (Xi . fi )  fi

87 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) amostra: (X) população: 
Xi fi Xi . fi X =  Xi . fi   fi X = 78 = 3, Fonte: dados fictícios

88 1.3. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES amostra: (X) população: 
IDADE DE ALUNOS Xi PM fi PM.fi = = = = = 9 total Fonte: Dados fictícios X =  (PM. Fi ) X = 84 X = 4,2  fi 20

89 2 – MEDIANA ( X ) É o valor que se localiza no centro da distribuição
é obtida a partir de seus valores centrais Pode ser: 2.1 MEDIANA PARA DADOS SIMPLES 2.2 MEDIANA PARA DADOS AGRUPADOS 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES

90 2.1 MÉDIANA PARA DADOS SIMPLES (X)
~ Há duas situações: 1) Quando o número de elementos pesquisados é ímpar Xi (idade) : 4; 6; 8; 10; 12 Posição: ª ª ª ª ª Xi posição central “ n “ o número de elementos ímpar Uma posição central - P P = n P = = 3ª posição => Xi = 8, portanto X = 8 ~

91 2.1 MÉDIANA PARA DADOS SIMPLES (X)
~ 2.1 MÉDIANA PARA DADOS SIMPLES (X) 2) Quando o número de elementos pesquisados é par Xi (idade) : 4; 6; 8; 10; ; Posição: ª ª ª ª ª ª X X2 P P2 (2 Posições centrais) “ n = número PAR de elementos Duas posições centrais - P1 e P2 P1 = n P1 = 6 = 3ª posição => X1 = 8, X = X1 + X2 = P2 = é a próxima P2 = 4ª posição => X2= 10, X = 9 ~ ~

92 2.2 MEDIANA PARA DADOS AGRUPADOS
1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos =  fi = 19 (ímpar) uma posição central P =  fi +1 = P = 10ª posição

93 2.2 MEDIANA PARA DADOS AGRUPADOS
Xi fi fac Σ 19 Xi posição 1ª ª ª ª ª ª ª Xi posição ª ª ª ª 12ª ª 14ª Xi posição ª ª ª ª 19ª

94 2.2. MÉDIANA PARA DADOS AGRUPADOS
1) Quando o nº de elementos é IMPAR Xi fi fac P = 10ª posição Xi = X = 5 ~

95 2.2 MÉDIANA PARA DADOS AGRUPADOS
2)Quando o nº de elementos é PAR Xi fi fac nº de elementos =  fi = 20(par)  duas posição centrais P1 =  fi = 20 = 10ª posição P2 = é a próxima= 11ª posição - 20

96 2.2 MÉDIANA PARA DADOS AGRUPADOS
2)Quando o nº de elementos é PAR Xi fi fac P1 = 10ª posição P2 = 11ª posição X1= X2= X = (X1+ X2) = X = 5 ~

97 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac total 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P =  Fi P = P = 11,5º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”

98 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac faa total 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P =  Fi P = P = 11,5º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA” li ls

99 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac faa total Posição central > P = 11,5º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe > h = ls - li = 4 – 2 = 2 Freqüência da classe > fi = 10 Freqüência acumulada anterior -> faa = 3 ~ P - faa . h X = li + li fi ls ~ 11, X = 2 + 10

100 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES
Xi PM fi fac faa total ~ 8, X = 2 + li 10 ls ~ X = ,85 . 2 ~ X = ,70 ~ X = 3,70

101 É o ponto de maior concentração de ocorrências de uma variável
2 – MODA ( X ) ^ É o ponto de maior concentração de ocorrências de uma variável Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência

102 2.1 – MODA PARA DADOS SIMPLES ( X )
^ Exemplo: Notas de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 O valor que apareceu maior número de vezes é o 5 portanto => X = 5 ^

103 2.2 – MODA PARA DADOS AGRUPADOS ( X )
^ Xi fi Xi = Maior valor de fi ^ Xi = 5

104 2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - Xcz
^ Xi PM fi total 1º passo: Achar a classe onde se encontra a maior freqüência - fmax fmax

105 Xi PM fi 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4
2.3. MODA DE Czuber - XCZ ^ Xi PM fi total Limite inferior => li = freqüência máxima => fmax = 10 Limite superior => ls = freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 fant li fmax ls fpos

106 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 ^
2.3. MODA DE Czuber - XCZ ^ Limite inferior => li = freqüência máxima => fmax = 10 Limite superior => ls = freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 Cálculo da moda de Czuber Xcz = li + ___ 1 ___ . h 1 + 2 Xcz = __7__ = _7_ = = ,3 = ,3 ^ ^

107 Xi PM fi ^ 2.3. MODA DE KING - Xki fant li fmax ls fpos
total Limite inferior => li = freqüência máxima => fmax = 10 Limite superior => ls = freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 fant li fmax ls fpos

108 2.3. MODA DE KING Xki ^ Limite inferior => li = freqüência máxima => fmax = 10 Limite superior => ls = freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 Cálculo da moda de KING Xki = li fpost h fant + fpost Xcz = = = = ,3 = ,3 ^ ^

109 ^ 2.3. MODA DE Pearson - Xpe _ ~ ^ ~ ^ ^ ^ Cálculo da moda de PEARSON
Xpe = 3. X X Exemplo: Em um levantamento de dados onde a Mediana = X = 4 e a Moda = X = 4,2 A moda de Pearson será: X = ,2 = 12 – 8,4 X = 3,6 _ ^ ~ ~ ^ ^ ^

110 Outras separatrizes A Mediana divide a distribuição em duas partes.
É o atributo que está no meio da distribuição: 50% dos valores acima da mediana 50% dos valores abaixo da mediana

111 Outras separatrizes QUARTIS ou QUARTILHOS
o Quartil divide a distribuição em 4 partes de igual freqüência. Seu cálculo é importante para as medidas de dispersão e variabilidade São três:

112 Outras separatrizes Quartil São três:
Q1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si Q2 = é a mediana ou quartil mediano Q3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si

113 Quartil 1º quartil - Q1 = assume a posição P1q = Σfi 4

114 1º QUARTIL – Q1 Xi PM fi fac total 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL “ P1q ” P1q =  Fi P1q = P 1q = 5,75º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1”

115 Xi PM fi fac 1º QUARTIL – Q1 P1q - faa . h Q1 = li + li fi ls
total Posição 1º quartil > P 1q= 5,75º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe > h = ls - li = 4 – 2 = 2 Freqüência da classe > fi = 10 Freqüência acumulada anterior -> faa = 3 P1q - faa . h Q1 = li + li fi ls 5, Q1 = 2 + 10

116 Xi PM fi fac 1º QUARTIL – Q1 2,75 . 2 Q1 = 2 + li 10 ls Q1 = 2 + 0,55
faa total 2, Q1 = 2 + li 10 ls Q1 = ,55 Q1 = 2,55

117 3º QUARTIL – Q3 Xi PM fi fac total 1º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL “ P3q ” P3q = 3. Fi P3q = P 3q = 17,25º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3”

118 Xi PM fi fac 3º QUARTIL – Q3 P3q - faa . h Q3 = li + fi li ls
faa total Posição central > P 3q= 17,25º posição Limite inferior da classe -> li = 4 Limite superior da classe -> ls = 6 Amplitude da classe > h = ls - li = 6 – 4 = 2 Freqüência da classe > fi = 6 Freqüência acumulada anterior -> faa = 13 P3q - faa . h Q3 = li + fi li ls 17, Q3 = 4 + 6

119 Xi PM fi fac 3º QUARTIL – Q3 4,25 . 2 Q3 = 4 + 13 li ls Q3 = 4 + 0,65
faa total 4, Q3 = 4 + 13 li ls Q3 = ,65 Q3 = 4,65

120 Outras separatrizes Decil
Dividem a distribuição em 10 partes de igual freqüência. São nove o quinto decil é a mediana.

121 Decil 1º decil - D1 = assume a posição P1d= Σfi 10

122 1º DECIL – D1 Xi PM fi fac total 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL “ P1d ” P1d =  Fi P1d = P 1d = 2,3º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1”

123 Xi PM fi fac 1º DECIL – D1 P1d - faa . h li D1 = li + fi ls
total Posição 1º DECIL > P 1d= 2,3º posição Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe > h = ls - li = 2 – 0 = 2 Freqüência da classe > fi = 3 Freqüência acumulada anterior -> faa = 0 P1d - faa . h li D1 = li + fi ls 2,3 – D1 = + 3

124 Xi PM fi fac 1º DECIL – D1 2,3 . 2 D1 = + 3 D1 = 1,53
total 2, D1 = + 3 D1 = ,53

125 9º DECIL – D9 Xi PM fi fac total 1º passo: ACHAR A POSIÇÃO DO NONO DECIL “ P9d ” P9d = 9. Fi P9d = P9d = 20,70º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9”

126 Xi PM fi fac 9º DECIL – D9 P9d - faa . h D9 = li + fi li ls
faa total Posição central > P 9d= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe > h = ls - li = 8 – 6 = 2 Freqüência da classe > fi = 3 Freqüência acumulada anterior -> faa = 19 P9d - faa . h D9 = li + fi li ls 20, D9 = 6 + 3

127 Xi PM fi fac 9º DECIL – D9 1,7 . 2 D9 = 6 + 3 D9 = 6 + 1,13 D9 = 7,13
faa total 1, D9 = 6 + 3 D9 = ,13 D9 = 7,13

128 Outras separatrizes Centil ou Percentil
Dividem a distribuição em 100 partes de igual freqüência. São noventa e nove o qüinquagésimo centil é a mediana.

129 Percentil - Ci 1º percentil - C1 = assume a posição P1c= Σfi 100

130 Xi PM fi fac 10º PERCENTIL – C10 0 2.......... 1 3 3
total 1º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL “ P10c ” P10c = 10 .  Fi P10c = P 10c = 2,3º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10”

131 Xi PM fi fac 10º PERCENTIL – C10 P10c - faa . h li C10 = li + fi ls
total Posição 10º percentil > P 10c= 2,3º posição Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe > h = ls - li = 2 – 0 = 2 Freqüência da classe > fi = 3 Freqüência acumulada anterior -> faa = 0 P10c - faa . h li C10 = li + fi ls 2,3 – C10 = + 3

132 Xi PM fi fac 10º PERCENTIL – C10 2,3 . 2 C10 = + 3 C10 = 1,53
total 2, C10 = + 3 C10 = ,53

133 Xi PM fi fac 90º percentil – C90 0 2.......... 1 3 3
total 1º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL “ P90c ” P90c =  Fi P90c = P90c = 20,70º posição 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C90”

134 Xi PM fi fac 90º PERCENTIL – C90 P90c - faa . h C90 = li + fi li ls
faa total Posição central > P 90c= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe > h = ls - li = 8 – 6 = 2 Freqüência da classe > fi = 3 Freqüência acumulada anterior -> faa = 19 P90c - faa . h C90 = li + fi li ls 20, C90 = 6 + 3

135 Xi PM fi fac 90º PERCENTIL – C90 1,7 . 2 C90 = 6 + 3 C90 = 6 + 1,13
total 1, C90 = 6 + 3 C90 = ,13 C90 = 7,13

136 Relações Q1 = = C25 Q2 = D5 = C50 = X Q3 = = C75 D9 = C90
Quartil Decil Percentil Mediana D1 = C10 Q1 = = C25 Q = D5 = C = X Q = = C75 D9 = C90 ~

137 Outras médias Outras médias MÉDIA DE INTERVALO
É a média entre a menor e a maior observação em um conjunto de dados. MÉDIA DAS JUNTAS ou Midhinge É a média entre o primeiro e o terceiro quartil. XMENOR + XMAIOR XMENOR + XMAIOR Média de Intevalo = Média de Intevalo = 2 2 Q1 + Q3 Midhinge = 2

138 Medidas de Dispersão As Medidas de Tendência Central:
representam de certa forma uma determinada distribuição de dados só elas não são suficientes para caracterizar a distribuição. Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética

139 Medidas de Dispersão Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos. GRUPO “A” : 4, 5, 5, 6 GRUPO “B” : 0, 0, 10, 10 Média do grupo “A”: 5 Média do grupo “B”: 5

140 Medidas de Dispersão Os dois grupos apresentam a mesma média
O comportamento dos 2 grupos são bem distintos. GRUPO “A”: valores são mais homogêneos GRUPO “B”: valores são dispersos em relação à média

141 Medidas de Dispersão Dentre as medidas de dispersão pode-se citar algums delas: a) Amplitude Total b) Amplitude Interquartil c) Desvio Quartílico ou Amplitude Semi-interquartílico d)Desvio Médio e) Variância f) Desvio Padrão

142 a) Amplitude Total - R é a diferença entre o maior e o menor valor observados. R = Limite superior - Limite Inferior Exemplo 5: Idade de 20 alunos: Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 R = 9 – 1 = 8

143 b) Amplitude Interquartil – AIQ ou IQR ( InterQuartile Range )
é a diferença entre o terceiro quartil e o primeiro quartil. AIQ ou IQR = Q3 - Q1 Supera a dependência dos valores extremos Abrange 50% dos valores centrais, eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos

144 c) Desvio Quartílico ou Amplitude Semi-interquartílico
é a diferença entre o terceiro quartil e o primeiro quartil. Dq = Q3 - Q1 2

145 d) Desvio Médio - DM é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra DM = Σ Xi – X_ n - 1 Sendo: DM = Desvio Médio Xi = vr. variável n = nº elementos X = média aritmética

146 d) Desvio Médio - DM Para uma população DM = Σ Xi – _ n
Sendo: DM = Desvio Médio Xi = vr. variável n = nº elementos  = média aritmética

147 d) Desvio Médio - DM Exemplo 6: Dado o levantamento:
Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 Calcule a média X = = = 4 Montar a tabela a seguir: Σ Xi 40 n 10

148 d) Desvio Médio - DM Σ 14 Xi Xi - x Xi – x 2 2 – 4 = - 2 2
– 4 = – 4 = – 4 = DM = = – 4 = – 4 = DM = 1,56 – 4 = – 4 = Σ Considerando uma amostra Σ Xi – x_ 14 n - 1 9

149 e) Variância – população: 2 amostra: s2
é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética Revela a dispersão do conjunto que se estuda

150 e) Variância – população: 2 amostra: s2
é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra s2 = Σ (Xi – X )2_ n - 1 Sendo: s2= variância amostra Xi = vr. variável n = nº elementos X = média aritmética

151 e) Variância – população: 2 amostra: s2
Para uma população 2 = Σ (Xi –  )2_ n Sendo: 2 = variância população Xi = vr. variável n = nº elementos  = média aritmética

152 d.1) Variância - 2 – dados simples
Exemplo 7: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 Calcule a média X = = = 4 Montar a tabela a seguir: Σ Xi 40 n 10

153 d.1) Variância - s2 – dados simples
Xi Xi - x ( Xi – x )2 – 4 = = 4 – 4 = = 1 – 4 = = s2 = = – 4 = = 0 – 4 = = s2 = = 5,33 – 4 = = 1 – 4 = = 36 Σ Σ ( Xi – x )2 n - 1 48 9

154 d.2) Variância - s2 – dados agrupados
Xi fi Xi . fi Xi - x ( Xi – x )2 ( Xi – x )2 . fi = – 4 = (-2)2 = = 8 = – 4 = (-1)2 = = 3 = – 4 = = = 0 = – 4 = = = 1 = = = = 36 Σ fi = Σ fi = Σ fi = 48 se amostra s2 = s2 = = 5,33 Σ ( Xi – x )2 . fi Σ fi - 1 48 9

155 d.2) Variância - s2 – dados agrupados em classes
Xi PM fi PM.fi PM-x ( PM–x ) ( PM–x )2.fi = = (-4)2 = = 32 = = (-2)2 = = 16 = = = = 0 = = (2)2 = = 24 = = (4)2 = = 16 total Σ ( PM.fi) X = 105 = X = 5 Σ fi s2 = 4,4 21 Σ ( PM – x )2 . fi 88 s2 = s2 = = 20 Σ fi - 1

156 d) Desvio Padrão para uma população  = 2 para uma amostra s = s2
Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios É a mais utilizada Revela a dispersão do conjunto que se estuda para uma população  = 2 para uma amostra s = s2

157 e) Desvio Padrão - “” ou “s”
Se todos os valores forem iguais, o desvio padrão é nulo. quanto maior o desvio padrão mais heterogênea é a distribuição, significa que os valores são mais dispersos em torno da média MEDIA ± 1  => 68,26% dos valores MEDIA ± 2  => 95,44% dos valores MEDIA ± 3  => 99,74% dos valores

158 f) Coeficiente de Variação - CV
CV =   - desvio padrão X X - média artitmética o CV mede o grau de heterogeneidade da distribuição Valor máximo é CV = 1 0 ≤ CV ≤ 1

159 Coeficiente de Variação - CV
Quanto mais próximo de 1: mais heterogênea é a distribuição Os valores estão mais dispersos Quanto mais próximo de 0: mais homogênea é a distribuição Os valores da variável estão mais próximos em torno da média

160 Coeficiente de Variação - CV
Ex: Dado 2 estudantes cujas notas bimestrais foram: “a”: 60; 40; 50; 50 “b”: 70; 70; 30; 30 Qual foi mais regular ?

161 f) Coeficiente de Variação - CV
Na comparação de variabilidade de dois ou mais conjuntos de dados: expressos em diferentes unidades de medida expressos nas mesmas unidades, mas com médias diferentes.

162 f) Coeficiente de Variação - CV
Comparação de valores expressos em diferentes unidades de medida Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO XPESO = 20 kg XCOMPRIMENTO = 50 metros PESO = 2 kg COMPRIMENTO = 4 metros

163 f) Coeficiente de Variação - CV
PESO 2 CVP = CVP = CVP = 0,10 20 XPESO COMPRIMENTO 4 CVC = CVC = CVC = 0,08 50 XCOMPRIMENTO CVPESO = 0,10 ≥ CVCOMPRIMENTO = 0,08 PESO varia mais que o comprimento

164 f) Coeficiente de Variação - CV
expressos nas mesmas unidades, mas com médias diferentes Exemplo 9: Deseja-se comparar qual grupo “ A ” ou “ B “ tem mais variação de rendimento em um processo: XA = 80 % XB = 50 % A = 2 % B = 1 %

165 f) Coeficiente de Variação - CV
2 CVA = CVP = CVA = 0,025 80 XA B 1 CVB = CVB = CVB = 0,020 50 XB CVA = 0, ≥ CVB = 0,020 O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processo

166 Esquema dos 5 Números Box – Plot ou Gráfico Box-and-Whisker
XMENOR XMAIOR 25% 25% 25% dos dados 25% dos dados ~ Q1 1º Quartil X Mediana Q3 3º Quartil

167 Dados suspeitos ou Outliers
IQR = Q3 - Q1 Q IQR Q IQR Q1 – 1,5. IQR Q3 + 1,5. IQR Possível suspeito


Carregar ppt "Estatística – Conteúdo Programático"

Apresentações semelhantes


Anúncios Google