A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações População, amostra, variáveis aleatórias Distribuição de freqüência.

Apresentações semelhantes


Apresentação em tema: "Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações População, amostra, variáveis aleatórias Distribuição de freqüência."— Transcrição da apresentação:

1 Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações População, amostra, variáveis aleatórias Distribuição de freqüência Gráficos e séries estatísticas Medidas de Tendência Central: Separatrizes Medidas de dispersão e assimetria Probabilidade

2 Estatística – Bibliografia SILVA, ERMES MEDEIROS DA. Estatística: para os cursos de Economia, Administração e Ciências Contábeis. v.1 São Paulo: Altas, 2008 KAZMIER, LEONARD J. Teoria e problemas de Estatística aplicada à Administração e Economia. Porto Alegre: Bookaman, 2007 MORETIN, LUIZ GONZAGA, Estatística Básica:Probabilidade. São Paulo: Makron do Brasil LEVINE, DAVID M.;BERENSON, MARK L.; STEPHAN, DAVID. Estatística: Teoria e Aplicações:usando Microsoft Excel em português. LTC – Livros Técnicos e Científicos:Rio de Janeiro, 2000 CRESPO, ANTONIO ARNOT, Estatística Fácil, ed.18, Saraiva:São Paulo, 2006.

3 Estatística – Bibliografia STEVENSON, WILLIAM J. Estatística aplicada à Administração. Harbra: São Paulo, 2001 LARSON, RON; FARBER BETSY, Estatística Aplicada, 2 ed., Pearson Education do Brasil : São Paulo, 2004 MONTGOMERY, DOUGLAS C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC, 2004 ANDERSON, DAVID R.;SWEENEY, DENNIS J.;WILLIAMS, THOMAS A. Estatística aplicada à Administração e Economia. Cengage Learning: São Paulo, 2008.

4 ESTATÍSTICA ? PRA QUÊ ?

5 ESTATÍSTICA Exemplo: Bolsa fechou em alta de 3,12 % com a Vale Dólar cai para R$ 2,287 (disponível em 8/ago/2013) Dívida do BNDES com o Tesouro em BILHÕES DE REAIS Bi Bi Bi Revista Veja, edição 2329 nº 28 de 10/06/2013

6 ESTATÍSTICA - sentido comum Segundo DPVAT: mortos no trânsito em 2012 Contra em em 2010 Dos mortos em 2012: -41% tinham entre 18 e 34 anos = 2x (mortes Boate Kiss) por semana Em 2011 : no trânsito por homicídio

7 ESTATÍSTICA - sentido comum 98% dos acidentes de trânsito são causados por ERRO ou NEGLIGÊNCIA humana. Principais causas: 1)Usar o celular ao volante: ler mensagem de texto a 60 km/h = 76 metros às cegas 2) Dirigir alcoolizado = 21% acidentes, pelo menos um estava alcoolizado

8 ESTATÍSTICA - sentido comum 3) Dirigir colado na traseira do carro à frente: 12% acidentes nas estradas federais 4) Dirigir acima da velocidade permitida 12% acidentes 5) Deixar de usar cinto de segurança 60 km/h = kgs Revista Veja, edição 2333 nº 32 de 7/08/2013

9 ESTATÍSTICA Vem do latim status = Estado inicialmente envolvia: –compilações de dados e gráficos representativos dos vários aspectos de um estado ou país. taxa de mortalidade, taxa nascimento, renda, taxas de desemprego, etc.

10 ESTATÍSTICA É uma coleção de métodos para: –planejar experimentos, –obter dados, –organizar, –resumir, –analisar –concluir sobre as informações coletadas

11 Estatística Ramo da matemática que analisa dados estatísticos –Estatística Descritiva –Inferência Estatística

12 Aplicação na Administração (DOWNING, DOUGLAS;CLARK JEFFREY – ESTATÍSTICA APLICADA) Uma firma que está se preparando para lançar um novo produto precisa conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer pesquisa de mercado entrevistando um número de residências escolhidas aleatoriamente. Poderá usar os resultados para estimar as preferências da população.

13 Aplicação na Administração A venda de automóveis é influenciado por: - modelo - cor - poder aquisitivo, - concorrência -Através da análise de regressão pode-se determinar quais fatores têm efeitos mais importantes

14 Aplicação na Administração Antes de lançar um novo remédio no mercado, é necessário fazer várias experiências para garantir que o produto é seguro e eficiente. Toma-se dois grupos tão semelhantes quanto possível, e dar o remédio a um grupo, mas não a outro. Verificar se os resultados nos dois grupos são diferentes. Determina-se que eventuais diferenças observadas são causadas pelo remédio ou por outros fatores

15 Aplicação na Administração No recebimento de um grande embarque de mercadorias de um fornecedor, teremos de nos certificar de que o produto realmente satisfaz os requisitos de qualidade acordados. Inspeciona-se uma amostra de itens escolhidos aleatoriamente inferindo-se sobre a qualidade de todo o lote

16 Aplicação na Administração Auditor: verificar livros de uma firma para certificar que os lançamentos refletem a situação financeira da companhia. Em vez de examinar todos os documentos originais (notas de venda, ordens de compra, requisições), verifica-se apenas uma amostra de documentos escolhidos aleatoriamente, inferindo o resultado sobre toda a população

17 Estatística tem objeto e métodos próprios não tem um objetivo em si mesma. tem como função auxiliar as outras ciências, sendo portando considerada um método científico de trabalho não é uma ciência.

18 Estatística UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos: –FísicaQuímicaEconomia –BiologiaEngenhariaMedicina –Ciências Sociais –Ciências Administrativas, etc.

19 Estatística Estatística pode ser dividida em duas partes: –. Estatística Descritiva - cuida da: Organização descrição dos dados experimentais; –. Estatística Indutiva - cuida da: análise interpretação dos dados

20 Estatística Conceitos fundamentais: –POPULAÇÃO –AMOSTRA

21 População (Universo Estatístico) conjunto de elementos com pelo menos uma característica comum. Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem. Exemplo:Vamos estudar o desempenho dos estudantes em –POPULAÇÃO = todos os estudantes de 2011

22 População - Universo Estatístico COMO DEFINIR UMA POPULAÇÃO? A quem interessa este resultado? Se o analista dos resultados for o responsável pelos cursos Administração, será que interessa a ele o desempenho dos alunos de Engenharia? Devemos procurar as características que interessam ao analista dos resultados

23 População - Universo Estatístico Os alunos do curso X em 2013 Os alunos do curso X em 2013 que cursam o 4º semestre; a cada item, estamos especificando cada vez mais as características das pessoas a serem observadas, restringindo a população objeto de nossos estudos.

24 Levantamento definida as características da POPULAÇÃO, o passo seguinte é o levantamento de dados acerca das características objeto de estudo. PERGUNTA-SE... Deve-se pesquisar dados de toda a população?

25 Levantamento Em grande parte das vezes não é conveniente e em muitas vezes é impossível E Por que?

26 Levantamento TEMPO: as informações devem ser obtidas com rapidez PRECISÃO: as informações devem ser corretas CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível.

27 Amostra Outros motivos para se tomar uma amostra –Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados. –Testes destrutivos –exame de sangue de um paciente –trabalho extenso: anotações erradas

28 Amostra Devemos então delimitar nossas observações a uma parte da população, isto é, a uma amostra proveniente dessa população. AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.

29 Amostra A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo. Logicamente a indução não traz resultado exato, dando margem a erro.

30 Amostra A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade.

31 Amostra Quanto maior a amostra, mais confiáveis serão as induções ? erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem.

32 POPULAÇÃO E AMOSTRA POPULAÇÃO: –é uma coleção completa de todos os elementos a serrem estudados AMOSTRA: –é um subconjunto da população CENSO: –é uma coleção da dados relativos a todos os elementos de uma população:

33 Variável Antes de tudo, é necessário que se tenham bem definidas quais características deverão ser verificadas. Ex.: Alunos de Administração. (Universo Estatístico ou População). Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc. A escolha da variável dependerá dos objetivos do estudo estatístico.

34 Variável é o conjunto de resultados possíveis de um fenômeno. é a característica ou propriedade da população que está sendo medida. Ex.: –População: moradores de uma cidade –Variável : número de filhos – População: alunos de Administração –Variável : sexo

35 Variável –População: moradores de um prédio –Variável : peso CLASSIFICAÇÃO DA VARIÁVEL pode ser: A) QUANTITATIVA A 1 - DISCRETA A.2 - CONTÍNUA B) QUALITATIVA B 1 - NOMINAL B.2 - ORDINAL

36 A - Variáveis Quantitativas quando pode ser expressa em números. Ex: –quantidade de valores de notas de uma moeda –quantidade de sabores de refresco –duração de uma bateria de telefone celular –número de ossos existentes em um animal

37 A - Variáveis Quantitativas A.1. - Quantitativas DISCRETAS: –quando os valores podem assumir apenas determinados valores e resultam de uma contagem. –O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex: valores das cédulas da moeda brasileira número de filhos dos casais de Lins

38 A - Variáveis Quantitativas A.2. - Quantitativas CONTÍNUAS: –quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor. –Obtido por medição. Ex; peso de um paciente altura tempo de vôo entre duas cidades

39 B - Variáveis Qualitativas quando a variável é não numérica ou definida através de atributos, categorias. Ex: –sexo –religião –naturalidade –cor dos olhos

40 B - Variáveis Qualitativas B.1. - qualitativas NOMINAIS: não tem ordenamento nem hierarquia; Ex: sexo dos pacientes da clínica; tipo de convênio utilizado. B.2. - qualitativas ORDINAIS: existe uma ordem, uma hierarquia; Ex: presidente, diretor, gerente, etc... Classificação: bom, regular, ruim.

41 ESCALA DE MEDIÇÃO DAS VARIÁVEIS ESCALA NOMINAL: –dão nome a uma categoria ou classe. –Os dados não podem ser dispostos em um esquema ordenado. Ex: Respostas do tipo sim, não ou indeciso Procedência de qual cidade (Lins, Promissão, etc.) –não se faz cálculos (ex: tirar a média) –algumas vezes são atribuídos números aos dados para serem inseridas no computador: 0 - sim; 1 - não, 2 - indeciso. Neste caso são apenas rótulos e não podem ser efetuados cálculos com estes números.

42 ESCALA DE MEDIÇÃO DAS VARIÁVEIS ESCALA ORDINAL: –dão nome e uma ordem a uma categoria ou classe. –Diferença entre os valores dos dados não podem ser determinadas ou não fazem sentido. Ex: grau de instrução:1= sem instrução; 2 = ensino fundamental; 3 = ensino médio, 4 = superior; 5 = Mestre; 6 = Doutor. Não mantém a propriedade dos números: embora 3 seja maior do que 2, não significa que = 5. –Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3.

43 ESCALA DE MEDIÇÃO DAS VARIÁVEIS ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado. Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º. Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário. ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs.

44 Variáveis DEPENDENTES E INDEPENDENTES Variável Independente: –é a que influencia, determina ou afeta outra variável; –referida como fator determinante, condição ou causa para ocorrência de determinada resposta. Variável dependente: –a sua resposta varia em virtude dos diferentes valores que a variável independente pode assumir; –modificando-se a variável independente, altera-se o valor da variável dependente.

45 Variáveis DEPENDENTES E INDEPENDENTES Variável Independente (VI): é o antecedente; Variável dependente(VD): é o conseqüente Variável IndependenteVariável Dependente idadecomprimento sexoResistência física

46 Variáveis DEPENDENTES E INDEPENDENTES Como detectar se uma variável é dependente ou independente ? Critério de sucetibilidade à influência: –Variável dependente é alterada ou influenciada pela variável independente: –Ex: dependente: predisposição a problemas cardíacos independente: sexo

47 Variáveis DEPENDENTES E INDEPENDENTES Critérios para identificar o sentido de influência entre as variáveis dependente e independente ? 1) Ordem temporal: –o que ocorre depois não pode influenciar o que aconteceu antes. Ex: V. independenteV. dependente Aumento do U$ em relação ao R$ Aumento dos preços dos combustíveis

48 Variáveis DEPENDENTES E INDEPENDENTES 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não são sujeitas a influências. Ex: –suscetibilidade a certas doenças está associada ao sexo do indivíduo; –variáveis bioquímicas em animais e no homem são dependentes da idade. –Peso do recém-nascido está relacionado com a ordem de nascimento.

49 CO-VARIÁVEIS Em todo experimento existe: –variável dependente: a ser analisada; –variável independente: que são fatores que influenciam os resultados da variável dependente; determinam as condições sob os quais a variável dependente é obtida. Podem interferir nos resultados da pesquisa

50 CO-VARIÁVEIS é um fator que o pesquisador procura neutralizar intencionalmente em uma investigação, com a finalidade de impedir que interfira na análise da relação entre as variáveis independentes e dependentes

51 Tabela Primitiva Dado um levantamento de dados estatísticos de uma variável quantitativa, como por exemplo, a altura dos alunos, que tenha dado os seguintes valores (em cm.):

52 Tabela Primitiva Notamos que a tabela não está numericamente organizada. A esta tabela denominamos TABELA PRIMITIVA. com os dados dispostos desta maneira é difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento. Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente.

53 ROL Concluímos que a menor estatura é de 154 e a maior é de 185. A amplitude é de = 31. A leitura da tabela fica mais clara. A esta tabela organizada denominamos ROL.

54 Estatística Resumindo: : é a tabela onde o conjunto de elementos não foram numericamente ordenados.TABELA PRIMITIVA: é a tabela onde o conjunto de elementos não foram numericamente ordenados. a tabela onde os dados foram numericamente ordenados de forma crescente ou decrescenteROL: a tabela onde os dados foram numericamente ordenados de forma crescente ou decrescente.

55 Distribuição de Freqüência Para facilitar a análise dos dados: –vamos ordenar em colunas colocando o número de vezes que aparece repetido. TABULAR: é registrar quantas vezes o termo aparece no rol. Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados

56 Distribuição de Freqüência Altura Estaturas dos alunos freqüência Alturafreqüência Fonte: Dados fictícios

57 Distribuição de Freqüência Altura Estaturas dos alunos de um determinado curso freqüência total24

58 Distribuição de Freqüência Para facilitar a análise dos dados obtidos, agrupar os valores em intervalos de classes (principalmente para variáveis contínuas). Assim dividimos nossa distribuição em INTERVALOS DE CLASSE INTERVALO DE CLASSE: é a forma de agrupar valores.

59 Distribuição de Freqüência ALUNOS DE DETERMINADO ANO Alturafreqüência total Fonte: Dados fictícios

60 Distribuição de Freqüência CLASSES DE FREQÜÊNCIA São intervalos de variação da variável As classes são representadas simbolicamente por i Assim o intervalo define a 3ª classe i = 3 A distribuição é forma da por 8 classes

61 Distribuição de Freqüência As classes são: 1ª classe: ª classe ª classe ª classe ª classe ª classe ª classe ª classe

62 Distribuição de Freqüência LIMITES DE CLASSE São os extremos de cada classe. Temos li = limite inferior da classe l s = limite superior da classe Referente à 3ª classe temos: – l i = 162 inclui limite inferior – l S = 166 exclui limite superior

63 Distribuição de Freqüência FREQÜÊNCIA É o número de ocorrências em que uma única característica é observada. FREQÜÊNCIA SIMPLES ou ABSOLUTA (f i ) São os valores que representam o número de dados de classe é resultante da contagem. Ex: Na 3ª classe a freqüência foi igual a 2, ou seja duas pessoas têm estatura entre 162 a 166 cm (exclusive).

64 Distribuição de Freqüência FREQÜÊNCIA ACUMULADA (F ac ou Fi ) É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes. FREQÜÊNCIA RELATIVA ( F r ) É dado pela razão da freqüência simples e a freqüência total. Fr = freqüência simples (f i) freqüência total

65 Distribuição de Freqüência FREQÜÊNCIA RELATIVA PERCENTUAL (Fr %) Fr % = Fr x 100 PONTO MÉDIO ( PM ) É o ponto que divide o intervalo de classe em duas partes iguais. PM = li + ls 2

66 Distribuição de Freqüência AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) AT=limite superior máximo-limite inferior mínimo No nosso exemplo AT = = 32 AMPLITUDE DE UM INTERVALO DE CLASSE ( h ) h = limite superior da classe - limite inferior da classe h = ls - li

67 1)Quantos elementos foram pesquisados? 2)Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo) 3)Isto representa quantos porcento do total? 4)Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)? 5)Quantas pessoas têm altura inferior a 170? 6)Quantos porcento têm altura de no mínimo 160? 7)Quantos porcento têm altura abaixo de 180? 8)Qual a classe (faixa de altura) de maior freqûëncia? Quantos porcento esta classe representa do total? 9)Qual a classe de menor freqüência? Quantos alunos representam? 10)Se for sorteado um elemento ao acaso, qual a probabilidade deste elemento ter altura mínima de 170? 11)Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de 170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170? 12)Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou igual a 160, qual a probabilidade dele ter altura acima de 170?

68 Histograma

69 Polígono de Freqüências

70 GRÁFICOS Variáveis qualitativas

71 Variáveis Qualitativas Defeitos em um lote de peças Defeitos quantidade Cor 20 Mancha 11 Risco 8 Espessura 6 Textura 5 total 50 Fonte: Dados fictícios

72 Gráfico de colunas

73 Gráfico de barras

74 Gráfico de setores ou pizza

75 75 Diagrama de Pareto MAIORIA DAS PERDAS POUCOS TIPOS DEFEITOS Pequenas quantidades de causas Se identificados; pode-se eliminar a maiorias das perdas concentrando-se nestas causas principais

76 76 Diagrama de Pareto No controle de qualidade –Dr. J.M Juran demonstrou que em muitos casos: a maior parte dos defeitos decorrem de um número relativamente pequeno de causas.

77 Variáveis Qualitativas Defeitos em um lote de peças Defeitos ( %) ( % ) acumulada Cor 40 % 40 % Mancha 22 % 62 % Risco 16 % 78 % Espessura 12 % 90 % Textura 10 % 100 % total 100 % Fonte: Dados fictícios

78 Diagrama de Pareto

79 ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO 79

80 Estatística ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO: Medidas de posição Medidas de variabilidade ou dispersão 80

81 Medidas de Tendência Central É um valor calculado para um grupo de dados usado para descrever esses dados. Tipicamente, desejamos que o valor seja representativo de todos os valores do grupo os dados observados tendem, em geral, a se agrupar em torno dos valores centrais. 81

82 Medidas de Tendência Central São Medidas de Tendência Central: 1.média; 2.mediana; 3.moda 82

83 1 - MÉDIA ARITMÉTICA definida como a soma dos valores dividida pelo número de elementos. Sua aplicação é seguramente a mais usada podem ser: –Média para dados simples –Média para dados agrupados –Média para dados agrupados em classes. 83

84 Exemplo: Dado um a idade de 5 crianças Xi (idade) : 4; 6; 8; 10; 12 média - x = X = x i n sendo n o número de elementos Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:

85 Exemplo: Notas de 20 alunos: X i : 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 X = X = = MÉDIA ARITMÉTICA PARA DADOS SIMPLES amostra: (X) população:

86 Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma: X = (Xi. fi ) fi MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) amostra: (X) população:

87 X i f i Xi. fi 1 3 3X = X i. f i f i X = 78 = 3, Fonte: dados fictícios MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) amostra: (X) população:

88 IDADE DE ALUNOS X i PM fi PM.fi = = = = = 9 total Fonte: Dados fictícios X = (PM. F i ) X = 84 X = 4,2 f i MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES amostra: (X) população:

89 2 – MEDIANA ( X ) É o valor que se localiza no centro da distribuição é obtida a partir de seus valores centrais Pode ser: 2.1 MEDIANA PARA DADOS SIMPLES 2.2 MEDIANA PARA DADOS AGRUPADOS 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES 89

90 2.1 MÉDIANA PARA DADOS SIMPLES (X) Há duas situações: 1) Quando o número de elementos pesquisados é ímpar Xi (idade) : 4; 6; 8; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª n o número de elementos ímpar Uma posição central - P P = n +1 P = = 3 ª posição => Xi = 8, portanto X = ~ posição central XiXi ~ 90

91 2.1 MÉDIANA PARA DADOS SIMPLES (X) 2) Quando o número de elementos pesquisados é par Xi (idade) : 4; 6; 8; 10; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª 6ª ~ X 1 X 2 ~ P 1 P 2 (2 Posições centrais) ~ n = 6 número PAR de elementos Duas posições centrais - P 1 e P 2 P 1 = n P 1 = 6 = 3 ª posição => X 1 = 8, X = X 1 + X 2 = P 2 = é a próxima P 2 = 4ª posição => X 2 = 10, X = 9 91

92 2.2 MEDIANA PARA DADOS AGRUPADOS 1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos = fi = 19 (ímpar) uma posição central P = fi +1 = P = 10ª posição

93 2.2 MEDIANA PARA DADOS AGRUPADOS Xi fi fac Σ 19 Xi posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª Xi posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª Xi posição 15ª 16ª 17ª 18ª 19ª Xi posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª Xi posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª Xi posição 15ª 16ª 17ª 18ª 19ª 93

94 2.2. MÉDIANA PARA DADOS AGRUPADOS ~ 1) Quando o nº de elementos é IMPAR Xi fi fac P = 10ª posição X i = X =

95 2.2 MÉDIANA PARA DADOS AGRUPADOS 2)Quando o nº de elementos é PAR Xi fi fac nº de elementos = fi = 20(par) duas posição centrais P1 = fi = 20 = 10ª posição P2 = é a próxima= 11ª posição

96 2.2 MÉDIANA PARA DADOS AGRUPADOS ~ 2)Quando o nº de elementos é PAR Xi fi fac P 1 = 10ª posição P 2 = 11ª posição X 1 = X 2 = X = ( X 1 + X 2 ) = X = 5 96

97 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac total º passo: ACHAR A POSIÇÃO CENTRAL P P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE MEDIANA 97

98 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac faa total º passo: ACHAR A POSIÇÃO CENTRAL P P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE MEDIANA lili lsls 98

99 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac faa total Posição central -> P = 11,5º posição Limite inferior da classe -> l i = 2 Limite superior da classe -> l s = 4 Amplitude da classe -> h = l s - l i = 4 – 2 = 2 Freqüência da classe -> f i = 10 Freqüência acumulada anterior -> faa = 3 lili lsls P - faa. h fi + li = X ~ 11, = ~ X 2 99

100 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac faa total lili lsls 8, = X ~ X = 2 + 0,85. 2 ~ X = 2 + 1,70 ~ X = 3,70 ~ 100

101 2 – MODA ( X ) É o ponto de maior concentração de ocorrências de uma variável Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência ^ 101

102 2.1 – MODA PARA DADOS SIMPLES ( X ) Exemplo: Notas de 20 alunos: X i : 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 O valor que apareceu maior número de vezes é o 5 portanto => X = 5 ^ ^ 102

103 2.2 – MODA PARA DADOS AGRUPADOS ( X ) ^ ^ Maior valor de fi X i = X i = 5 Xi fi

104 2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - Xcz f max Xi PM fi total º passo: Achar a classe onde se encontra a maior freqüência - f max ^ 104

105 2.3. MODA DE Czuber - X CZ Xi PM fi total Limite inferior => li = 2 freqüência máxima => f max = 10 Limite superior => ls = 4 freqüência anterior => f ant = 3 freqüência posterior => f post = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 lili lsls ^ f ant f pos f max 105

106 2.3. MODA DE Czuber - X CZ ^ Limite inferior => li = 2 freqüência máxima => f max = 10 Limite superior => ls = 4 freqüência anterior => f ant = 3 freqüência posterior => f post = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 Cálculo da moda de Czuber Xcz = li + ___ 1 ___. h X cz = 2 + __7__. 2 = 2 + _7_. 2 = = 2 + 1,3 = 3, ^ ^ 106

107 2.3. MODA DE KING - X ki Xi PM fi total Limite inferior => li = 2 freqüência máxima => f max = 10 Limite superior => ls = 4 freqüência anterior => f ant = 3 freqüência posterior => f post = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 lili lsls ^ f ant f pos f max 107

108 2.3. MODA DE KING - X ki ^ ^ ^ Limite inferior => li = 2 freqüência máxima => f max = 10 Limite superior => ls = 4 freqüência anterior => f ant = 3 freqüência posterior => f post = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 Cálculo da moda de KING X ki = li + f post. h f ant + f post X cz = = = = 2 + 1,3 = 3,

109 2.3. MODA DE Pearson - X pe ^ ^ ^ Cálculo da moda de PEARSON X pe = 3. X - 2. X Exemplo: Em um levantamento de dados onde a Mediana = X = 4 e a Moda = X = 4,2 A moda de Pearson será: X = ,2 = 12 – 8,4 X = 3,6 ~ ~ _ ^ ^ 109

110 Outras separatrizes A Mediana divide a distribuição em duas partes. É o atributo que está no meio da distribuição: –50% dos valores acima da mediana –50% dos valores abaixo da mediana 110

111 Outras separatrizes QUARTIS ou QUARTILHOS o Quartil divide a distribuição em 4 partes de igual freqüência. Seu cálculo é importante para as medidas de dispersão e variabilidade São três: 111

112 Outras separatrizes Quartil São três: Q 1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si Q 2 = é a mediana ou quartil mediano Q 3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si 112

113 Quartil 1º quartil - Q 1 = assume a posição P 1q = Σfi 4 2º quartil – Q 2 = assume a posição P 2q = 2. Σfi 4 3º quartil - Q 3 = assume a posição P 3q = 3.Σfi 4 113

114 1º QUARTIL – Q 1 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL P1q P 1q = Fi P1q = 23 P 1q = 5,75º posição 4 4 2º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1 114

115 1º QUARTIL – Q 1 Xi PM fi fac faa total Posição 1º quartil -> P 1q = 5,75º posição Limite inferior da classe -> l i = 2 Limite superior da classe -> l s = 4 Amplitude da classe -> h = l s - l i = 4 – 2 = 2 Freqüência da classe -> f i = 10 Freqüência acumulada anterior -> faa = 3 lili lsls P 1q - faa. h fi + li = Q1Q1 5, = Q1Q

116 1º QUARTIL – Q 1 Xi PM fi fac faa total lili lsls 2, = Q1Q1 Q 1 = 2 + 0,55 Q 1 = 2,55 116

117 3º QUARTIL – Q 3 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL P3q P 3q = 3. Fi P 3q = P 3q = 17,25º posição 4 4 2º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3 117

118 3º QUARTIL – Q 3 Xi PM fi fac faa total Posição central -> P 3q = 17,25º posição Limite inferior da classe -> l i = 4 Limite superior da classe -> l s = 6 Amplitude da classe -> h = l s - l i = 6 – 4 = 2 Freqüência da classe -> f i = 6 Freqüência acumulada anterior -> faa = 13 lili lsls P 3q - faa. h fi + li = Q3Q3 17, = Q3Q

119 3º QUARTIL – Q 3 Xi PM fi fac faa total lili lsls 4, = Q3Q3 Q 3 = 4 + 0,65 Q 3 = 4,65 119

120 Outras separatrizes Decil Dividem a distribuição em 10 partes de igual freqüência. São nove o quinto decil é a mediana. 120

121 Decil 1º decil - D 1 = assume a posição P 1d = Σfi 10 2º decil – D 2 = assume a posição P 2d = 2. Σfi 10 9º decil - D 9 = assume a posição P 9d = 9.Σfi

122 1º DECIL – D1 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL P 1d P 1d = Fi P1d = 23 P 1d = 2,3º posição º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1 122

123 1º DECIL – D1 Xi PM fi fac faa total Posição 1º DECIL -> P 1d = 2,3º posição Limite inferior da classe -> l i = 0 Limite superior da classe -> l s = 2 Amplitude da classe -> h = l s - l i = 2 – 0 = 2 Freqüência da classe -> f i = 3 Freqüência acumulada anterior -> faa = 0 lili lsls P 1d - faa. h fi + li = D1D1 2,3 – = D10 123

124 1º DECIL – D 1 Xi PM fi fac total , = D1D1 D 1 = 1,53 124

125 9º DECIL – D 9 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO NONO DECIL P 9d P 9d = 9. Fi P 9d = P 9d = 20,70º posição º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9 125

126 9º DECIL – D 9 lili lsls P 9d - faa. h fi + li = D9D9 20, = D9D9 6 Xi PM fi fac faa total Posição central -> P 9d = 20,7º posição Limite inferior da classe -> l i = 6 Limite superior da classe -> l s = 8 Amplitude da classe -> h = l s - l i = 8 – 6 = 2 Freqüência da classe -> f i = 3 Freqüência acumulada anterior -> faa =

127 9º DECIL – D 9 Xi PM fi fac faa total , = D9D9 D9 = 6 + 1,13 D9 = 7,13 127

128 Outras separatrizes Centil ou Percentil Dividem a distribuição em 100 partes de igual freqüência. São noventa e nove o qüinquagésimo centil é a mediana. 128

129 Percentil - C i 1º percentil - C 1 = assume a posição P 1c = Σfi 100 2º percentil – C 2 = assume a posição P 2c = 2. Σfi ºpercentil - C 99 = assume a posição P 99c =99.Σfi

130 10º PERCENTIL – C 10 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL P 10c P 10c = 10. Fi P 10c = P 10c = 2,3º posição º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10 130

131 10º PERCENTIL – C 10 Xi PM fi fac faa total Posição 10º percentil -> P 10c = 2,3º posição Limite inferior da classe -> l i = 0 Limite superior da classe -> l s = 2 Amplitude da classe -> h = l s - l i = 2 – 0 = 2 Freqüência da classe -> f i = 3 Freqüência acumulada anterior -> faa = 0 lili lsls P 10c - faa. h fi + li = C 10 2,3 – = C

132 10º PERCENTIL – C 10 Xi PM fi fac total , = C 10 C 10 = 1,53 132

133 90º percentil – C 90 Xi PM fi fac total º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL P 90c P 90c = 90. Fi P 90c = P 90c = 20,70º posição º passo: IR NA COLUNA freqüência acumulada = fac E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C

134 90º PERCENTIL – C 90 lili lsls P 90c - faa. h fi + li = C 90 20, = C 90 6 Xi PM fi fac faa total Posição central -> P 90c = 20,7º posição Limite inferior da classe -> l i = 6 Limite superior da classe -> l s = 8 Amplitude da classe -> h = l s - l i = 8 – 6 = 2 Freqüência da classe -> f i = 3 Freqüência acumulada anterior -> faa =

135 90º PERCENTIL – C 90 Xi PM fi fac total , = C 90 C 90 = 6 + 1,13 C 90 = 7,13 135

136 Relações Quartil Decil Percentil Mediana D 1 = C 10 Q 1 = = C 25 Q 2 = D 5 = C 50 = X Q 3 = = C 75 D 9 = C 90 ~ 136

137 Outras médias MÉDIA DE INTERVALO É a média entre a menor e a maior observação em um conjunto de dados. MÉDIA DAS JUNTAS ou Midhinge É a média entre o primeiro e o terceiro quartil. X MENOR + X MAIOR 2 Média de Intevalo = Outras médias X MENOR + X MAIOR 2 Média de Intevalo = Q 1 + Q 3 2 Midhinge = 137

138 Medidas de Dispersão As Medidas de Tendência Central: –representam de certa forma uma determinada distribuição de dados –só elas não são suficientes para caracterizar a distribuição. Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética 138

139 Medidas de Dispersão Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos. GRUPO A : 4, 5, 5, 6 GRUPO B : 0, 0, 10, 10 Média do grupo A: 5 Média do grupo B: 5 139

140 Medidas de Dispersão Os dois grupos apresentam a mesma média O comportamento dos 2 grupos são bem distintos. GRUPO A: valores são mais homogêneos GRUPO B: valores são dispersos em relação à média 140

141 Medidas de Dispersão Dentre as medidas de dispersão pode-se citar algums delas: –a) Amplitude Total –b) Amplitude Interquartil –c) Desvio Quartílico ou Amplitude Semi-interquartílico –d)Desvio Médio –e) Variância –f) Desvio Padrão 141

142 a) Amplitude Total - R –é a diferença entre o maior e o menor valor observados. R = Limite superior - Limite Inferior Exemplo 5: Idade de 20 alunos: X i : 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 R = 9 – 1 = 8 142

143 b) Amplitude Interquartil – AIQ ou IQR ( InterQuartile Range ) é a diferença entre o terceiro quartil e o primeiro quartil. AIQ ou IQR = Q 3 - Q 1 –Supera a dependência dos valores extremos –Abrange 50% dos valores centrais, eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos 143

144 c) Desvio Quartílico ou Amplitude Semi-interquartílico é a diferença entre o terceiro quartil e o primeiro quartil. Dq = Q 3 - Q

145 d) Desvio Médio - DM é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra DM = Σ Xi – X_ n - 1 Sendo: DM = Desvio Médio Xi = vr. variável n = nº elementos X = média aritmética

146 d) Desvio Médio - DM Para uma população DM = Σ Xi – _ n Sendo: DM = Desvio Médio Xi = vr. variável n = nº elementos = média aritmética

147 d) Desvio Médio - DM Exemplo 6: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 a)Calcule a média X = = = 4 b)Montar a tabela a seguir: Σ Xi n 40 10

148 d) Desvio Médio - DM Xi Xi - x Xi – x 2 2 – 4 = – 4 = – 4 = DM = = 4 4 – 4 = – 4 = 0 0 DM = 1, – 4 = – 4 = – 4 = 6 6 Σ 14 Σ Xi – x_ n Considerando uma amostra

149 e) Variância – população: 2 amostra: s 2 –é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética –Revela a dispersão do conjunto que se estuda

150 é a diferença entre o terceiro quartil e o primeiro quartil. Para uma amostra s 2 = Σ (Xi – X ) 2 _ n - 1 Sendo: s 2 = variância amostra Xi = vr. variável n = nº elementos X = média aritmética e) Variância – população: 2 amostra: s 2

151 Para uma população 2 = Σ (Xi – ) 2 _ n Sendo: 2 = variância população Xi = vr. variável n = nº elementos = média aritmética e) Variância – população: 2 amostra: s 2

152 d.1) Variância - 2 – dados simples Exemplo 7: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 a)Calcule a média X = = = 4 b)Montar a tabela a seguir: Σ Xi n 40 10

153 d.1) Variância - s 2 – dados simples Xi Xi - x ( Xi – x ) – 4 = = – 4 = = – 4 = = 1 s 2 = = 4 4 – 4 = = – 4 = = 0 s 2 = = 5, – 4 = = – 4 = = 36 Σ 48 Σ ( Xi – x ) 2 Σ ( Xi – x ) 2 n - 1 n

154 d.2) Variância - s 2 – dados agrupados Xi f i Xi. f i Xi - x ( Xi – x ) 2 ( Xi – x ) 2. f i = 4 2 – 4 = -2 (-2) 2 = = = 9 3 – 4 = -1 (-1) 2 = = = 12 4 – 4 = = = = 5 5 – 4 = = = = = = = 36 Σ fi = 10 Σ fi = 40 Σ fi = 48 se amostra s 2 = s 2 = = 5,33 Σ ( Xi – x ) 2. fi Σ ( Xi – x ) 2. fi Σ fi - 1 Σ fi

155 d.2) Variância - s 2 – dados agrupados em classes X i PM fi PM.fi PM-x ( PM–x ) 2 ( PM–x ) 2.f i = 2 1-5= -4 (-4) 2 = = = = -2 (-2) 2 = = = = = = = = 2 (2) 2 = = = 9 9-5= 4 (4) 2 = = 16 total Σ ( PM – x ) 2. fi Σ ( PM – x ) 2. fi Σ fi - 1 Σ fi - 1 Σ ( PM.fi) Σ ( PM.fi) Σ fi Σ fi X = = X = 5 s2s2 =s2s2 = = s 2 s 2 = s 2 s 2 = 4,4

156 d) Desvio Padrão –Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios –É a mais utilizada –Revela a dispersão do conjunto que se estuda 2 para uma população = 2 ss 2 para uma amostra s = s 2

157 e) Desvio Padrão - ou s –Se todos os valores forem iguais, o desvio padrão é nulo. –quanto maior o desvio padrão mais heterogênea é a distribuição, significa que os valores são mais dispersos em torno da média –MEDIA ± 1 => 68,26% dos valores –MEDIA ± 2 => 95,44% dos valores –MEDIA ± 3 => 99,74% dos valores

158 f) Coeficiente de Variação - CV CV = - desvio padrão X X - média artitmética –o CV mede o grau de heterogeneidade da distribuição –Valor máximo é CV = 1 0 CV 1 158

159 Coeficiente de Variação - CV –Quanto mais próximo de 1: mais heterogênea é a distribuição Os valores estão mais dispersos –Quanto mais próximo de 0: mais homogênea é a distribuição Os valores da variável estão mais próximos em torno da média 159

160 Coeficiente de Variação - CV –Ex: Dado 2 estudantes cujas notas bimestrais foram: a: 60; 40; 50; 50 b: 70; 70; 30; 30 Qual foi mais regular ? 160

161 f) Coeficiente de Variação - CV Na comparação de variabilidade de dois ou mais conjuntos de dados: 1.expressos em diferentes unidades de medida 2.expressos nas mesmas unidades, mas com médias diferentes. 161

162 f) Coeficiente de Variação - CV Comparação de valores expressos em diferentes unidades de medida Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO X PESO = 20 kg X COMPRIMENTO = 50 metros PESO = 2 kg COMPRIMENTO = 4 metros 162

163 f) Coeficiente de Variação - CV X PESO PESO PESO CV P CV P = COMPRIMENTO COMPRIMENTO X COMPRIMENTO X COMPRIMENTO CV C CV C = CV P CV P = CV C CV C = CV P CV P = 0,10 CV C CV C = 0,08 CV PESO CV COMPRIMENTO CV PESO = 0,10 CV COMPRIMENTO = 0,08 PESO varia mais que o comprimento 163

164 f) Coeficiente de Variação - CV expressos nas mesmas unidades, mas com médias diferentes Exemplo 9: Deseja-se comparar qual grupo A ou B tem mais variação de rendimento em um processo: X A = 80 % X B = 50 % A = 2 % B = 1 % 164

165 f) Coeficiente de Variação - CV A A CV A CV A = XAXAXAXA B CV B CV B = XBXBXBXB CV P CV P = CV B CV B = CV A CV A = 0,025 CV B CV B = 0,020 CV A CV B CV A = 0,025 CV B = 0,020 O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processo 165

166 Esquema dos 5 Números Box – Plot ou Gráfico Box-and-Whisker Q 3 3º Quartil Q 1 1º Quartil X Mediana ~ X MENOR X MAIOR 25% dos dados 25% 166

167 Dados suspeitos ou Outliers Q 1 – 1,5. IQR Q 3 + 1,5. IQR Possível suspeito Q IQR Suspeito Q IQR IQR = Q3 - Q1 167


Carregar ppt "Estatística – Conteúdo Programático Conceitos básicos de Estatística e suas aplicações População, amostra, variáveis aleatórias Distribuição de freqüência."

Apresentações semelhantes


Anúncios Google