A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

FESSC - Faculdade Estácio de Sá de Santa Catarina

Apresentações semelhantes


Apresentação em tema: "FESSC - Faculdade Estácio de Sá de Santa Catarina"— Transcrição da apresentação:

1 FESSC - Faculdade Estácio de Sá de Santa Catarina
UNIVERSIDADE FEDERAL DE SANTA CATARINA Programa de Pós-graduação em Odontologia ESTATÍSTICA Prof. Hubert Chamone Gesser, Dr. Graduação em Administração - ESAG/UDESC Graduação em Odontologia - UFSC Pós-graduação em Periodontia - ABO/SC Especialização em Odontologia em Saúde Coletiva - ABO/SC Doutorado e Mestrado em Engenharia de Produção - UFSC ANÁLISE FINANCEIRA - Prof. Hubert Chamone Gesser, Dr.

2 - SUMÁRIO - Conceitos Básicos em Estatística Intervalo de Confiança
Conhecendo os Dados Probabilidades Medidas de Tendência Central Distribuição Binomial Medidas de Ordenamento Distribuição Normal Medidas de Dispersão Correlação Amostragem Testes de Associação Tabelas e Gráficos

3 Conceitos Básicos em Estatística
Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

4 “Informações referentes ao estado”
ESTATÍSTICA ESTATÍSTICA Origem no latim status (estado) + isticum (contar) “Informações referentes ao estado” Coleta, Organização, Descrição, Análise e Interpretação de Dados

5 ASSOCIAÇÃO ENTRE ESTATÍSTICA E ESTADO
Recenseamentos Com o surgimento dos Estados, aparece a necessidade de se contar o povo (produção) e o exército (poder). Esforços dos governos para conhecer seus habitantes, sua condição socioeconômica, sua cultura, sua religião, etc.

6 ASSOCIAÇÃO ENTRE ESTATÍSTICA E PESQUISAS
Pesquisas de Opinião Pública, Estudos Mercadológicos, Estudos Epidemiológicos (observacionais e experimentais) Gráficos e médias publicados na mídia Análise de dados de processos com variabilidade

7 ESTATÍSTICA O Que é Estatística?
Para Sir Ronald A. Fisher ( ): Estatística é o estudo das populações, das variações e dos métodos de redução de dados.

8 ESTATÍSTICA O Que é Estatística? “Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados...” Jon Kettenring Presidente da American Statistical Association, 1997

9 O Que é Estatística (definição)?
“Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.”

10 ESTATÍSTICA LIVROS DE ESTATÍSTICA

11 POR QUE A ESTATÍSTICA É IMPORTANTE?
As diferenças são atribuídas a causas erradas; As coincidências ocorrem frequentemente; As pessoas tem dificuldades com probabilidades; Acrescentam polimento às publicações; Faz conhecer o “grau de confiança” das conclusões.

12 ESTATÍSTICA Indicadores Sociais Diferentes 1o Mundo 3o Mundo
As variabilidades mostram que existem diferenças 1o Mundo 3o Mundo Alta Expectativa de Vida Boas Condições Sanitárias Hábitos de Consumo Assistência em Saúde Doenças Infecciosas Alta Mortalidade Infantil Baixa Escolaridade Iniquidades em Saúde Indicadores Sociais Diferentes

13 EXPECTATIVA DE VIDA – Diferenças entre os países
ESTATÍSTICA EXPECTATIVA DE VIDA – Diferenças entre os países

14 IDH (Longevidade, Educação e Renda) em 2008
ESTATÍSTICA IDH (Longevidade, Educação e Renda) em 2008

15 ESTATÍSTICA Coeficiente de GINI em 2009

16 RENDA PER CAPITA NO BRASIL (PNUD, 2000)
ESTATÍSTICA RENDA PER CAPITA NO BRASIL (PNUD, 2000)

17 RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)

18 ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
ESTATÍSTICA ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)

19 ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)

20 GRÁFICO DE DISPERSÃO - RENDA x EDUCAÇÃO (PNUD, 2000)
ESTATÍSTICA GRÁFICO DE DISPERSÃO - RENDA x EDUCAÇÃO (PNUD, 2000)

21 ESTATÍSTICA FONTES DEMOGRÁFICAS
Bancos de Dados (OMS, OPAS, MS, IBGE, etc) Indicadores Sociais (IDH, GINI, QV) Pesquisas de Mercado (Hábitos de Consumo) Censos Demográficos Pesquisa Nacional por Amostra de Domicílios (PNAD) Programa das Nações Unidas para o Desenvolvimento (PNUD)

22 ESTATÍSTICA POPULAÇÃO E AMOSTRA
POPULAÇÃO: Conjunto de elementos que se deseja estudar AMOSTRA: Subconjunto da população Nem sempre o Censo é viável (questões econômicas) É mais barato coletar dados de amostras POPULAÇÃO E AMOSTRA

23 POPULAÇÃO: Também chamada de Universo
ESTATÍSTICA POPULAÇÃO: Também chamada de Universo AMOSTRA: Parte da população População Amostra

24 ESTATÍSTICA POPULAÇÃO E AMOSTRA
POPULAÇÃO (N): Todos os estudantes da UFSC AMOSTRA (n): Parte dos estudantes da UFSC POPULAÇÃO E AMOSTRA Plano de Amostragem

25 ESTATÍSTICA REQUISITOS DE UMA AMOSTRA
1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra 2) Constituintes selecionados ao acaso (sorteio)

26 ESTATÍSTICA CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA
Amostras Grandes: n > 100 Amostras Médias: n > (30 < n < 100) Amostras Pequenas: n < (12 < n < 30) Amostras Muito Pequenas: n < 12 Observação: As amostras com n > 30 geram melhores resultados. O tamanho adequado deve ser pré-calculado.

27 ESTATÍSTICA Amostragem e Planejamento de Experimentos
Áreas da Estatística Amostragem e Planejamento de Experimentos (coleta dos dados) Estatística Descritiva (organização, apresentação e sintetização dos dados) Estatística Inferencial (testes de hipóteses, estimativas, probabilidades)

28 ESTATÍSTICA Amostragem e Planejamento de Experimentos
(coleta dos dados) - É o processo de escolha da amostra - É o início de qualquer estudo estatístico Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo Exemplos: Pesquisa sobre tendência de votação Cuidado: Perfil da Amostra = Perfil da População

29 ESTATÍSTICA Estatística Descritiva É a parte mais conhecida
(organização, apresentação e sintetização dos dados) É a parte mais conhecida Diariamente veiculada na mídia (jornais, televisão, rádio) Distribuições de frequência, médias, tabelas, gráficos Exemplos: % de Analfabetos em uma comunidade Índice de Mortalidade Infantil (por mil nascimentos) Índice de Desenvolvimento Humano

30 ESTATÍSTICA Os Gráficos são Estatísticas Descritivas

31 ESTATÍSTICA Declínio do Índice CPOD no Brasil  CPOD de 6,65
(Hebiatras aos 12 anos de idade)  CPOD de 6,65 1993  CPOD de 4,84 1996  CPOD de 3,06 2003  CPOD de 2,78 Os Índices são Estatísticas Descritivas

32 ESTATÍSTICA Estatística Inferencial, Indutiva ou Analítica
(testes de hipóteses, estimativas) Auxilia o processo de tomada de decisões Responde uma dúvida, compara grupos Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que uma delas será aceita mediante a aplicação de um teste estatístico baseado na teoria das probabilidades. Exemplo: O tabagismo está associado às doenças pulmonares? Hipóteses: Nula (não há associação), Alternativa (há associação)

33 ESTATÍSTICA EXERCÍCIO No 1
Em uma cidade de habitantes onde 45% das pessoas têm título de eleitor, realizou-se uma pesquisa eleitoral com 2000 pessoas. Qual é o tamanho da população de estudo e o da amostra?

34 ESTATÍSTICA EXERCÍCIO No 2
Uma amostra de apenas 3000 eleitores pode fornecer um perfil confiável sobre a preferência de todo o eleitorado, na véspera de uma eleição presidencial? Por que?

35 ESTATÍSTICA EXERCÍCIO No 3
Você considera a pesquisa proposta no exercício anterior como experimental ou de levantamento? Por quê?

36 ESTATÍSTICA EXERCÍCIO No 4
Elabore uma situação em que a estatística possa ser empregada em benefício de uma organização de saúde.

37 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Conhecendo os Dados Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

38 ESTATÍSTICA TIPOS DE DADOS Dados Nominais (Sexo, Raça, Cor dos Olhos)
Dados Ordinais (Grau de Satisfação) Dados Numéricos Contínuos (Altura, Peso) Dados Numéricos Discretos (Número de Filiais) “Estatísticas aplicadas em alguns tipos de dados não podem ser aplicadas em outros .”

39 ESTATÍSTICA TIPOS DE DADOS Dados Intervalares (Temperatura oC) Quando se referem a valores obtidos mediante a aplicação de uma unidade de medida arbitrária, porém constante e onde o zero é relativo. Este tipo de dado tem restrições a cálculos. 30oC não é três vezes mais quente que 10oC Para cálculos se utiliza a escala Kelvin

40 ESTATÍSTICA ARREDONDAMENTO DE DADOS CONTÍNUOS
1ª Regra: Arredondar para o número mais próximo 2ª Regra: Arredondar para o par mais próximo 5, ,5 6,0 6,0 6,5 7,0

41 ESTATÍSTICA EXERCÍCIO No 1 Faça os seguintes arredondamentos:
38, para o centésimo mais próximo ,65 54,76 para o décimo mais próximo 54,8 27,465 para o centésimo mais próximo 27,46 42,455 para o centésimo mais próximo 42,46 4,5 para o inteiro mais próximo 4

42 AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
ESTATÍSTICA AGRUPAMENTO DE DADOS POR VALORES DISTINTOS x f (frequência) 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28

43 AGRUPAMENTO DE DADOS POR CLASSES
ESTATÍSTICA AGRUPAMENTO DE DADOS POR CLASSES Classes f (frequência) Ponto Médio ,5 ,5 ,5 ,5 ,5

44 POLÍGONO DE FREQUÊNCIA
ESTATÍSTICA POLÍGONO DE FREQUÊNCIA f x f Total 28 10 8 6 4 2 x

45 ESTATÍSTICA EXERCÍCIO No 2
Em uma amostra de estudantes foram coletadas as seguintes alturas em metros: 1,70 1,58 1,67 1,72 1,70 1,71 1,75 1,58 1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77 1,76 1,75 1,73 1,65 1,64 1,63 1,62 1,66 1,71 1,68 1,69 1,70 1,59 1,61 1,64 1,76 1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70 1,67 1,71 1,72 1,63 1,70 a) Qual foi o tamanho da amostra (n)? b) Qual é a altura do sujeito mais alto e a do mais baixo? c) Faça o agrupamento de dados por valores distintos. d) Faça o agrupamento por 6 classes.

46 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Análise Vertical:
Assimétrica Positiva (esquerda) Leptocúrtica (alta) Simétrica Mesocúrtica Assimétrica Negativa (direita) Platicúrtica (baixa) Análise Conjunta: Assimétrica Positiva Leptocúrtica Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”

47 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal:
Assimétrica Positiva (esquerda) f x

48 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Simétrica f x

49 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal:
Assimétrica Negativa (direita) f x

50 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical: Leptocúrtica (alta)
x

51 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical: Mesocúrtica f x

52 ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical:
Platicúrtica (baixa) f x

53 DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
ESTATÍSTICA DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS Apresentam-se os valores absolutos e as porcentagens Podem ser usadas tabelas ou gráficos Gráfico de Barras Gráfico Circular

54 ESTATÍSTICA DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS CUIDADO!!!
Gráfico de Linhas (não é usado, pois é restrito a dados numéricos contínuos) Gráfico de Barras Horizontal

55 DESCRIÇÃO DOS DADOS CONTÍNUOS
ESTATÍSTICA DESCRIÇÃO DOS DADOS CONTÍNUOS Trazem informações que expressam a tendência central e a dispersão dos dados. Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo ) Medidas de Dispersão: Desvio Padrão, Variância, Amplitude, Coeficiente de Variação, Valor Máximo, Valor Mínimo

56 ESTATÍSTICA EXERCÍCIO No 3
Em uma pesquisa com jogadoras de basquete foram coletados os seguintes pesos corporais em quilogramas: a) Qual foi o tamanho da amostra (n)? b) Qual é o maior peso e o menor? c) Faça o agrupamento de dados por valores distintos. d) Faça o agrupamento em 3 classes.

57 Medidas de Tendência Central
Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

58 MEDIDAS DE TENDÊNCIA CENTRAL
ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL Nos dão uma idéia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados. Medidas: Média, Moda e Mediana. f x

59 ESTATÍSTICA x = S x / n x = S fx / n x = S fx / n MÉDIA
É um valor típico representativo de um conjunto de dados. Fisicamente representa o ponto de equilíbrio da distribuição. Modos de calcular 1) para dados simples 2) para valores distintos 3) para agrupamentos em classes x = S x / n x = S fx / n x = S fx / n

60 ESTATÍSTICA 16 18 23 21 17 16 19 20 x = S x / n MÉDIA
1) Cálculo para dados simples x = S x / n S x = Soma dos valores n = tamanho da amostra x = ( ) 8 x = 18,75

61 ESTATÍSTICA x f fx x = S fx / n MÉDIA
2) Cálculo para valores distintos x f fx Total x = S fx / n S fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = x = 4,7857 28

62 ESTATÍSTICA x = S fx / n Classes f x fx MÉDIA
3) Cálculo para agrupamentos em classes Classes f x fx , , ,5 , ,5 , , ,5 Total ,5 x = S fx / n S fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 1695, x = 67,82 25

63 ESTATÍSTICA Interpretação: MEDIANA
É o valor que ocupa a posição central de um conjunto de dados ordenados. Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários. Interpretação: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana.

64 ESTATÍSTICA MEDIANA 1) Cálculo da posição da mediana para dados simples PMd =(n+1) / 2 PMd = (9+1) / 2 PMd = 5o Termo Mediana (Md) = 6

65 ESTATÍSTICA MEDIANA 2) Cálculo da posição da mediana para valores distintos x f fa o o o o o o o Total PMd =(n+1) / 2 PMd = (28+1) / 2 PMd = 14,5 x entre 14o e 15o Termo Mediana (Md) = 5

66 Mediana (Md) = 66,5 (estimativa)
ESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Classes f x fa , o , o , o , o , o Total PMd =(n+1) / 2 PMd = (25+1) / 2 PMd = 13o Termo Classe Mediana Mediana (Md) = 66,5 (estimativa)

67 Md = Li + ((PMd - faa) / f ) . A
ESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Pode-se fazer a interpolação da classe mediana Md = Li + ((PMd - faa) / f ) . A Li = limite inferior da classe mediana PMd = posição da mediana faa = frequência acumulada da classe anterior f = frequência da classe mediana A = amplitude da classe mediana Classe Mediana

68 Md = Li + ((PMd - faa) / f ) . A
ESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Interpolação da classe mediana Md = Li + ((PMd - faa) / f ) . A Md = ((13 - 9) / 5) . 11 Mediana (Md) = 69,8 Classe Mediana

69 ESTATÍSTICA MODA É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo 1) Moda para dados simples Exemplos: 2, 3, 4, 5, 6, 7, AMODAL 2, 3, 3, 4, 5, 6 , MODA = 3 2, 3, 3, 4, 5, 5, BIMODAL (Mo = 3 e Mo = 5)

70 O valor 5 tem o maior número de ocorrências (9)
ESTATÍSTICA MODA 2) Moda para valores distintos x f Total 28 O valor 5 tem o maior número de ocorrências (9) Mo = 5

71 ESTATÍSTICA Classes f x fa MODA 3) Moda para agrupamentos em classes
Total Moda Bruta Ponto médio da classe de maior frequência Mo = 77,5 É uma estimativa

72 ESTATÍSTICA MODA 3) Moda para agrupamentos em classes Moda de King
Mo = Li + (A . f2 / (f1 + f2)) Li = limite inferior da classe modal A = amplitude do intervalo da classe modal f1 = frequência da classe anterior a modal f2 = frequência da classe posterior a modal Mo = 72 + (11 . 5) 5 + 5 Mo = 77,5

73 USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
ESTATÍSTICA USO DAS MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA: Dados Numéricos e Intervalares É a medida mais utilizada. MODA: Dados Nominais MEDIANA: Dados Ordinais

74 ESTATÍSTICA EXERCÍCIO No 1 6 5 8 4 7 6 9 7 3
Determine a média, a mediana e a moda para o seguinte conjunto de dados

75 ESTATÍSTICA EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados

76 ESTATÍSTICA Classes f EXERCÍCIO No 3
Dado o seguinte agrupamento em classes determine: Classes f 1, , 1, , 1, , 1, , 1, , Total a) os pontos médios de cada classe b) a classe modal c) a moda bruta d) a moda de King e) a classe mediana f) a mediana por agrupamento de classes g) a média por agrupamento de classes

77 Medidas de Ordenamento
Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

78 ESTATÍSTICA MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em rol Medidas: QUARTIS, DECIS E PERCENTIS Os Quartis dividem a disposição em 4 partes iguais Q1, Q2, Q3 Os Decis dividem a disposição em 10 partes iguais D1, D2, D3, D4, D5, D6, D7, D8, D9 Os Percentis dividem a disposição em 100 partes iguais P1, P2, P3, P4, P5, P6, , P99

79 ESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q3 Entre cada quartil há 25% dos dados da disposição Posição do Primeiro Quartil (Q1) = (n + 1) / 4 Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4 Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4 O segundo quartil coincide com a Mediana (Q2 = Md)

80 Os Quartis dividem a disposição em 4 partes iguais
ESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q1, Q2, Q3 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9 n = 27 Q1 Q2 Q3 7o termo 14o termo 21o termo

81 ESTATÍSTICA DECIS Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9 Entre cada decil há 10% dos dados da disposição Posição do Primeiro Decil (D1) = (n + 1) / 10 Posição do Segundo Decil (D2) = 2.(n + 1) / 10 Posição do Nono Decil (D9) = 9.(n + 1) / 10 O Quinto Decil coincide com a Mediana (D5 = Md)

82 ESTATÍSTICA PERCENTIS
Os percentis dividem a disposição em 100 partes iguais P1, P2, P3, P4, P5, P6, , P99 Entre cada percentil há 1% dos dados da disposição Posição do Primeiro Percentil (P1) = (n + 1) / 100 Posição do Segundo Percentil (P2) = 2.(n + 1) / 100 Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100 P50 = Md P25 = Q P75 = Q3

83 ESTATÍSTICA 10 13 24 45 66 77 11 14 26 33 65 21 57 EXERCíCIOS
1) Dado o conjunto de dados: a) apresente a disposição em rol; b) o Percentil 50, c) o Primeiro Quartil, d) a Média, e) a Moda e f) a Mediana

84 ESTATÍSTICA 2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?

85 ESTATÍSTICA 3) Determine a média, a moda, a mediana, o 1o quartil, o 5o decil, o percentil 75 e o percentil 50 para a seguinte distribuição por valores distintos? Pesos (kg) f 65 10 66 12 67 12 68 15 69 14 70 9 71 5

86 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Medidas de Dispersão Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

87 ESTATÍSTICA DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade. Medidas mais comuns: Variância, Desvio Padrão, Amplitude Dispersão dos dados na amostra f Dispersão dos dados na população x

88 Dispersão na População
ESTATÍSTICA Dispersão na População É uma forma de se ver o quanto os dados se afastam da média. Exemplo: Vilarejo com apenas 11 pessoas 135cm cm 136cm cm 138cm cm 141cm cm 143cm cm 152cm Média = 149cm Mediana e Moda = 152cm Valor Máximo = 170cm Valor Mínimo = 135cm Amplitude = 35cm Alturas de 11 pessoas

89 Dispersão na População Soma dos desvios quadráticos
ESTATÍSTICA Dispersão na População Alturas (N=11) x - x (x - x)2 135cm 136cm 138cm 141cm 143cm 152cm 157cm 163cm 170cm Total 2 Variância = 1314 / 11 = 119,454 cm2 s Desvio Padrão = ,454 = 10,92 cm Soma dos desvios quadráticos

90 ESTATÍSTICA s2 = S ( x - x )2 / N s = s2
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO Variância da população s2 = S ( x - x )2 / N Desvio Padrão da população = Raiz quadrada da variância s = s2 Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.

91 ESTATÍSTICA s2 = S ( x - x )2 / ( n -1 ) s = s2
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA Variância da Amostra ( s2 ou v ) s2 = S ( x - x )2 / ( n -1 ) Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância s = s2 A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático

92 É um modo de representar a dispersão dos dados ao redor da média.
ESTATÍSTICA DESVIO PADRÃO SIGNIFICADO: É um modo de representar a dispersão dos dados ao redor da média. f x Média

93 ESTATÍSTICA DESVIO PADRÃO
A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B. f f Curva A Curva B x x Média Média

94 ESTATÍSTICA COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada, assim um desvio medido em dias será maior do que um medido em meses. O coeficiente de variação expressa o desvio-padrão como porcentagem do valor da média. COEF. VARIAÇÃO = DESVIO PADRÃO MÉDIA Quanto menor for este coeficiente mais homogênea é a amostra.

95 COEFICIENTE DE VARIAÇÃO GRAU DE HOMOGENEIDADE DOS DADOS
ESTATÍSTICA COEFICIENTE DE VARIAÇÃO Classificação da proporção que o desvio padrão apresenta sobre a média. GRAU DE HOMOGENEIDADE DOS DADOS até 10%  ÓTIMO de 10% a 20%  BOM de 20% a 30%  REGULAR acima de 30%  RUIM

96 ESTATÍSTICA 4 5 5 6 6 7 7 8 EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:

97 ESTATÍSTICA 2) Determine o valor de n, a amplitude, a média, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:

98 ESTATÍSTICA 3) Com base nos coeficientes de variação calculados nos dois exercícios anteriores classifique a dispersão encontrada:

99 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Amostragem Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

100 APLICAÇÕES DE AMOSTRAGEM Inferência Estatística
Pesquisa Mercadológica (Índice de satisfação na população) Pesquisa Epidemiológica (Prevalência de uma doença na população) Pesquisa Eleitoral (Percentagem de votos para cada candidato) Perfil Socioeconômico da População (Grau de escolaridade, Renda) Na População Parâmetros Na Amostra Estatísticas População Amostra Inferência Estatística

101 POR QUE USAR A AMOSTRAGEM? QUANDO NÃO USAR A AMOSTRAGEM?
ESTATÍSTICA POR QUE USAR A AMOSTRAGEM? Economia (É mais barato levantar dados de uma parcela da população) Tempo (É mais rápido) Confiabilidade dos Dados (Entrevista mais atenciosa, menos erros) Operacionalidade (Facilidade de controle dos entrevistadores) Quando a população for pequena (n > 0,8.N) Quando a característica for de fácil mensuração (Sim ou Não) Quando houver a necessidade de alta precisão (Censo IBGE) QUANDO NÃO USAR A AMOSTRAGEM?

102 ESTATÍSTICA TIPOS DE AMOSTRAGEM AMOSTRAGEM ALEATÓRIA SIMPLES
(Tem que obedecer a propriedade de qualquer elemento da população ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela de números aleatórios ou sorteios) AMOSTRAGEM ALEATÓRIA SISTEMÁTICA (Após obter-se a lista dos elementos da população, sorteia-se a entrada e segue-se a relação N/n.) AMOSTRAGEM ALEATÓRIA ESTRATIFICADA (Elabora-se a amostra através do perfil conhecido da população. Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é confeccionada obedecendo-se estes parâmetros.)

103 OUTROS TIPOS DE AMOSTRAGEM
ESTATÍSTICA OUTROS TIPOS DE AMOSTRAGEM AMOSTRAGEM NÃO ALEATÓRIA (De fácil obtenção.) AMOSTRAGEM PARA ESTUDOS COMPARATIVOS (Não visa a descrição de uma população, mas a comparação entre grupos diferentes. Exemplos: Comparar as taxas de tabagismo em indivíduos com câncer de pulmão e sadios.) Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.

104 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Fórmula Genérica Sejam: n0 = Primeira aproximação para o tamanho da amostra e = Erro Amostral Tolerável (exemplo: 0,05) n = Tamanho da Amostra N = Tamanho da População n0 = 1 / e2 n = (N . n0) / (N + no)

105 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Fórmula para variável quantitativa, desvio conhecido e população infinita Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão da população e = Erro do estudo expresso na mesma unidade do desvio padrão n = (z . s /e)2

106 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Fórmula para variável quantitativa, desvio desconhecido e população infinita Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão de uma amostra previamente selecionada e = Erro do estudo expresso na mesma unidade do desvio padrão n = (z . s/e)2

107 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Fórmula para variável quantitativa, desvio conhecido e população finita Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão população e = Erro do estudo expresso na mesma unidade do desvio padrão N = Tamanho da População n = z2 . s 2 . N z2 . s 2 + e2 . (N-1)

108 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Fórmula para variável quantitativa, desvio desconhecido e população finita Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão uma amostra previamente selecionada e = Erro do estudo expresso na mesma unidade do desvio padrão N = Tamanho da população n = z2 . s2 . N z2 . s2 + e2 . (N-1)

109 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Populações infinitas com proporção conhecida z2 . p . (1-p)) e2 n = Onde: n= Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05) p = Proporção do evento na População (prevalência de uma doença)

110 DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Populações finitas com proporção conhecida (N . z2 . p . (1-p)) (e2 . (N-1) + z2 . p . (1-p)) n = Onde: n = Tamanho da amostra N = Tamanho da População z = Nível de confiança expresso em desvio padrão (95%) = 1,96 e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05) p = Proporção do evento na População (prevalência de uma doença)

111 ESTATÍSTICA RELAÇÃO ENTRE (n) E (N)
Relação entre o tamanho da população e o tamanho da amostra n 600 500 400 300 200 100 N

112 ESTATÍSTICA EXERCÍCIOS
1) Determine o tamanho da amostra para uma pesquisa eleitoral em uma cidade com eleitores, adotando uma margem de erro de 2 pontos percentuais. Utilize a fórmula genérica.

113 ESTATÍSTICA 2) Determine o tamanho da amostra para um pesquisa epidemiológica sobre a prevalência da doença periodontal em adultos jovens numa cidade com 3452 jovens, adotando-se o nível de confiança de 95% (z=1,96) e o erro amostral tolerável de 4%. Estudos anteriores indicavam que a prevalência desta doença, nesta mesma população era de 86%. Estima-se ainda que 10% das pessoas poderiam se recusar em participar da pesquisa.

114 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Tabelas e Gráficos Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

115 ESTATÍSTICA Vantagens: TABELAS
Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. Uma tabela estatística conterá necessariamente uma série ou uma distribuição de frequência. Vantagens: - Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.

116 NORMAS PARA A CONFECÇÃO DE TABELAS
ESTATÍSTICA NORMAS PARA A CONFECÇÃO DE TABELAS São numeradas consecutivamente com algarismos arábicos; Os números são precedidos da palavra “Tabela”; No topo deve estar o título que indica a natureza e as abrangências geográficas e temporal dos dados numéricos; O centro da tabela é representado por uma série de colunas e subcolunas onde são alocados os dados; No rodapé deve-se colocar a fonte (o responsável pelos dados) e opcionalmente uma nota geral ou uma nota específica; A moldura deve conter no mínimo 3 traços horizontais; Não se deve fechar uma tabela com traços verticais em suas extremidades.

117 CLASSIFICAÇÃO DAS TABELAS
ESTATÍSTICA CLASSIFICAÇÃO DAS TABELAS Séries Cronológicas (temporais ou históricas); Variável: Tempo Constantes: Lugar e Espécie Séries Geográficas (territoriais); Variável: Lugar Constantes: Tempo e Espécie Séries Especificativas; Variável: Espécie Constantes: Tempo e Lugar Séries Mistas; Quando há mais de uma variável. Distribuição de Frequência

118 Séries Cronológicas (Temporais ou Históricas)
ESTATÍSTICA Séries Cronológicas (Temporais ou Históricas) Tabela 1: Prevalência da Doença X na Cidade Y Anos Percentual ,74 ,85 ,94 ,45 Fonte: Hipotética

119 Séries Geográficas (Territoriais)
ESTATÍSTICA Séries Geográficas (Territoriais) Tabela 2: Prevalência da Doença X no Ano de 2003 Cidades Percentual Itajaí 10,44 Lages 29,45 Florianópolis 8,66 Blumenau 9,82 Fonte: Hipotética

120 Séries Especificativas
ESTATÍSTICA Séries Especificativas Tabela 3: Prevalência da Doença X no Ano de 2003 em Florianópolis Segmento populacional Percentual Crianças 60,25 Jovens ,72 Adulto ,75 3a Idade 5,82 Fonte: Hipotética

121 Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)
ESTATÍSTICA Séries Mistas (Ex: Especificativa-Cronológica-Geográfica) Tabela 4: Vendas de alguns produtos por ano e cidade (milhares) Produtos Fpolis Lages Fpolis Lages Cosméticos , , , Vestuário , , , ,48 Audio , , , ,57 Video , , , ,84 Fonte: Hipotética

122 Distribuições de Frequência
ESTATÍSTICA Distribuições de Frequência Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas) Pesos Frequência Frequência Acumulada Total Fonte: Hipotética

123 ESTATÍSTICA Vantagens: GRÁFICOS
Gráfico é a forma geométrica de apresentação dos dados e respectivos resultados de sua análise. A escolha do modelo ideal de representação gráfica depende das preferências e do senso estético do elaborador. Vantagens: - Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.

124 NORMAS PARA A CONFECÇÃO DE GRÁFICOS
ESTATÍSTICA NORMAS PARA A CONFECÇÃO DE GRÁFICOS Deve facilitar a interpretação dos dados para um leigo; Não há a necessidade de se colocar título se estiver na mesma página da tabela correspondente; Há a necessidade de se colocar o título se a tabela correspondente não estiver na mesma página. O senso estético individual determina o espaço do gráfico (L x A); As colunas, barras, linhas e áreas gráficas devem ser ordenadas de modo crescente ou decrescente, mas a ordem cronológica prevalece;

125 Eixo x Valores da Variável
ESTATÍSTICA ORIGEM DOS GRÁFICOS O diagrama cartesiano é a figura geométrica que deu origem à técnica de construção de gráficos estatísticos. Utiliza-se o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Ordenadas (eixo y) 1o Quadrante Abscissas (eixo x) Eixo y Frequências Eixo x Valores da Variável

126 GRÁFICO EM COLUNAS OU DE BARRAS
ESTATÍSTICA GRÁFICO EM COLUNAS OU DE BARRAS Tabela 1: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia Bioquímica Imunologia Parasitologia Fonte: Hipotética Figura 1: Gráfico em colunas do número de exames em um determinado laboratório em 2003.

127 GRÁFICO DE BARRAS HORIZONTAL
ESTATÍSTICA GRÁFICO DE BARRAS HORIZONTAL Tabela 2: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia Bioquímica Imunologia Parasitologia Fonte: Hipotética Figura 2: Gráfico em barras horizontais do número de exames realizados em um determinado laboratório no ano de 2003.

128 GRÁFICO DE SETORES OU CIRCULAR
ESTATÍSTICA GRÁFICO DE SETORES OU CIRCULAR Tabela 3: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia Bioquímica Imunologia Parasitologia Fonte: Hipotética Figura 3: Gráfico circular do número de exames realizados em um determinado laboratório no ano de 2003.

129 HISTOGRAMA DE FREQUÊNCIA Fonte: Dados Fictícios
ESTATÍSTICA HISTOGRAMA DE FREQUÊNCIA Tabela 4: Notas dos alunos na disciplina de Estatística no curso de Administração (ano x) Notas Frequência Fonte: Dados Fictícios Figura 4: Histograma das notas dos alunos

130 HISTOGRAMA DE FREQUÊNCIA
ESTATÍSTICA HISTOGRAMA DE FREQUÊNCIA A área do histograma é proporcional à soma das frequências; Para comparar duas distribuições, o ideal é utilizar números percentuais; Figura 5: Histograma dos percentuais das notas dos alunos

131 POLÍGONO DE FREQUÊNCIA
ESTATÍSTICA POLÍGONO DE FREQUÊNCIA É um Gráfico em Linha de uma distribuição de frequência; Para se obter um polígono (linha fechada), deve-se completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e posterior à última, da distribuição. Figura 6: Polígono de Frequência percentual de das notas dos alunos

132 POLÍGONO DE FREQUÊNCIAS ACUMULADAS Fonte: Dados Fictícios
ESTATÍSTICA POLÍGONO DE FREQUÊNCIAS ACUMULADAS (Sinônimo: Ogiva) Tabela 5: Notas dos alunos na disciplina de estatística no ano x Notas Frequência F. Acumulada % ,7 ,7 ,1 ,7 ,0 Fonte: Dados Fictícios Figura 7: Polígono de frequências acumuladas das notas dos alunos

133 GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
ESTATÍSTICA GRÁFICO STEM AND LEAF (TRONCO E FOLHAS) Tronco (Stem) Folha (Leaf) 4 57 6 235 7 12 45 47 71 72 Figura 8: Gráfico Stem-Leaf onde o primeiro dígito é o tronco e o segundo é a folha Conjunto de Dados

134 GRÁFICO DE BARRAS COM DESVIO PADRÃO
ESTATÍSTICA GRÁFICO DE BARRAS COM DESVIO PADRÃO Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de estudantes da faculdade x (valores fictícios).

135 GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
ESTATÍSTICA GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode) 1,95m 1,90m 1,85m 1,80m 1,75m 1,70m 1,65m 1,60m 1,55m Valor Máximo Percentil 75 Percentil 50 Percentil 25 Valor Mínimo Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).

136 ESTATÍSTICA EXERCÍCIOS
1) Construa uma série cronológica com os dados das vendas de um determinado produto de uma empresa fictícia.

137 ESTATÍSTICA 2) Construa o Gráfico de Barras com os dados do exercício anterior.

138 ESTATÍSTICA 3) Construa o Gráfico em Setores do seguinte agrupamento em classes: Pesos (Kg) f 60 15 80 26 Total 88

139 Intervalo de Confiança
Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

140 ESTATÍSTICA POPULAÇÃO E AMOSTRA x x x Média x x x População Amostras

141 Distribuição da população
ESTATÍSTICA POPULAÇÃO E AMOSTRA f Distribuição da população Distribuição das médias de amostras de mesmo tamanho extraídas da população x x

142 ESTATÍSTICA POPULAÇÃO E AMOSTRA
A média calculada para uma amostra dificilmente será igual à média real da população; O tamanho da discrepância depende do tamanho da amostra e da variabilidade dos dados. f Discrepância Inversamente proporcional a n Diretamente proporcional à variabilidade dos dados x Média a Média b

143 ESTATÍSTICA ERRO PADRÃO DAS MÉDIAS f x
O desvio padrão da distribuição das médias é chamado ERRO PADRÃO DAS MÉDIAS (EPM) x x

144 CÁLCULO DO ERRO PADRÃO DAS MÉDIAS (EPM)
ESTATÍSTICA ERRO PADRÃO DAS MÉDIAS CÁLCULO DO ERRO PADRÃO DAS MÉDIAS (EPM) EPM = s / n f Mede a dispersão das médias das diferentes amostras de mesmo tamanho, extraídas da mesma população, em torno da média das médias, isto é, em torno da média verdadeira da população estudada. x x

145 CÁLCULO DO ERRO-PADRÃO A PARTIR DE UMA AMOSTRA COM 10 PESOS
ESTATÍSTICA CÁLCULO DO ERRO-PADRÃO A PARTIR DE UMA AMOSTRA COM 10 PESOS Pesos (n=10) x - x (x - x)2 20Kg 23Kg 24Kg 36Kg 37Kg 38Kg 39Kg 43Kg 45Kg 55Kg Total Variância (s2) = 1074 / (10-1) = 119,333 Kg2 Desvio Padrão (s) = ,333 = 10,924 Kg Erro Padrão (EPM) = 10,924 / 10 = 3,45 Kg

146 INTERVALO DE CONFIANÇA (Amostras Grandes)
ESTATÍSTICA INTERVALO DE CONFIANÇA (Amostras Grandes) Mostra o intervalo em que se situa a média real da população; Comumente se adota um intervalo com 95% de confiança (z=1,96); O tamanho da amostra deve ser razoavelmente grande (n>30). Média a Média b f x Limite Inferior: IC(95%) = x - 1,96 . EPM Limite Superior: IC(95%) = x + 1,96 . EPM

147 INTERVALO DE CONFIANÇA (Amostras Pequenas) Distribuição t de Student
ESTATÍSTICA INTERVALO DE CONFIANÇA (Amostras Pequenas) Comumente se adota um intervalo com 95% de confiança; O valor de t (Distribuição t de Student) varia conforme o tamanho da amostra (gl = n-1) Possibilita o cálculo para amostras pequenas (n<30). f Limite Inferior: IC(95%) = x - t . EPM Limite Superior: IC(95%) = x + t . EPM Distribuição t de Student Média a Média b x

148 ESTATÍSTICA COMPARAÇÃO DE DISTRIBUIÇÕES Amostras Pequenas
Valor de t é variável (t = 1,96 a 12,706) 95% de Confiança Amostras Grandes Valor de z é constante (z = 1,96) 95% de Confiança Média a Média b f x f Média a Média b x Distribuição t de Student Distribuição Normal

149 INTERVALO DE CONFIANÇA
ESTATÍSTICA INTERVALO DE CONFIANÇA INTERPRETAÇÃO: Se forem extraídas 100 amostras de mesmo tamanho da população, 95 delas estarão situadas dentro do intervalo e 5 não; Um intervalo de confiança muito grande sugere que a média da amostra encontrada é pouco representativa da média (verdadeira) da população; O erro padrão da média mostra o quão bem a média é conhecida, assim quanto menor for o EPM menor será o IC.

150 INTERVALO DE CONFIANÇA
ESTATÍSTICA INTERVALO DE CONFIANÇA EXEMPLO: Em uma amostra de 300 estudantes do sexo masculino da faculdade Z, verificou-se que a média das alturas era de 1,75m. Sabendo que o desvio-padrão da amostra era de 10cm, determine o intervalo de confiança para a média das alturas desta população. EPM = s / n IC(95%) = x - 1,96 . EPM = ,96 . 0,5773 = 173,87cm EPM = 10 / IC(95%) = x + 1,96 . EPM = ,96 . 0,5773 = 176,13cm EPM = 0,5773cm 1,7387m ,7613m

151 COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
ESTATÍSTICA COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA IC (95%) Faculdade Z 1,7387m ,7613m x = 1,75m IC (95%) IES X 1,71m ,75m x = 1,73m Conclusão: As médias populacionais não devem ser consideradas diferentes.

152 ESTATÍSTICA COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
IC (95%) Faculdade Z 1,7387m ,7613m x = 1,75m IC (95%) IES Y 1,726m 1,734m x = 1,73m Conclusão: As médias populacionais PODEM ser consideradas diferentes.

153 ESTATÍSTICA EXERCÍCIOS
1) Quando se compara duas médias amostrais oriundas de populações distintas, pode-se dizer que as populações são diferentes quando as médias amostrais são diferentes?

154 ESTATÍSTICA 2) Um hospital A verificou que os pacientes internados tinham um prazo médio de recuperação para uma determinada doença mensurado em torno de 10 dias e desvio padrão de 1 dia. Outra amostra de pacientes do Hospital B, internados com a mesma doença apresentou como média 12 dias e desvio padrão de 2,5 dias. Sabendo que a primeira amostra continha 70 pacientes e a segunda 90 pergunta-se: Há diferença entre as duas populações com relação ao tempo necessário de recuperação?

155 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Probabilidades Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

156 MODELOS PROBABILÍSTICOS
ESTATÍSTICA MODELOS PROBABILÍSTICOS Os modelos probabilísticos são construídos a partir de hipóteses ou conjeturas sobre o problema em questão e constituem-se de duas partes: ( 1 ) dos possíveis resultados ( 2 ) do quão provável é cada resultado. Exemplo: Lançamento de uma moeda Possíveis resultados  { cara, coroa } Probabilidade de ocorrer cara é igual a de ocorrer coroa

157 ESTATÍSTICA ESPAÇO AMOSTRAL
É o conjunto de todos os resultados possíveis de um experimento. O espaço amostral é representado pelo símbolo  Lançamento de uma moeda Possíveis resultados   = { cara, coroa } Lançamento de um dado Possíveis resultados   = { 1, 2, 3, 4, 5, 6 }

158 É qualquer conjunto de resultados possíveis de um experimento.
ESTATÍSTICA EVENTO É qualquer conjunto de resultados possíveis de um experimento. Lançamento de um dado Possíveis resultados   = { 1, 2, 3, 4, 5, 6 } EVENTOS: A = ocorrer um número par  A = { 2, 4, 6 } B = ocorrer um número menor que 3  B = { 1, 2 } C = ocorrer o ponto seis  C = { 6 } D = ocorrer um ponto maior que seis  D = { }

159 ESTATÍSTICA PROBABILIDADES
São valores entre 0 (zero) e 1 (um), onde a soma de todos os resultados possíveis do experimento deve ser igual a 1 (um). Modelos Probabilísticos  no lançamento de uma moeda Resultado Probabilidade Cara ,5 Coroa ,5  na retirada de uma bola de uma urna com 7 bolas vermelhas e 3 azuis Bola Vermelha ,7 Bola Azul ,3

160 ESTATÍSTICA PROBABILIDADES Princípio da Equiprobabilidade
P (A) = n = número de resultados de A N número total de resultados Exemplo: no lançamento de um dado A = ocorrer um número par P(A) = 3/6 = ½ = 0,5 B = ocorrer um número menor que P(B) = 2/6 = 1/3 = 0,333 C = ocorrer o ponto P(C) = 1/6 = 0,166 D = ocorrer um ponto maior que P(D) = 0/6 = 0

161 ESTATÍSTICA PROBABILIDADES Somatório de Probabilidades Individuais
P (A) + P (B)  Adição Exemplo: Uma urna tem 5 bolas brancas, 3 vermelhas e 2 pretas. Seleciona-se uma bola ao acaso. Qual a probabilidade dela ser branca ou vermelha? P (A) + P (B) = 5/ /10 = 8/10 = 0,8

162 ESTATÍSTICA PROBABILIDADES Eventos Independentes
P (A) . P (B)  Multiplicação Quando a probabilidade da ocorrência de um evento não altera a ocorrência de um outro. Exemplo: Em dois lançamentos de um dado, os eventos A (número par no 1o lançamento) e B (número ímpar no 2o lançamento) são independentes, haja vista que a ocorrência de um nada tem a ver com a ocorrência de outro. Qual é a probabilidade de A e B ocorrerem seguidamente? P (A) . P (B) = ½ . ½ = ¼ = 0,25

163 ESTATÍSTICA EXERCÍCIOS
1) Determine o espaço amostral das seguintes situações: (a) Numa urna com bolas azuis e vermelhas, extrair uma bola e observar sua cor. (b) Num certo bairro, indagar a uma família se ela costuma fazer compras no supermercado Alfa. (c) Num certo bairro, selecionar uma amostra de 10 famílias e indagar quantas delas fazem compras no supermercado Alfa. (d) Numa escola de primeiro grau, selecionar uma criança e medir a sua altura.

164 ESTATÍSTICA 2) Numa sala com 10 homens e 20 mulheres, sorteia-se um indivíduo, observando o sexo. Construa o modelo probabilístico.

165 ESTATÍSTICA 3) Numa determinada cidade 20% da população é constituída por descendentes de europeus e 35% por descendentes de japoneses. (a) Construa o modelo probabilístico e (b) determine qual é a probabilidade de se sortear um indivíduo pertencente a uma das duas descendências?

166 Distribuição Binomial
Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

167 ESTATÍSTICA EXPERIMENTO BINOMIAL
Estuda o comportamento amostral de eventos dicotômicos. Masculino / Feminino Satisfeito / Insatisfeito Atrasado / Não-atrasado Estes eventos são denominados designativos (sim / não ou sucesso / fracasso)

168 ESTATÍSTICA EXPERIMENTO BINOMIAL Tem as seguintes características
( 1 ) consiste de n ensaios; ( 2 ) cada ensaio tem apenas dois resultados: sim ou não; ( 3 ) os ensaios são independentes entre si, com probabilidade  de ocorrer sim, sendo  uma constante entre 0 e 1. Exemplo: Lançamento de uma moeda 3 vezes e observar o número de caras. n =  = 0,5

169 ESTATÍSTICA EXPERIMENTO BINOMIAL Cálculo Probabilístico:
P (r) = n! pr . (1 - p)n-r r! . (n - r)! n = número de tentativas ou repetições do experimento r = proporção desejada de sucessos n-r = proporção esperada de fracassos p = probabilidade de sucessos

170 ESTATÍSTICA EXPERIMENTO BINOMIAL
Exemplo: A probabilidade de nascimento de um menino ou de uma menina é de 50% ou 1/2. Quais são as probabilidades em uma família de seis filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do sexo masculino? ( 1 ) consiste de n ensaios (6 tentativas de se ter um menino) ( 2 ) cada ensaio tem apenas dois resultados possíveis (menino ou menina) ( 3 ) os ensaios são independentes entre si, com probabilidade  (probabilidade de se ter menino em cada tentativa:  = 0,5)

171 ESTATÍSTICA Exemplo: A probabilidade de nascimento de um menino ou de uma menina é de 50% ou 1/2. Quais são as probabilidades em uma família de seis filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do sexo masculino? Para que não se tenha meninos: P (r) = n! pr . (1 - p)n-r r! . (n - r)! P (0) = ! ,50 . (1 - 0,5)6-0 0! . (6 - 0)! P (0) = 1/64 ou 0,0156 ( 1,56% para 0 meninos e 6 meninas)

172 ESTATÍSTICA Exemplo: A probabilidade de nascimento de um menino ou de uma menina é de 50% ou 1/2. Quais são as probabilidades em uma família de seis filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do sexo masculino? Para que se tenha um menino: P (r) = n! pr . (1 - p)n-r r! . (n - r)! P (1) = ! ,51 . (1 - 0,5)6-1 1! . (6 - 1)! P (1) = 6/64 ou 0,0938 ( 9,38% para 1 menino e 5 meninas)

173 ESTATÍSTICA EXERCÍCIOS
1) Calcule as distribuições de probabilidades do exemplo anterior para que ocorram: (a) 2 meninos; (b) 3 meninos; (c) 4 meninos; (d) 5 meninos e (e) 6 meninos

174 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Distribuição Normal Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

175 DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL Distribuição Binomial
ESTATÍSTICA DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL x y y Média, Moda e Mediana x Média, Moda e Mediana Distribuição Binomial Distribuição Normal

176 ESTATÍSTICA DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL
y Média, Moda e Mediana x y Média, Moda e Mediana Variável dicotômica (sim ou não, sucesso ou fracasso) Dá para enumerar os possíveis resultados Variável contínua (infinitos resultados possíveis) Não dá para enumerar os possíveis resultados

177 ESTATÍSTICA CURVA NORMAL É descrita pela média e pelo desvio padrão.
A mediana, a média e a moda coincidem. A curva é simétrica ao redor da média. A curva é mesocúrtica. x y Média, Moda e Mediana

178 ESTATÍSTICA CURVA NORMAL
As inferências em pesquisas em administração estão baseadas em dados, cuja distribuição é normal. A curva normal (Gauss) é simétrica, unimodal e tem forma de sino. É assintótica em relação ao eixo horizontal (eixo x). x y Média, Moda e Mediana

179 ESTATÍSTICA A ESTATÍSTICA Z Z = x - x s
A estatística Z (standard score) está baseada na curva normal. Mede o afastamento de um valor em relação a média em unidades de desvios padrão. Z = x x s x y 1 DP 2 DP 3 DP -1 +1 -2 +2 +3 -3

180 ESTATÍSTICA A ESTATÍSTICA Z Exemplo:
y Exemplo: A altura média dos estudantes da UFSC é de 1,70m com desvio padrão de 10cm Z = x x s 140 150 160 170 180 190 200 x -3 -2 -1 +1 +2 +3 z

181 ESTATÍSTICA ÁREAS DA CURVA NORMAL Áreas -1DP a +1DP  68,27%
Média a 1DP  34,13% Média a 2 DP  47,72% Média a 3DP  49,86% Média, Moda e Mediana x y 1 DP 2 DP 3 DP -1 DP +1 DP -2 DP +2 DP +3 DP -3 DP

182 ESTATÍSTICA ÁREAS DA CURVA NORMAL x -1 +1 -2 +2 +3 -3 z 34,13% 47,72%
x y -1 +1 -2 +2 +3 -3 z 34,13% 47,72% 49,86%

183 ESTATÍSTICA ÁREAS DA CURVA NORMAL x -1 +1 -2 +2 +3 -3 z 68,27% 95,45%
x y -1 +1 -2 +2 +3 -3 z 68,27% 95,45% 99,73%

184 ESTATÍSTICA EXERCÍCIOS
1) O processo de fabricação de uma determinada empresa apresenta a média de peso de uma peça igual a 100g e desvio padrão de 1,5 g. Qual é a proporção de peças entre 100 e 102g? Z = (x - média) / desvio padrão = ( ) / 1,5 = 1,33 na tabela qdo z = 1,33 a área é de 50% - 9,18% = 40,82% ? x ? z

185 ESTATÍSTICA 2) Calcule as seguintes proporções de peças:
(a) com peso entre 98 e 102g (b) abaixo de 98g (c) acima de 102g (d) abaixo de 100g (e) abaixo de 95g

186 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Correlação Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

187 ESTATÍSTICA DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis quantitativas (com dados numéricos). a a a b b b

188 CORRELAÇÃO LINEAR POSITIVA
ESTATÍSTICA CORRELAÇÃO LINEAR POSITIVA Quando valores pequenos da variável a tendem a estar relacionados com valores pequenos de b, enquanto que valores grandes de a tendem a estar relacionados com valores grandes de b. a Exemplos: Peso x Altura Nível socioeconômico x Volume de vendas Consumo de Álcool x Preval. Cirrose Hepática b

189 CORRELAÇÃO LINEAR NEGATIVA
ESTATÍSTICA CORRELAÇÃO LINEAR NEGATIVA Quando valores pequenos da variável a tendem a estar relacionados com valores grandes de b, enquanto que valores grandes de a tendem a estar relacionados com valores pequenos de b. a Exemplos: Renda Familiar x Número de Filhos Escolaridade x Absenteísmo Volume de vendas x Passivo circulante b

190 ESTATÍSTICA CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de pontos aproximando-se mais de uma parábola do que de uma reta. a Exemplos: Coef. de Letalidade (a) x Dose do Medicamento (b) Custo (a) x Lote Econômico de Compra (b) b

191 COEFICIENTE DE CORRELAÇÃO DE PEARSON
ESTATÍSTICA COEFICIENTE DE CORRELAÇÃO DE PEARSON r = n .  (X.Y) -  X .  Y n .  X2 - ( X) n .  Y2 - ( Y)2 (X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma X = Somatório dos valores da variável X Y = Somatório dos valores da variável Y X2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma Y2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma

192 ESTATÍSTICA EXEMPLO Cálculo do coeficiente de correlação para os dados das variáveis X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos. X Y X2 Y2 X . Y 101 3, ,24 323,2 193 4, ,16 887,8 42 2, ,84 117,6 , , ,2

193 r = 0,69 (Correlação Linear Positiva r > 0)
ESTATÍSTICA r = n .  (X.Y) -  X .  Y n .  X2 - ( X) n .  Y2 - ( Y)2 r = , ,3 (1452) ,55 - (39,3)2 r = 0,69 (Correlação Linear Positiva r > 0)

194 ESTATÍSTICA INTERPRETAÇÃO
O Valor de r (Correlação Linear de Pearson) varia de -1 a +1. O sinal indica o sentido (correlação positiva ou negativa). O valor indica a força da correlação (Fraca, Moderada ou Forte) valor de r Forte Moderada Fraca Ausência Fraca Moderada Forte - 1 - 0,7 - 0,3 + 0,3 + 0,7 + 1

195 ESTATÍSTICA EXERCÍCIO 1) Coloque V (Verdadeiro ou F (Falso):
( ) Quando o valor de r for maior que 0,7 ou menor que -0,7 a correlação entre as duas variáveis em estudo é forte ( ) O sinal negativo de r indica que as variáveis em estudo são inversamente proporcionais ( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que as variáveis sejam diretamente proporcionais. ( ) O coeficiente de correlação de Pearson pode ser aplicado em dados nominais

196 Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr.
Testes de Associação Disciplina de Estatística Prof. Hubert Chamone Gesser, Dr. Retornar

197 ESTATÍSTICA TESTES DE ASSOCIAÇÃO
São Testes de Hipóteses para dados nominais H0 (Hipótese Nula): Não existe associação entre as variáveis estudadas H1 (Hipótese Alternativa): existe associação entre as variáveis estudadas Respondem um problema: (1) A propaganda está associada ao desempenho das vendas? (2) Um método de treinamento está associado a produtividade? (3) O número de horas de trabalho está associado ao estresse?

198 TESTE DE ASSOCIAÇÃO QUI-QUADRADO
ESTATÍSTICA TESTE DE ASSOCIAÇÃO QUI-QUADRADO É um teste não paramétrico. Símbolo: 2 É muito empregado em pesquisas sociais e de saúde. A interpretação dos resultados é mais favorável quando são baseados em tabelas de contingência 2 x 2 (1 grau de liberdade). Exemplo de uma tabela de contingência 2 x 2: Aumento nas vendas Redução nas vendas Com Propaganda ( a ) ( b ) Sem Propaganda ( c ) ( d )

199 ESTATÍSTICA TESTE DE ASSOCIAÇÃO QUI-QUADRADO Cálculo do 2 em tabelas 2 x 2 com Correção de Continuidade. 2 = n . ( a . d - b . c - ( n / 2 ) )2 ( a + b ) . ( c + d ) . ( a + c ) . ( b + d ) O valor de 2 encontrado é transferido para uma tabela que fornecerá o valor de p (probabilidade de significância).

200 Cálculo do exemplo: Propaganda x Desempenho das Vendas
ESTATÍSTICA Cálculo do exemplo: Propaganda x Desempenho das Vendas 2 = n . ( a . d - b . c - ( n / 2 ) )2 ( a + b ) . ( c + d ) . ( a + c ) . ( b + d ) 2 = ( ( 150 / 2 ) )2 ( ) . ( ) . ( ) . ( ) 2 = 4, p < 0,05 Há associação entre as variáveis

201 ESTATÍSTICA Valores de p com 1 grau de liberdade (tabelas 2 x 2)
TESTE DE ASSOCIAÇÃO QUI-QUADRADO Valores de p com 1 grau de liberdade (tabelas 2 x 2) p ,250 0,100 0,050 0,025 0,010 0,005 0,001 2 1,32 2,71 3,84 5,02 6,63 7,88 10,8 Exemplos: Se for encontrado um valor de 2 = 6,63 o valor de p será 0,01 Se for encontrado um valor de 2 = 2,54 então 0,10 > p > 0,05

202 ESTATÍSTICA Quando p > 0,05 Quando p < 0,05 INTERPRETAÇÃO
Aceita-se H0 (Hipótese Nula) Não há associação Quando p < 0,05 Aceita-se H1 (Hipótese Alternativa) Há associação Observações Comumente se adota 0,05 como nível de significância O Teste Exato de Fisher substitui o 2 em amostras muito pequenas A associação não deve ser confundida com relação causal

203 ESTATÍSTICA 2 = 9,88 para o índice de escolaridade
EXERCÍCIOS 1) Uma pesquisa que tinha como objetivo verificar a existência de associação de algumas variáveis com o volume de vendas de um determinado produto encontrou os seguintes valores de 2 : 2 = 9,88 para o índice de escolaridade 2 = 6,22 para o renda familiar 2 = 1,42 para o hábito de fumar Qual destas 3 variáveis mostrou-se mais fortemente associada com o volume de vendas e qual é o valor do seu p (probabilidade de significância)?

204 ESTATÍSTICA 2) Uma organização está tentando descobrir se um novo programa de treinamento do pessoal de vendas está associado a uma maior satisfação de sua clientela. Observe a seguinte tabela de contingência e tente responder essa dúvida. Clientes satisf Clientes Insatisf Treinamento Novo Treinamento Clássico

205 Fonte Bibliográfica BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5.ed. Florianópolis: UFSC, 2006. DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical. 3.ed. New York: Lange Medical Books/McGraw-Hill, 2006. LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed. São Paulo: Harbra, 2007. SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron Books, STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2007.


Carregar ppt "FESSC - Faculdade Estácio de Sá de Santa Catarina"

Apresentações semelhantes


Anúncios Google