FESSC - Faculdade Estácio de Sá de Santa Catarina BIOESTATÍSTICA Cursos de Graduação em Farmácia/Nutrição/Enfermagem/Psicologia Prof. Hubert Chamone Gesser, Dr. Graduação em Odontologia - UFSC Graduação em Administração - ESAG/UDESC Especialização em Odontologia em Saúde Coletiva - ABO/SC Doutorado e Mestrado em Engenharia de Produção - UFSC ANÁLISE FINANCEIRA - Prof. Hubert Chamone Gesser, Dr.
BIOESTATÍSTICA - SUMÁRIO - Conceitos Básicos em Bioestatística Medidas de Dispersão Conhecendo os Dados Amostragem Tabelas e Gráficos Medidas de Tendência Central Medidas de Ordenamento BIOESTATÍSTICA
Conceitos Básicos em Bioestatística Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
BIOESTATÍSTICA ESTATÍSTICA O primeiro uso da palavra ESTATÍSTICA parece datar de 1589 e apareceu em um trabalho do historiador Girolomo Ghilini, quando se referiu a uma “ciência civil, política, estatística e militar”. (Berquó, 1981) Origem no latim status (estado) + isticum (contar) Informações referentes ao estado Coleta, Organização, Descrição, Análise e Interpretação de Dados
BIOESTATÍSTICA O Que é Estatística? Para Sir Ronald A. Fisher (1890-1962): Estatística é o estudo das populações, das variações e dos métodos de redução de dados.
BIOESTATÍSTICA O Que é Estatística? “Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados...” Jon Kettenring Presidente da American Statistical Association, 1997
O Que é Estatística (definição)? BIOESTATÍSTICA O Que é Estatística (definição)? “Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.”
BIOESTATÍSTICA LIVROS DE ESTATÍSTICA
POR QUE A ESTATÍSTICA É IMPORTANTE? BIOESTATÍSTICA POR QUE A ESTATÍSTICA É IMPORTANTE? As diferenças são atribuídas a causas erradas; As coincidências ocorrem frequentemente; As pessoas tem dificuldades com probabilidades; Acrescentam polimento às publicações; Faz conhecer o “grau de confiança” das conclusões.
BIOESTATÍSTICA Indicadores Sociais Diferentes 1o Mundo 3o Mundo As variabilidades mostram que existem diferenças 1o Mundo 3o Mundo Alta Expectativa de Vida Boas Condições Sanitárias Hábitos de Consumo Assistência em Saúde Doenças Infecciosas Alta Mortalidade Infantil Baixa Escolaridade Iniquidades em Saúde Indicadores Sociais Diferentes
EXPECTATIVA DE VIDA – Diferenças entre os países BIOESTATÍSTICA EXPECTATIVA DE VIDA – Diferenças entre os países
RENDA PER CAPITA NO BRASIL (PNUD, 2000) BIOESTATÍSTICA RENDA PER CAPITA NO BRASIL (PNUD, 2000)
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000) BIOESTATÍSTICA RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000) BIOESTATÍSTICA ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000) BIOESTATÍSTICA ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)
GRÁFICO DE DISPERSÃO – RENDA x EDUCAÇÃO (PNUD, 2000) BIOESTATÍSTICA GRÁFICO DE DISPERSÃO – RENDA x EDUCAÇÃO (PNUD, 2000)
BIOESTATÍSTICA FONTES DEMOGRÁFICAS Bancos de Dados (OMS, OPAS, MS, IBGE, etc) Indicadores Sociais (IDH, GINI, QV) Pesquisas de Mercado (Hábitos de Consumo) Censos Demográficos Pesquisa Nacional por Amostra de Domicílios (PNAD) Programa das Nações Unidas para o Desenvolvimento (PNUD)
BIOESTATÍSTICA POPULAÇÃO E AMOSTRA POPULAÇÃO: Conjunto de elementos que se deseja estudar AMOSTRA: Subconjunto da população Nem sempre o Censo é viável (questões econômicas) É mais barato coletar dados de amostras POPULAÇÃO E AMOSTRA
POPULAÇÃO: Também chamada de Universo BIOESTATÍSTICA POPULAÇÃO: Também chamada de Universo AMOSTRA: Parte da população População Amostra
BIOESTATÍSTICA POPULAÇÃO E AMOSTRA POPULAÇÃO (N): Todos os estudantes da UFSC AMOSTRA (n): Parte dos estudantes da UFSC POPULAÇÃO E AMOSTRA Plano de Amostragem
BIOESTATÍSTICA REQUISITOS DE UMA AMOSTRA: 1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra 2) Constituintes selecionados ao acaso (sorteio)
BIOESTATÍSTICA CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA: Amostras Grandes: n > 100 Amostras Médias: n > 30 (30 < n < 100) Amostras Pequenas: n < 30 (12 < n < 30) Amostras Muito Pequenas: n < 12 Observação: As amostras com n > 30 geram melhores resultados. O tamanho adequado deve ser pré-calculado.
BIOESTATÍSTICA Amostragem e Planejamento de Experimentos Áreas da Estatística Amostragem e Planejamento de Experimentos (coleta dos dados) Estatística Descritiva (organização, apresentação e sintetização dos dados) Estatística Inferencial (testes de hipóteses, estimativas, probabilidades)
BIOESTATÍSTICA Amostragem e Planejamento de Experimentos (coleta dos dados) - É o processo de escolha da amostra - É o início de qualquer estudo estatístico Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo Exemplos: Pesquisa sobre tendência de votação Cuidado: Perfil da Amostra = Perfil da População
BIOESTATÍSTICA Estatística Descritiva É a parte mais conhecida (organização, apresentação e sintetização dos dados) É a parte mais conhecida Diariamente veiculada na mídia (jornais, televisão, rádio) Distribuições de frequência, médias, tabelas, gráficos Exemplos: % de Analfabetos em uma comunidade Índice de Mortalidade Infantil (por mil nascimentos) Índice de Desenvolvimento Humano
Estatística Descritiva – Distribuição Populacional de uma Região BIOESTATÍSTICA Estatística Descritiva – Distribuição Populacional de uma Região
BIOESTATÍSTICA Estatística Inferencial, Indutiva ou Analítica (testes de hipóteses, estimativas) Auxilia o processo de tomada de decisões Responde uma dúvida, compara grupos Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que uma delas será aceita mediante a aplicação de um teste estatístico baseado na teoria das probabilidades. Exemplo: O tabagismo está associado à doença pulmonar? Hipóteses: Nula (não há associação), Alternativa (há associação)
BIOESTATÍSTICA EXERCÍCIO No 1 Em uma cidade de 500.000 habitantes onde 45% das pessoas tem título de eleitor, realizou-se uma pesquisa eleitoral com 2000 pessoas. Qual o tamanho da população de estudo e da amostra?
BIOESTATÍSTICA EXERCÍCIO No 2 Uma amostra de apenas 3000 eleitores pode fornecer um perfil confiável sobre a preferência de todo o eleitorado, na véspera de uma eleição presidencial? Por que?
BIOESTATÍSTICA EXERCÍCIO No 3 Você considera a pesquisa proposta no exercício anterior como experimental ou de levantamento? Por quê?
BIOESTATÍSTICA EXERCÍCIO No 4 Elabore uma situação em que a estatística possa ser empregada em benefício de uma organização.
Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Conhecendo os Dados Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
BIOESTATÍSTICA TIPOS DE DADOS Dados Nominais (Sexo, Raça, Cor dos Olhos) Dados Ordinais (Grau de Satisfação) Dados Numéricos Contínuos (Altura, Peso) Dados Numéricos Discretos (Número de Filiais) “Estatísticas aplicadas em alguns tipos de dados não podem ser aplicadas a outros .”
BIOESTATÍSTICA TIPOS DE DADOS Dados Intervalares (Temperatura oC) Quando se referem a valores obtidos mediante a aplicação de uma unidade de medida arbitrária, porém constante e onde o zero é relativo. Este tipo de dado tem restrições a cálculos. 30oC não é três vezes mais quente que 10oC Para cálculos se utiliza a escala Kelvin
BIOESTATÍSTICA ARREDONDAMENTO DE DADOS CONTÍNUOS 1ª Regra: Arredondar para o número mais próximo 2ª Regra: Arredondar para o par mais próximo 5,0 5,5 6,0 6,0 6,5 7,0
BIOESTATÍSTICA EXERCÍCIO No 1 Faça os seguintes arredondamentos: 38,648 para o centésimo mais próximo 38,65 54,76 para o décimo mais próximo 54,8 27,465 para o centésimo mais próximo 27,46 42,455 para o centésimo mais próximo 42,46 4,5 para o inteiro mais próximo 4
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS BIOESTATÍSTICA AGRUPAMENTO DE DADOS POR VALORES DISTINTOS x f (frequência) 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5 4 6 5 3 6 5 4 2 5 3 6
AGRUPAMENTO DE DADOS POR CLASSES BIOESTATÍSTICA AGRUPAMENTO DE DADOS POR CLASSES Classes f (frequência) Ponto Médio 39 50 4 44,5 50 61 5 55,5 61 72 5 66,5 72 83 6 77,5 83 94 5 88,5
POLÍGONO DE FREQUÊNCIA BIOESTATÍSTICA POLÍGONO DE FREQUÊNCIA f x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 10 8 6 4 2 x 2 3 4 5 6 7 8
BIOESTATÍSTICA EXERCÍCIO No 2 Em uma amostra de estudantes foram coletadas as seguintes alturas em metros: 1,70 1,58 1,67 1,72 1,70 1,71 1,75 1,58 1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77 1,76 1,75 1,73 1,65 1,64 1,63 1,62 1,66 1,71 1,68 1,69 1,70 1,59 1,61 1,64 1,76 1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70 1,67 1,71 1,72 1,63 1,70 a) Qual foi o tamanho da amostra (n)? b) Qual é a altura do sujeito mais alto e a do mais baixo? c) Faça o agrupamento de dados por valores distintos. d) Faça o agrupamento por 6 classes. e) Faça o polígono de frequência p/ o agrupamento por classes.
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Análise Vertical: Assimétrica Positiva (esquerda) Leptocúrtica (alta) Simétrica Mesocúrtica Assimétrica Negativa (direita) Platicúrtica (baixa) Análise Conjunta: Assimétrica Positiva Leptocúrtica Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Positiva (esquerda) f x
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Simétrica f x
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Negativa (direita) f x
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical: Leptocúrtica (alta) f x
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical: Mesocúrtica f x
BIOESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Vertical: Platicúrtica (baixa) f x
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS BIOESTATÍSTICA DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS Apresentam-se os valores absolutos e as porcentagens Podem ser usadas tabelas ou gráficos Gráfico de Barras Gráfico Circular
BIOESTATÍSTICA DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS Gráfico de Linhas (não é usado; restrito a dados contínuos) Gráfico de Barras Horizontal
DESCRIÇÃO DOS DADOS CONTÍNUOS BIOESTATÍSTICA DESCRIÇÃO DOS DADOS CONTÍNUOS Trazem informações que expressam a tendência central e a dispersão dos dados. Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo ) Medidas de Dispersão: Desvio Padrão, Variância, Amplitude, Coeficiente de Variação, Valor Máximo, Valor Mínimo
BIOESTATÍSTICA EXERCÍCIO No 3 Em uma pesquisa com jogadoras de basquete foram coletados os seguintes pesos corporais em quilogramas: 65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63 64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68 69 70 a) Qual foi o tamanho da amostra (n)? b) Qual é o maior peso e o menor? c) Faça o agrupamento de dados por valores distintos. d) Faça o agrupamento em 3 classes. e) Faça o polígono de frequência p/ o agrupamento por classes. f) A curva de frequência encontrada se assemelha a normal?
BIOESTATÍSTICA EXERCÍCIO No 4 Na pesquisa do exercício anterior faça a representação gráfica em barras e a circular para as 3 classes de jogadoras geradas.
Medidas de Tendência Central Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
MEDIDAS DE TENDÊNCIA CENTRAL BIOESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL Nos dão uma idéia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados. Medidas: Média, Moda e Mediana. f x
BIOESTATÍSTICA x = S x / n x = S fx / n x = S fx / n MÉDIA É um valor típico representativo de um conjunto de dados. Fisicamente representa o ponto de equilíbrio da distribuição. Modos de calcular 1) para dados simples 2) para valores distintos 3) para agrupamentos em classes x = S x / n x = S fx / n x = S fx / n
BIOESTATÍSTICA 16 18 23 21 17 16 19 20 x = S x / n MÉDIA 1) Cálculo para dados simples x = S x / n S x = Soma dos valores n = tamanho da amostra x = (16+18+23+21+17+16+19+20) 8 x = 18,75 16 18 23 21 17 16 19 20
BIOESTATÍSTICA x f fx x = S fx / n MÉDIA 2) Cálculo para valores distintos x f fx 2 3 6 3 3 9 4 4 16 5 9 45 6 6 36 7 2 14 8 1 8 Total 28 134 x = S fx / n S fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 134 x = 4,7857 28
BIOESTATÍSTICA x = S fx / n Classes f x fx MÉDIA 3) Cálculo para agrupamentos em classes Classes f x fx 39 50 4 44,5 178 50 61 5 55,5 277,5 61 72 5 66,5 332,5 72 83 6 77,5 465 83 94 5 88,5 442,5 Total 25 - 1695,5 x = S fx / n S fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 1695,5 x = 67,82 25
BIOESTATÍSTICA Interpretação: MEDIANA É o valor que ocupa a posição central de um conjunto de dados ordenados. Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários. Interpretação: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana.
BIOESTATÍSTICA 2 3 4 5 6 7 8 9 10 MEDIANA 1) Cálculo da posição da mediana para dados simples PMd =(n+1) / 2 PMd = (9+1) / 2 PMd = 5o Termo Mediana (Md) = 6 2 3 4 5 6 7 8 9 10
BIOESTATÍSTICA MEDIANA 2) Cálculo da posição da mediana para valores distintos x f fa 2 3 3o 3 3 6o 4 4 10o 5 9 19o 6 6 25o 7 2 27o 8 1 28o Total 28 - PMd =(n+1) / 2 PMd = (28+1) / 2 PMd = 14,5 x entre 14o e 15o Termo Mediana (Md) = 5
Mediana (Md) = 66,5 (estimativa) BIOESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o 50 61 5 55,5 9o 61 72 5 66,5 14o 72 83 6 77,5 20o 83 94 5 88,5 25o Total 25 - - PMd =(n+1) / 2 PMd = (25+1) / 2 PMd = 13o Termo Classe Mediana 61 72 Mediana (Md) = 66,5 (estimativa)
Md = Li + ((PMd - faa) / f ) . A BIOESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Pode-se fazer a interpolação da classe mediana Md = Li + ((PMd - faa) / f ) . A Li = limite inferior da classe mediana PMd = posição da mediana faa = frequência acumulada da classe anterior f = frequência da classe mediana A = amplitude da classe mediana Classe Mediana 61 72
Md = Li + ((PMd - faa) / f ) . A BIOESTATÍSTICA MEDIANA 3) Cálculo da PMd para agrupamentos em classes Interpolação da classe mediana Md = Li + ((PMd - faa) / f ) . A Md = 61 + ((13 - 9) / 5) . 11 Mediana (Md) = 69,8 Classe Mediana 61 72
BIOESTATÍSTICA MODA É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo 1) Moda para dados simples Exemplos: 2, 3, 4, 5, 6, 7, 8 AMODAL 2, 3, 3, 4, 5, 6 ,7 MODA = 3 2, 3, 3, 4, 5, 5, 6 BIMODAL (Mo = 3 e Mo = 5)
O valor 5 tem o maior número de ocorrências (9) BIOESTATÍSTICA MODA 2) Moda para valores distintos x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 O valor 5 tem o maior número de ocorrências (9) Mo = 5
BIOESTATÍSTICA Classes f x fa MODA 3) Moda para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o 50 61 5 55,5 9o 61 72 5 66,5 14o 72 83 6 77,5 20o 83 94 5 88,5 25o Total 25 - - Moda Bruta Ponto médio da classe de maior frequência Mo = 77,5 É uma estimativa
BIOESTATÍSTICA MODA 3) Moda para agrupamentos em classes Moda de King Mo = Li + (A . f2 / (f1 + f2)) Li = limite inferior da classe modal A = amplitude do intervalo da classe modal f1 = frequência da classe anterior a modal f2 = frequência da classe posterior a modal Mo = 72 + (11 . 5) 5 + 5 Mo = 77,5
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL BIOESTATÍSTICA USO DAS MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA: Dados Numéricos e Intervalares É a medida mais utilizada. MODA: Dados Nominais MEDIANA: Dados Ordinais
BIOESTATÍSTICA EXERCÍCIO No 1 6 5 8 4 7 6 9 7 3 Determine a média, a mediana e a moda para o seguinte conjunto de dados 6 5 8 4 7 6 9 7 3
BIOESTATÍSTICA EXERCÍCIO No 2 Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados 12 32 54 17 82 99 51 11 44 22 22 33 44 52 76 41 37 10 5 87
BIOESTATÍSTICA Classes f EXERCÍCIO No 3 Dado o seguinte agrupamento em classes determine: Classes f 1,60 1,65 10 1,65 1,70 15 1,70 1,75 22 1,75 1,80 18 1,80 1,85 3 Total 68 a) os pontos médios de cada classe b) a classe modal c) a moda bruta d) a moda de King e) a classe mediana f) a mediana por agrupamento de classes g) a média por agrupamento de classes
Medidas de Ordenamento Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
BIOESTATÍSTICA MEDIDAS DE ORDENAMENTO São os valores que subdividem uma disposição em rol Medidas: QUARTIS, DECIS E PERCENTIS Os Quartis dividem a disposição em 4 partes iguais Q1, Q2, Q3 Os Decis dividem a disposição em 10 partes iguais D1, D2, D3, D4, D5, D6, D7, D8, D9 Os Percentis dividem a disposição em 100 partes iguais P1, P2, P3, P4, P5, P6, ... , P99
BIOESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q1, Q2, Q3 Entre cada quartil há 25% dos dados da disposição Posição do Primeiro Quartil (Q1) = (n + 1) / 4 Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4 Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4 O segundo quartil coincide com a Mediana (Q2 = Md)
Os Quartis dividem a disposição em 4 partes iguais BIOESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q1, Q2, Q3 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9 n = 27 Q1 Q2 Q3 7o termo 14o termo 21o termo
BIOESTATÍSTICA DECIS Os Decis dividem a disposição em 10 partes iguais D1, D2, D3, D4, D5, D6, D7, D8, D9 Entre cada decil há 10% dos dados da disposição Posição do Primeiro Decil (D1) = (n + 1) / 10 Posição do Segundo Decil (D2) = 2.(n + 1) / 10 Posição do Nono Decil (D9) = 9.(n + 1) / 10 O Quinto Decil coincide com a Mediana (D5 = Md)
BIOESTATÍSTICA PERCENTIS Os percentis dividem a disposição em 100 partes iguais P1, P2, P3, P4, P5, P6, ... , P99 Entre cada percentil há 1% dos dados da disposição Posição do Primeiro Percentil (P1) = (n + 1) / 100 Posição do Segundo Percentil (P2) = 2.(n + 1) / 100 Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100 P50 = Md P25 = Q1 P75 = Q3
BIOESTATÍSTICA 10 13 24 45 66 77 11 14 26 33 65 21 57 EXERCíCIOS 1) Dado o conjunto de dados: a) apresente a disposição em rol; b) o Percentil 50, c) o Primeiro Quartil, d) a Média, e) a Moda e f) a Mediana 10 13 24 45 66 77 11 14 26 33 65 21 57
BIOESTATÍSTICA 2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?
BIOESTATÍSTICA 3) Determine a média, a moda, a mediana, o 1o quartil, o 5o decil, o percentil 75 e o percentil 50 para a seguinte distribuição por valores distintos? Pesos (kg) f 64 4 65 10 66 12 67 12 68 15 69 14 70 9 71 5 72 2
Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Medidas de Dispersão Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
BIOESTATÍSTICA DISPERSÃO DOS DADOS É frequentemente chamada de variabilidade. Medidas mais comuns: Variância, Desvio Padrão, Amplitude Dispersão dos dados na amostra f Dispersão dos dados na população x
Dispersão na População BIOESTATÍSTICA Dispersão na População É uma forma de se ver o quanto os dados se afastam da média. Exemplo: Vilarejo com apenas 11 pessoas 135cm 152cm 136cm 152cm 138cm 157cm 141cm 163cm 143cm 170cm 152cm Média = 149cm Mediana e Moda = 152cm Valor Máximo = 170cm Valor Mínimo = 135cm Amplitude = 35cm Alturas de 11 pessoas
Dispersão na População Soma dos desvios quadráticos BIOESTATÍSTICA Dispersão na População Alturas (N=11) x - x (x - x)2 135cm 135-149 -14 196 136cm 136-149 -13 169 138cm 138-149 -11 121 141cm 141-149 -8 64 143cm 143-149 -6 36 152cm 152-149 3 9 157cm 157-149 8 64 163cm 163-149 14 196 170cm 170-149 21 441 Total 1314 2 Variância = 1314 / 11 = 119,454 cm2 s Desvio Padrão = 119,454 = 10,92 cm Soma dos desvios quadráticos
BIOESTATÍSTICA s2 = S ( x - x )2 / N s = s2 VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO Variância da população s2 = S ( x - x )2 / N Desvio Padrão da população = Raiz quadrada da variância s = s2 Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.
BIOESTATÍSTICA s2 = S ( x - x )2 / ( n -1 ) s = s2 VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA Variância da Amostra ( s2 ou v ) s2 = S ( x - x )2 / ( n -1 ) Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância s = s2 A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático
É um modo de representar a dispersão dos dados ao redor da média. BIOESTATÍSTICA DESVIO PADRÃO SIGNIFICADO: É um modo de representar a dispersão dos dados ao redor da média. f x Média
BIOESTATÍSTICA DESVIO PADRÃO A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B. f f Curva A Curva B x x Média Média
BIOESTATÍSTICA COEFICIENTE DE VARIAÇÃO O desvio padrão depende da unidade de medida usada, assim um desvio medido em dias será maior do que um medido em meses. O coeficiente de variação expressa o desvio-padrão como porcentagem do valor da média. COEF. VARIAÇÃO = 100 . DESVIO PADRÃO MÉDIA Quanto menor for este coeficiente mais homogênea é a amostra.
BIOESTATÍSTICA de 10% a 20% BOM de 20% a 30% REGULAR COEFICIENTE DE VARIAÇÃO Classificação da proporção que o desvio padrão apresenta sobre a média - GRAU DE HOMOGENEIDADE DOS DADOS - até 10% ÓTIMO de 10% a 20% BOM de 20% a 30% REGULAR acima de 30% RUIM
BIOESTATÍSTICA 4 5 5 6 6 7 7 8 EXERCÍCIOS 1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados: 4 5 5 6 6 7 7 8
BIOESTATÍSTICA 2) Determine o valor de n, a amplitude, a média, o desvio padrão e o coeficiente de variação da seguinte amostra de dados: 22 32 45 22 46 76 24 21 78 43 21 58 92 11 16 28 33 73 11 29 22 47 28 24 21 53 36 88 99 18
BIOESTATÍSTICA 3) Com base nos coeficientes de variação calculados nos dois exercícios anteriores classifique a dispersão encontrada:
Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Amostragem Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
APLICAÇÕES DE AMOSTRAGEM Inferência Estatística BIOESTATÍSTICA APLICAÇÕES DE AMOSTRAGEM Pesquisa Mercadológica (Índice de satisfação na população) Pesquisa Eleitoral (Percentagem de votos para cada candidato) Perfil Socioeconômico da População (Grau de escolaridade, Renda) Na População Parâmetros Na Amostra Estatísticas População Amostra Inferência Estatística
POR QUE USAR A AMOSTRAGEM? QUANDO NÃO USAR A AMOSTRAGEM? BIOESTATÍSTICA POR QUE USAR A AMOSTRAGEM? Economia (É mais barato levantar dados de uma parcela da população) Tempo (É mais rápido) Quando a população for pequena (n > 0,8.N) Quando a característica for de fácil mensuração (Sim ou Não) Quando houver a necessidade de alta precisão (Censo IBGE) QUANDO NÃO USAR A AMOSTRAGEM?
BIOESTATÍSTICA TIPOS DE AMOSTRAGEM AMOSTRAGEM ALEATÓRIA SIMPLES (Tem que obedecer a propriedade de qualquer elemento da população ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela de números aleatórios ou sorteios) AMOSTRAGEM ALEATÓRIA SISTEMÁTICA (Após obter-se a lista dos elementos da população, sorteia-se a entrada e segue-se a relação N/n.) AMOSTRAGEM ALEATÓRIA ESTRATIFICADA (Elabora-se a amostra através do perfil conhecido da população. Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é confeccionada obedecendo-se estes parâmetros.)
OUTROS TIPOS DE AMOSTRAGEM BIOESTATÍSTICA OUTROS TIPOS DE AMOSTRAGEM AMOSTRAGEM NÃO ALEATÓRIA (De fácil obtenção.) AMOSTRAGEM PARA ESTUDOS COMPARATIVOS (Não visa a descrição de uma população, mas a comparação entre grupos diferentes. Exemplos: Comparar as taxas de tabagismo em indivíduos com câncer de pulmão e sadios.) Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) BIOESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Sejam: n0 = Primeira aproximação para o tamanho da amostra E0 = Erro Amostral Tolerável n = Tamanho da Amostra N = Tamanho da População n0 = 1 / (Eo)2 n = (N . n0) / (N + no)
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) BIOESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Populações Finitas com Parâmetros de Prevalência Conhecidos (N . z2 . p . (1-p)) (E02 . (N-1) + z2 . p . (1-p)) n = Onde: N = Tamanho da População z = Nível de confiança expresso em desvio padrão (95%) = 1,96 E0 = Erro Amostral Tolerável p = Prevalência do evento na População
BIOESTATÍSTICA RELAÇÃO ENTRE (n) E (N) Relação entre o tamanho da população e o tamanho da amostra n 600 500 400 300 200 100 0 500 1000 1500 2000 2500 3000 3500 N
BIOESTATÍSTICA EXERCÍCIOS 1) Determine o tamanho da amostra para uma pesquisa eleitoral em uma cidade com 200.000 eleitores, adotando uma margem de erro de 2 pontos percentuais.
Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Tabelas e Gráficos Disciplina de Bioestatística Prof. Hubert Chamone Gesser, Dr. Retornar
BIOESTATÍSTICA Vantagens: TABELAS Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. Uma tabela estatística conterá necessariamente uma série ou uma distribuição de frequência. Vantagens: - Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.
NORMAS PARA A CONFECÇÃO DE TABELAS BIOESTATÍSTICA NORMAS PARA A CONFECÇÃO DE TABELAS São numeradas consecutivamente com algarismos arábicos; Os números são precedidos da palavra “Tabela”; No topo deve estar o título que indica a natureza e as abrangências geográficas e temporal dos dados numéricos; O centro da tabela é representado por uma série de colunas e subcolunas onde são alocados os dados; No rodapé deve-se colocar a fonte (o responsável pelos dados) e opcionalmente uma nota geral ou uma nota específica; A moldura deve conter no mínimo 3 traços horizontais; Não se deve fechar uma tabela com traços verticais em suas extremidades.
CLASSIFICAÇÃO DAS TABELAS BIOESTATÍSTICA CLASSIFICAÇÃO DAS TABELAS Séries Cronológicas (temporais ou históricas); Variável: Tempo Constantes: Lugar e Espécie Séries Geográficas (territoriais); Variável: Lugar Constantes: Tempo e Espécie Séries Especificativas; Variável: Espécie Constantes: Tempo e Lugar Séries Mistas; Quando há mais de uma variável. Distribuição de Frequência
Séries Cronológicas (Temporais ou Históricas) BIOESTATÍSTICA Séries Cronológicas (Temporais ou Históricas) Tabela 1: Proporções de doentes X na Cidade Y Anos Percentual 2005 25,74 2006 26,85 2007 27,94 2008 32,45 Fonte: Hipotética
Séries Geográficas (Territoriais) BIOESTATÍSTICA Séries Geográficas (Territoriais) Tabela 2: Proporção de doentes X no Ano de 2008 Cidades Percentual Itajaí 10,44 Lages 29,45 Florianópolis 8,66 Blumenau 9,82 Fonte: Hipotética
Séries Especificativas BIOESTATÍSTICA Séries Especificativas Tabela 3: Proporção de doentes X no Ano de 2008 em Florianópolis Segmento populacional Percentual Infantil 60,25 Juvenil 20,72 Adulto 2,75 3a Idade 5,82 Fonte: Hipotética
Séries Mistas (Ex: Especificativa-Cronológica-Geográfica) BIOESTATÍSTICA Séries Mistas (Ex: Especificativa-Cronológica-Geográfica) Tabela 4: Volume de internações hospitalares por ano e cidade (valores em milhares) Doenças 2007 2008 Fpolis Lages Fpolis Lages Pulmonares 24,24 9,34 25,95 9.98 Infecciosas 112,72 27,45 111,75 29,48 Cardíacas 86,75 18,45 79,37 19,57 Outras 1,95 0,85 2,01 0,84 Fonte: Hipotética
Distribuições de Frequência BIOESTATÍSTICA Distribuições de Frequência Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas) Pesos Frequência Frequência Acumulada 64 51 51 65 100 151 66 22 173 67 14 187 Total 187 - Fonte: Hipotética
BIOESTATÍSTICA Vantagens: GRÁFICOS Gráfico é a forma geométrica de apresentação dos dados e respectivos resultados de sua análise. A escolha do modelo ideal de representação gráfica depende das preferências e do senso estético do elaborador. Vantagens: - Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.
NORMAS PARA A CONFECÇÃO DE GRÁFICOS BIOESTATÍSTICA NORMAS PARA A CONFECÇÃO DE GRÁFICOS Deve facilitar a interpretação dos dados para um leigo; Não há a necessidade de se colocar título se estiver na mesma página da tabela correspondente; Há a necessidade de se colocar o título se a tabela correspondente não estiver na mesma página. O senso estético individual determina o espaço do gráfico (L x A); As colunas, barras, linhas e áreas gráficas devem ser ordenadas de modo crescente ou decrescente, mas a ordem cronológica prevalece;
Eixo x Valores da Variável BIOESTATÍSTICA ORIGEM DOS GRÁFICOS O diagrama cartesiano é a figura geométrica que deu origem à técnica de construção de gráficos estatísticos. Utiliza-se o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Ordenadas (eixo y) 1o Quadrante Abscissas (eixo x) Eixo y Frequências Eixo x Valores da Variável
GRÁFICO EM COLUNAS OU DE BARRAS BIOESTATÍSTICA GRÁFICO EM COLUNAS OU DE BARRAS Tabela 1: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310 Fonte: Hipotética Figura 1: Gráfico em colunas do número de exames em um determinado laboratório em 2003.
GRÁFICO DE BARRAS HORIZONTAL BIOESTATÍSTICA GRÁFICO DE BARRAS HORIZONTAL Tabela 2: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310 Fonte: Hipotética Figura 2: Gráfico em barras horizontais do número de exames realizados em um determinado laboratório no ano de 2003.
GRÁFICO DE SETORES OU CIRCULAR BIOESTATÍSTICA GRÁFICO DE SETORES OU CIRCULAR Tabela 3: Quantidade de exames realizados em um determinado laboratório em 2003. Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310 Fonte: Hipotética Figura 3: Gráfico circular do número de exames realizados em um determinado laboratório no ano de 2003.
HISTOGRAMA DE FREQUÊNCIA Fonte: Dados Fictícios BIOESTATÍSTICA HISTOGRAMA DE FREQUÊNCIA Tabela 4: Notas dos alunos na disciplina de Estatística no curso de Administração (ano x) Notas Frequência 0 2 2 2 4 7 4 6 11 6 8 10 8 10 5 Fonte: Dados Fictícios Figura 4: Histograma das notas dos alunos
HISTOGRAMA DE FREQUÊNCIA BIOESTATÍSTICA HISTOGRAMA DE FREQUÊNCIA A área do histograma é proporcional à soma das frequências; Para comparar duas distribuições, o ideal é utilizar números percentuais; Figura 5: Histograma dos percentuais das notas dos alunos
POLÍGONO DE FREQUÊNCIA BIOESTATÍSTICA POLÍGONO DE FREQUÊNCIA É um Gráfico em Linha de uma distribuição de frequência; Para se obter um polígono (linha fechada), deve-se completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e posterior à última, da distribuição. Figura 6: Polígono de Frequência percentual de das notas dos alunos
POLÍGONO DE FREQUÊNCIAS ACUMULADAS Fonte: Dados Fictícios BIOESTATÍSTICA POLÍGONO DE FREQUÊNCIAS ACUMULADAS (Sinônimo: Ogiva) Tabela 5: Notas dos alunos na disciplina de estatística no ano x Notas Frequência F. Acumulada % 0 2 2 5,7 2 4 7 25,7 4 6 11 57,1 6 8 10 85,7 8 10 5 100,0 Fonte: Dados Fictícios Figura 7: Polígono de frequências acumuladas das notas dos alunos
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS) BIOESTATÍSTICA GRÁFICO STEM AND LEAF (TRONCO E FOLHAS) Tronco (Stem) Folha (Leaf) 1 3455 2 2389 3 356799 4 57 5 37889 6 235 7 12 13 14 15 15 22 23 28 29 33 35 36 37 39 39 45 47 53 57 58 58 59 62 63 65 71 72 Figura 8: Gráfico Stem-Leaf onde o primeiro dígito é o tronco e o segundo é a folha Conjunto de Dados
GRÁFICO DE BARRAS COM DESVIO PADRÃO BIOESTATÍSTICA GRÁFICO DE BARRAS COM DESVIO PADRÃO Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de estudantes da faculdade x (valores fictícios).
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode) BIOESTATÍSTICA GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode) 1,95m 1,90m 1,85m 1,80m 1,75m 1,70m 1,65m 1,60m 1,55m Valor Máximo Percentil 75 Percentil 50 Percentil 25 Valor Mínimo Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).
BIOESTATÍSTICA EXERCÍCIOS 1) Construa uma série cronológica com os dados da mortalidade infantil de uma determinada região.
BIOESTATÍSTICA 2) Construa o Gráfico de Barras com os dados do exercício anterior.
BIOESTATÍSTICA 3) Construa o Gráfico em Setores do seguinte agrupamento em classes: Pesos (Kg) f 60 15 80 26 100 38 120 9 Total 88
Fonte Bibliográfica BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5.ed. Florianópolis: UFSC, 2006. DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical. 3.ed. New York: Lange Medical Books/McGraw-Hill, 2006. LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed. São Paulo: Harbra, 2007. SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron Books, 2006. STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2007. Retornar