Distribuição de freqüências

Slides:



Advertisements
Apresentações semelhantes
PESQUISA DE MARKETING 10a Aula
Advertisements

ESTATÍSTICA PARA QUALIDADE
Separatrizes As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem ou separam a distribuição em partes iguais.
Dados qualitativos e dados quantitativos
Medida do Tempo de Execução de um Programa
Métodos Quantitativos
ESTATÍSTICA BÁSICA.
MACS Análise, representação e redução de dados..
Estatística e Probabilidade
ESTATÍSTICA: O estudo numérico dos fatos sociais
Estatística e Probabilidade
Estatística Professor: Carlos Alberto de Albuquerque
Uma tabela compõe-se de:
ESTATÍSTICA DESCRITIVA
DISTRIBUIÇÕES AMOSTRAIS
Aula 08 Medidas de posição - Prof. Diovani Milhorim
SÉRIES ESTATÍSTICAS TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. De acordo com a Resolução.
Capítulo 10 - Estatística 10.1 Introdução:
Distribuição de Frequencias
NOÇÕES BÁSICAS DE ESTATÍSTICA
Aula 05 Distribuição de freguência Prof. Diovani Milhorim
Medidas Estatísticas Para Dados Agrupados Prof. Gercino Monteiro Filho
Estatística Aula 06 Representação gráfica de uma distribuição
Matemática Financeira
Medidas de localização
Levantamento de dados e apresentação tabular
Estudo dos gráficos Objetivos: Como construir um gráfico.
Estatística Descritiva
Esquematicamente, temos:
Série Geográfica (espaço).
GRÁFICOS ESTATÍSTICOS
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Definição de Estatística
Aula 5 ESTATÍSTICA E PROBABILIDADE
Estudo dos gráficos Objetivos: Como construir um gráfico.
Séries Estatísticas FAPAN - Faculdade de Agronegócio de Paraíso do Norte Disciplina: Estatística Aplicada.
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
Distribuição de Frequências
Noções de Estatística - I
Variáveis Quantitativas Contínuas
IV - Descrição e Apresentação dos Dados
III - Amostragem Prof. Herondino.
Usando Excel Prof. Rosemberg Trindade. Parte 1 Representação tabular de distribuição com variáveis discretas e contínuas.
ESTASTÍSTICA APLICADA
TABELAS UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE
Sônia Vieira/ Ronaldo Wada
Estatística Básica usando o
Prof: Wildson Cruz Blog:
Matemática Financeira
Freqüências simples ou absoluta:
ESTATÍSTICA.
MEDIDAS DE POSIÇÃO Representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal. As medidas de posições.
ESTATÍSTICA.
ESTATÍSTICA.
JERRY ADRIANE DOMINGOS Formado em Mecânica – UFES / 2001 Formado em Matemática – FANAN / 2012 Inspetor credenciado em automotiva – INMETRO / 2006 Auditor.
Distribuição de Freqüências
CEPZ1 – 2015 – AULA 06 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
Distribuição. de freqüência
Aula 5 Bioestatística. Estatísticas para uma variável.
Profª Juliana Schivani TABELAS.
Profª Juliana Schivani MÉTODO ESTATÍSTIC O.
ESTATÍSTICA: Conceitos básicas Curso: Sistemas de Informação Disciplina: Estatística e Probabilidade Professor: Munelar de Assis Falcão 05 de fevereiro.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Aula 4 Bioestatística Probabilidade para variáveis aleatórias.
Estatística Aplicada à Administração Prof. Alessandro Moura costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Gráficos e Tabelas – Competência 6 de Matemática
Estatística Aplicada à Administração Profº Alessandro Moura Costa
Gráficos Curso: Sistemas de Informação Disciplina: Estatística e Probabilidade Professor: Munelar de Assis Falcão 04 de março de 2009 Aula 3.
Utiliza-se a MoP para a análise da assimetria
Transcrição da apresentação:

Distribuição de freqüências Aula 2 Distribuição de freqüências 13 de fevereiro 2009 Curso: Sistemas de Informação Disciplina: Estatística e Probabilidade Professor: Munelar de Assis Falcão

Freqüência A freqüência ou freqüência absoluta determina o número de ocorrências das possíveis realizações de cada classe de cada variável em que se realizou o levantamento de dados. Usaremos a notação ni para denotar a freqüência de cada classe da variável. Exemplo 1: Considere a seguinte distribuição discreta de dados para a variável X: X = {3, 4, 2, 3, 2, 3, 0, 2, 1, 5, 3, 1, 1, 2, 3} Temos que a observação 3 possui uma freqüência igual a 5, já a observação 0, possui freqüência igual a 1. Então: n3 = 5 n0 = 1

Freqüência relativa Freqüência relativa ou proporção é a razão de cada representação pelo total de dados. Usaremos a notação fi para indicar a proporção de cada classe em relação ao total n de dados. Assim: Dessa forma, para o exemplo anterior temos que n = 5, então a freqüência relativa para a observação 3 é Para o dado 0, temos

Porcentagem Freqüência relativa em porcentagem, ou simplesmente porcentagem, é uma medida bastante utilizada que serve para comparar resultados de duas ou mais pesquisas distintas, independente do número de dados. Ela é dada por: Dessa forma, a porcentagem da observação 3 do exemplo 1 é: Para a observação 0 temos:

Considere as seguintes pesquisas para a variável Grau de instrução: Observe que não podemos comparar diretamente as colunas das freqüências, pois possuem totais diferentes. Mas as colunas das porcentagens são comparáveis, pois possuem o mesmo total (100%). Daí, concluímos, por exemplo, que a proporção de empregados com nível superior é maior na seção de orçamento do que na companhia como um todo.

Organização de dados em tabelas Toda tabela é composta por um título, pelo corpo, pelo cabeçalho e pela coluna indicadora: o título explica o que a tabela contém; o cabeçalho especifica o conteúdo das colunas; a coluna indicadora especifica o conteúdo das linhas; o corpo é formado pelas linhas e colunas de dados; a casa é a divisão que aparece no corpo da tabela. Exemplo 2:

As tabelas podem conter fonte, notas e chamadas. A fonte dá a indicação da entidade, ou do pesquisador, ou dos pesquisadores que publicaram ou forneceram os dados. No exemplo 2, a fonte é MS/FIOCRUZ/SINITOX. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração. Exemplo 3: Observe nesse exemplo que a nota informa que só foram apurados nascimentos ocorridos no ano de registro. As chamadas dão esclarecimentos sobre os dados.

Simbologia e números A simbologia empregada em tabelas estatísticas são: Quanto aos números, deve ser observado o seguinte: Todo número inteiro constituído de mais de três algarismos deve ser agrupado de três em três, da direita para esquerda, separando cada grupo por um ponto ou não, como no exemplo 3. Exceções: os algarismos que representam o ano; números de telefone; placas de veículos.

A parte decimal de um número deverá ser separada da parte inteira por vírgula. A unidade de medida não leva o “s” do plural e nem o ponto final como abreviação. Os símbolos de medida aparecem depois do número, sem espaço entre eles.

Exercício 1: Construa uma tabela, a partir da tabela do exemplo 2, que contenha freqüência acumulada, freqüência relativa, freqüência relativa em porcentagem, freqüência relativa em porcentagem acumulada e total.

No exemplo responda: Qual é a população e a amostra da estatística apresentada na tabela? É uma população finita ou infinita? Qual é a variável estatística dos dados acima? E quais são seus possíveis valores (dados estatísticos)? Tal variável é qualitativa ou quantitativa? O que a palavra “Freqüência” está representando no cabeçalho da tabela?

A População são todas as pessoas que tiveram algum tipo de intoxicação registrada no ano de 1993, aqui no Brasil. Perceba que os casos não registrados não fazem parte deste levantamento de dados. Neste tipo de estatística, a Amostra tem o mesmo número de elementos que a População, que por sua vez, é finita, pois senão tal pesquisa não teria nenhum sentido. A variável em questão é “Casos registrados de intoxicação humano no Brasil em 1993”. Seus possíveis valores são exatamente: acidente, abuso, suicídio, profissional etc. Como os possíveis valores para variável em questão são palavras, logo se trata de uma variável qualitativa, que no caso é nominal. Veremos no próximo a seguir o motivo pelo qual a palavra “Freqüência” foi utilizada.

Dados brutos e Rol Dados brutos são aqueles que ainda não foram numericamente ordenados. Como são dados primariamente levantados ou reunidos, possui uma característica aleatória. Exemplo 4: Levantamento de diâmetros abdominais de 10 indivíduos adultos: Rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. Assim, o rol do exemplo 3 seria: A diferença entre o maior e o menor número do rol chama-se amplitude total dos dados (A). Então, para o rol acima, A = 122 – 65 = 57. No caso de variáveis qualitativas, o procedimento é o agrupamento.

Tabelas de distribuição de freqüências São tabelas que servem para apresentar variáveis contínuas, elas resumem grandes massas de dados brutos. Em tais tabelas, os dados são freqüentemente distribuídos em classes ou categorias. Cada classe possui um número de dados, ao qual denominamos freqüência da classe. Observe a tabela abaixo:

As tabelas de distribuição de freqüências mostram a distribuição da variável, mas perdem em exatidão. Note que na tabela anterior não sabemos as 5 alturas dos estudantes da classe de 150 a 158, a não ser que investiguemos os dados originais. Todos os dados passam a ser representados pelo ponto médio da classe a que pertencem. Desta forma, na tabela anterior temos que 5 estudantes possuem em média uma altura de 154cm.

Intervalos e limites de classe Um símbolo que define uma classe, como o 150 | 158 na tabela anterior, chama-se intervalo de classe. Os números extremos, 150 e 158 são denominados limites de classe: o número menor, 150, é o limite inferior da classe, e o número maior, 158, é o limite superior da classe. Com a notação adotada, temos que o intervalo de classe é fechado à esquerda, ou seja, o limite inferior pertence à classe, aberto à direita, ou seja, o limite superior não pertence à classe. Nem sempre estão definidos o extremo inferior da primeira classe ou o extremo superior da última classe.

Exemplo 5: Observe que o extremo superior da última classe não está presente. Quando isso ocorre dizemos intervalo de classe aberto.

Amplitude do intervalo de classe A amplitude do intervalo de classe é a diferença entre os limites reais superior e inferior dessa classe. Se todos os intervalos de classe de uma distribuição de freqüência tiverem amplitudes iguais, como é o caso da Tabela 1, dizemos que as classes são homogêneas. Em tal tabela a amplitude (a), é igual a a = 8cm. Já a Tabela 2 não possui amplitudes iguais para todas as classes.

Ponto médio de uma classe É o ponto médio do intervalo de classe e é obtido somando-se o limite inferior ao superior e dividindo-se a soma por 2. Dessa forma, o ponto médio do intervalo 150 | 158 é 154. Admite-se que todas as observações relativas a um determinado intervalo de classe coincidem com seu ponto médio. Dessa maneira, todas as alturas do intervalo de classe 150 | 158 cm são consideradas como sendo 154cm.

Processo de construção de uma tabela de distribuição de freqüências Como organizar os dados da tabela abaixo em uma tabela de distribuição de freqüências? Que conclusões podem ser tiradas ao olhar esta tabela?

Passo 1: Determinar o maior e o menor número dos dados brutos e, então, calcular a amplitude total do rol. A = 4,600 - 1,570 = 3,03kg Passo 2: Decidir o número de classes de sua tabela. O número conveniente de intervalos de classe está entre 5 e 20, dependendo dos dados. O importante é que consigamos intervalos de classe homogêneos. Passo 3: Determina a amplitude de classe, dividindo a amplitude total pelo número de classe escolhido e arredonde o resultado para mais, até um número conveniente. Dessa forma: 3,03  5 = 0,606 arredondado para mais fica 0,7; 3,03  6 = 0,505 arredondado para mais fica 0,6; 3,03  7 = 0,433 arredondado para mais fica 0,5 etc.

Passo 4: Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele. Dessa forma, podemos escolher a observação 1,570kg como ponto de partida ou arredondamos para 1,500kg, para facilitar nosso problema. Passo 5: A partir daí montamos os intervalos de classe, somando a amplitude de classe escolhida ao ponto de partida, e assim por diante. Passo 6: Determina-se o número de dados que cabem dentro de cada classe e depois calcula-se as freqüências relativas, se necessário.

Assim, escolhendo o 7 como o número de intervalos de classe, teremos amplitudes de classe igual a 0,5kg, e escolhendo como ponto de partida a observação 1,500kg, obtemos a seguinte tabela de distribuição de freqüências para os dados brutos em questão:

Não existe um número “ideal” de classes para se montar uma tabela de distribuição de freqüências, mas existem até fórmulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas é a seguinte: onde: → número de classes. O arredonde para o número inteiro próximo; → número de dados. Exemplo 6: Analisemos a tabela das massa dos recém nascidos vivos mostrada anteriormente. Naquela tabela temos N = 100, então utilizando a fórmula para o número de classes, obtemos: C = 1 + 3,222...  log 100 = 1 + 6,444... = 7,444... ≈ 7 classes, mas poderíamos construir uma tabela contendo 5, 6, 7, 8 ou até 9 classes.

Exercício 2: Construa uma tabela de distribuição de freqüências para apresentar os dados da tabela abaixo, não esquecendo de apresentar o ponto médio de cada classe: