A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Distribuição de freqüências

Apresentações semelhantes


Apresentação em tema: "Distribuição de freqüências"— Transcrição da apresentação:

1 Distribuição de freqüências
Aula 2 Distribuição de freqüências 13 de fevereiro 2009 Curso: Sistemas de Informação Disciplina: Estatística e Probabilidade Professor: Munelar de Assis Falcão

2 Freqüência A freqüência ou freqüência absoluta determina o número de ocorrências das possíveis realizações de cada classe de cada variável em que se realizou o levantamento de dados. Usaremos a notação ni para denotar a freqüência de cada classe da variável. Exemplo 1: Considere a seguinte distribuição discreta de dados para a variável X: X = {3, 4, 2, 3, 2, 3, 0, 2, 1, 5, 3, 1, 1, 2, 3} Temos que a observação 3 possui uma freqüência igual a 5, já a observação 0, possui freqüência igual a 1. Então: n3 = 5 n0 = 1

3 Freqüência relativa Freqüência relativa ou proporção é a razão de cada representação pelo total de dados. Usaremos a notação fi para indicar a proporção de cada classe em relação ao total n de dados. Assim: Dessa forma, para o exemplo anterior temos que n = 5, então a freqüência relativa para a observação 3 é Para o dado 0, temos

4 Porcentagem Freqüência relativa em porcentagem, ou simplesmente porcentagem, é uma medida bastante utilizada que serve para comparar resultados de duas ou mais pesquisas distintas, independente do número de dados. Ela é dada por: Dessa forma, a porcentagem da observação 3 do exemplo 1 é: Para a observação 0 temos:

5 Considere as seguintes pesquisas para a variável Grau de instrução:
Observe que não podemos comparar diretamente as colunas das freqüências, pois possuem totais diferentes. Mas as colunas das porcentagens são comparáveis, pois possuem o mesmo total (100%). Daí, concluímos, por exemplo, que a proporção de empregados com nível superior é maior na seção de orçamento do que na companhia como um todo.

6 Organização de dados em tabelas
Toda tabela é composta por um título, pelo corpo, pelo cabeçalho e pela coluna indicadora: o título explica o que a tabela contém; o cabeçalho especifica o conteúdo das colunas; a coluna indicadora especifica o conteúdo das linhas; o corpo é formado pelas linhas e colunas de dados; a casa é a divisão que aparece no corpo da tabela. Exemplo 2:

7 As tabelas podem conter fonte, notas e chamadas.
A fonte dá a indicação da entidade, ou do pesquisador, ou dos pesquisadores que publicaram ou forneceram os dados. No exemplo 2, a fonte é MS/FIOCRUZ/SINITOX. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração. Exemplo 3: Observe nesse exemplo que a nota informa que só foram apurados nascimentos ocorridos no ano de registro. As chamadas dão esclarecimentos sobre os dados.

8 Simbologia e números A simbologia empregada em tabelas estatísticas são: Quanto aos números, deve ser observado o seguinte: Todo número inteiro constituído de mais de três algarismos deve ser agrupado de três em três, da direita para esquerda, separando cada grupo por um ponto ou não, como no exemplo 3. Exceções: os algarismos que representam o ano; números de telefone; placas de veículos.

9 A parte decimal de um número deverá ser separada da parte inteira por vírgula.
A unidade de medida não leva o “s” do plural e nem o ponto final como abreviação. Os símbolos de medida aparecem depois do número, sem espaço entre eles.

10 Exercício 1: Construa uma tabela, a partir da tabela do exemplo 2, que contenha freqüência acumulada, freqüência relativa, freqüência relativa em porcentagem, freqüência relativa em porcentagem acumulada e total.

11 No exemplo responda: Qual é a população e a amostra da estatística apresentada na tabela? É uma população finita ou infinita? Qual é a variável estatística dos dados acima? E quais são seus possíveis valores (dados estatísticos)? Tal variável é qualitativa ou quantitativa? O que a palavra “Freqüência” está representando no cabeçalho da tabela?

12 A População são todas as pessoas que tiveram algum tipo de intoxicação registrada no ano de 1993, aqui no Brasil. Perceba que os casos não registrados não fazem parte deste levantamento de dados. Neste tipo de estatística, a Amostra tem o mesmo número de elementos que a População, que por sua vez, é finita, pois senão tal pesquisa não teria nenhum sentido. A variável em questão é “Casos registrados de intoxicação humano no Brasil em 1993”. Seus possíveis valores são exatamente: acidente, abuso, suicídio, profissional etc. Como os possíveis valores para variável em questão são palavras, logo se trata de uma variável qualitativa, que no caso é nominal. Veremos no próximo a seguir o motivo pelo qual a palavra “Freqüência” foi utilizada.

13 Dados brutos e Rol Dados brutos são aqueles que ainda não foram numericamente ordenados. Como são dados primariamente levantados ou reunidos, possui uma característica aleatória. Exemplo 4: Levantamento de diâmetros abdominais de 10 indivíduos adultos: Rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. Assim, o rol do exemplo 3 seria: A diferença entre o maior e o menor número do rol chama-se amplitude total dos dados (A). Então, para o rol acima, A = 122 – 65 = 57. No caso de variáveis qualitativas, o procedimento é o agrupamento.

14 Tabelas de distribuição de freqüências
São tabelas que servem para apresentar variáveis contínuas, elas resumem grandes massas de dados brutos. Em tais tabelas, os dados são freqüentemente distribuídos em classes ou categorias. Cada classe possui um número de dados, ao qual denominamos freqüência da classe. Observe a tabela abaixo:

15 As tabelas de distribuição de freqüências mostram a distribuição da variável, mas perdem em exatidão. Note que na tabela anterior não sabemos as 5 alturas dos estudantes da classe de 150 a 158, a não ser que investiguemos os dados originais. Todos os dados passam a ser representados pelo ponto médio da classe a que pertencem. Desta forma, na tabela anterior temos que 5 estudantes possuem em média uma altura de 154cm.

16 Intervalos e limites de classe
Um símbolo que define uma classe, como o 150 | 158 na tabela anterior, chama-se intervalo de classe. Os números extremos, 150 e 158 são denominados limites de classe: o número menor, 150, é o limite inferior da classe, e o número maior, 158, é o limite superior da classe. Com a notação adotada, temos que o intervalo de classe é fechado à esquerda, ou seja, o limite inferior pertence à classe, aberto à direita, ou seja, o limite superior não pertence à classe. Nem sempre estão definidos o extremo inferior da primeira classe ou o extremo superior da última classe.

17 Exemplo 5: Observe que o extremo superior da última classe não está presente. Quando isso ocorre dizemos intervalo de classe aberto.

18 Amplitude do intervalo de classe
A amplitude do intervalo de classe é a diferença entre os limites reais superior e inferior dessa classe. Se todos os intervalos de classe de uma distribuição de freqüência tiverem amplitudes iguais, como é o caso da Tabela 1, dizemos que as classes são homogêneas. Em tal tabela a amplitude (a), é igual a a = 8cm. Já a Tabela 2 não possui amplitudes iguais para todas as classes.

19 Ponto médio de uma classe
É o ponto médio do intervalo de classe e é obtido somando-se o limite inferior ao superior e dividindo-se a soma por 2. Dessa forma, o ponto médio do intervalo 150 | 158 é 154. Admite-se que todas as observações relativas a um determinado intervalo de classe coincidem com seu ponto médio. Dessa maneira, todas as alturas do intervalo de classe 150 | 158 cm são consideradas como sendo 154cm.

20 Processo de construção de uma tabela de distribuição de freqüências
Como organizar os dados da tabela abaixo em uma tabela de distribuição de freqüências? Que conclusões podem ser tiradas ao olhar esta tabela?

21 Passo 1: Determinar o maior e o menor número dos dados brutos e, então, calcular a amplitude total do rol. A = 4, ,570 = 3,03kg Passo 2: Decidir o número de classes de sua tabela. O número conveniente de intervalos de classe está entre 5 e 20, dependendo dos dados. O importante é que consigamos intervalos de classe homogêneos. Passo 3: Determina a amplitude de classe, dividindo a amplitude total pelo número de classe escolhido e arredonde o resultado para mais, até um número conveniente. Dessa forma: 3,03  5 = 0,606 arredondado para mais fica 0,7; 3,03  6 = 0,505 arredondado para mais fica 0,6; 3,03  7 = 0,433 arredondado para mais fica 0,5 etc.

22 Passo 4: Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele. Dessa forma, podemos escolher a observação 1,570kg como ponto de partida ou arredondamos para 1,500kg, para facilitar nosso problema. Passo 5: A partir daí montamos os intervalos de classe, somando a amplitude de classe escolhida ao ponto de partida, e assim por diante. Passo 6: Determina-se o número de dados que cabem dentro de cada classe e depois calcula-se as freqüências relativas, se necessário.

23 Assim, escolhendo o 7 como o número de intervalos de classe, teremos amplitudes de classe igual a 0,5kg, e escolhendo como ponto de partida a observação 1,500kg, obtemos a seguinte tabela de distribuição de freqüências para os dados brutos em questão:

24 Não existe um número “ideal” de classes para se montar uma tabela de distribuição de freqüências, mas existem até fórmulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas é a seguinte: onde: → número de classes. O arredonde para o número inteiro próximo; → número de dados. Exemplo 6: Analisemos a tabela das massa dos recém nascidos vivos mostrada anteriormente. Naquela tabela temos N = 100, então utilizando a fórmula para o número de classes, obtemos: C = 1 + 3,  log 100 = 1 + 6, = 7, ≈ 7 classes, mas poderíamos construir uma tabela contendo 5, 6, 7, 8 ou até 9 classes.

25 Exercício 2: Construa uma tabela de distribuição de freqüências para apresentar os dados da tabela abaixo, não esquecendo de apresentar o ponto médio de cada classe:


Carregar ppt "Distribuição de freqüências"

Apresentações semelhantes


Anúncios Google