A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se.

Apresentações semelhantes


Apresentação em tema: "MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se."— Transcrição da apresentação:

1 MANIPULAÇÃO DE DADOS Medidas

2 IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se os sujeitos foram selecionados aleatoriamente ou designados aleatoriamente, os números usados para o procedimento aleatório podem ser usados. Faça uma lista mestra de nomes com números de identificação correspondentes e mantê-la num arquivo seguro no caso de ser necessário mais referências.

3 Medição adequada Para garantir o uso da análise estatística selecionada é importante que o item representando cada variável esteja no nível de medição desejada e apropriada. Por exemplo, o pesquisador pode desejar usar o Teste t, mas tem dado ordinal. Neste caso, o nível de medição não é apropriado.

4 Procedimentos de análise 1.Atribuir Números às Categorias. 2. Inserir dados no Computador. 3.Usar Resultados de Estudo Piloto para o Estabelecimento de Categorias.

5 Marca ótica Utilizada para leitura automática. Exemplo: cartao resposta de vestibulares.

6 Escolher análise apropriada Checar que cada tipo de análise estatística e resumo de dados produzem dados na forma que você desejar.

7 PLANEJAR EDIÇÃO DE DADOS Vc pode encontras inconsistencias devido: Sem Resposta (Dados que faltam / perdidos). Vc deve decidir como manipular possíveis dados perdidos (ou que faltam). Respostas Incorretas. Recomendação. A autora recomenda a omissão de tais respostas com base em que não podem realmente saber quais as intenções que os entrevistados tinham na realidade. Manuscrito Ilegível. Linguagem Firme e Inventiva. Pode utilizar linguagem indecente.

8 Continuação Respostas inconsistentes. – Por exemplo, um entrevistado pode checar o grupo de idade e então checar o nível educacional grau doutoral. De fato, alguns pesquisadores usam itens semelhantes, estes como escalas falsas para determinar se um entrevistado pode estar mentindo e neste caso invalidar o instrumento por inteiro.

9 Planejar tempo para examinar dados Planejar o tempo no qual os dados podem ser completamente examinados para resultados imprevistos. É mais importante que ir direto para suas questões de pesquisa ou hipóteses.

10 Exemplos A DEMONSTRAÇÃO O QUE FOI OMITIDO E DEVERÁ SER INCLUIDO 1. Significativamente mais entrevistados97% dos entrevistados não usam marca X do que marca Y.usaram marca X ou Y. 2. A hipótese de que a fábrica Texas tem Nenhum empregado em qualquer fábrica esteve uma elevada taxa de absenteísmo foiausente mais do que 2 dias por mês. 3. Uma proporção maior de pessoas75% dos entrevistados foram que não trabalham fora de casa mulheres. preferiu assistir TV durante o horário do dia mais do que no começo ou mais tarde da noite. 4. A correlação de 0.09 foi significante O valor é muito baixo.

11 Descobertas imprevistas Uma das maiores razões para examinar os dados é para constatar descobertas imprevistas. Estes são dados que o pesquisador não espera encontrar. No exemplo acima, o pesquisador não antecipa que 97% dos entrevistados não usaram tampouco Marca X ou Marca Y (embora talvez eles deveriam ter).

12 Exemplos Pessoas que concluíram um levantamento sobre a freqüência no cinema pode começar a assistir mais filmes ou pessoas dadas a certas dietas pode começar a necessitar de açúcar.

13 Gerar novas variáveis Exemplo: Por exemplo, itens do questionário incluem medições de variáveis: 1) freqüência de assistência de concertos ou bales; 2) freqüência de comparecimento ao teatro legítimo, e; 3) freqüência de jantar nos restaurantes. Estas variáveis podem ser combinadas para formar uma outra variável chamada tipo de estilo de vida.

14 Distribuição de frequencia Primeiro passo para redução de dados. Definição. Um arranjo de contagens ou categorias com a freqüência de ocorrência (f) de cada contagem ou categoria indicada. Pode se adotar intervalos de classe.

15 Exemplos 1.Número de vendas na quinta-feira3. Exemplo de distribuição de freqüência com intervalos de classes Nº de cada venda f Total de vendas Contagem no teste f Total pessoas fizeram 5 vendas cada quinta- feira Total de pretendentes127

16 Medidas de tendencia central Definição. Uma medida da média ou contagem típica numa distribuição de contagens. As três medidas de tendência central mais freqüentemente usadas são: 1) a média, a qual requer pelos menos um intervalo no nível de medição; 2) a mediana, a qual requer pelo menos um nível ordinal de medição, e ; 3) a moda, a qual requer pelos menos um nível nominal de medição.

17 Média As médias são muito familiares para todos nós porque elas são usadas também freqüentemente por toda nossa vida para relatar contagens médias. Por exemplo, os negociantes freqüentemente relatam suas vendas totais médias, despesas, número de pessoas empregadas e número de unidades vendidas.

18 Média EXPOSIÇÃO O PROCESSO PARA CALCULAR UMA MÉDIA 1. Registrar as contagens. 2. Juntar todas as contagens. 3. Dividir pelo número total de contagens. Fórmula: X = X / N onde: X = a média de uma amostra X = soma das contagens N = número de contagens. Exemplo: O número de fornos microondas vendido durante 5 dias foi: 10, 9, 15, 6, 10. X = 50 X = 50 / 5 = 10 ( o número médio de fornos microondas vendidos por dia).

19 Média A média reflete e é afetada por toda contagem na distribuição, porque toda contagem é usada na soma. Por conseguinte, as contagens extremas afetam a média. Por exemplo: 5 vendedores venderam o seguinte número de lavadoras de pratos: 40, 6, 6, 5, 3. Se a média foi calculada, a conclusão seria que a média das vendas das 5 pessoas foi 12 lavadoras de pratos. Todavia, quatro das cinco pessoas venderam menos do que 7 e uma vendeu 40! A média não é uma medida representativa da tendência central em tais casos.

20 Média Quando há contagens extremas, também usa-se a mediana ou, no caso de um conjunto de contagens muito diferentes, descrever as contagens. Por exemplo, no item 2 acima podemos informar que o número mediano de lavadoras de pratos vendidas foi 6, mesmo que uma pessoa vendeu 40. Se há poucas contagens submetidas ao conjunto completo de contagens para melhor entendimento. A média é adequada somente para dados ao nível de intervalos ou de razão de medição.

21 Média Por conseguinte, a média não pode ser usada quando os dados à nível de intervalo ou de razão tenham sido modificados para ordinal.

22 Média Não obstante estes cuidados, a média é considerada a medida de tendência central mais estável. O fundamento para essa conclusão é que quando diversas amostras são retiradas de uma população, as médias destas amostras serão totalmente similares e diferirão menos do que amostras de medianas ou modas.

23 Mediana Definição. Uma medida de tendência central que é a contagem central num conjunto ordenado de dados que são para o ordinal ou nível de medição mais alto. Com um número impar de contagens, a mediana é o valor central. Para um número igual de contagens, a mediana é a metade entre os dois valores centrais.

24 Mediana O PROCESSO PARA CALCULAR UMA MEDIANA 1. Registrar as dados em ordem do mais superior para o mais inferior. 2. Selecionar o valor central, se há um número ímpar de contagens. 3. Se há um número par de contagens, somar as duas medidas centrais consecutivamente e dividir por 2.

25 Exemplo Número Impar de ContagensNúmero Par de Contagens Mediana = 5Mediana =( ) / 2 = 9

26 Moda Definição. Uma medida de tendência central cuja contagem freqüentemente mais aparece numa distribuição de contagens as quais são nominais ou de nível de medição mais alto. O PROCESSO PARA ESCOLHER UMA MODA 1. Registrar os dados em ordem do mais superior para o mais inferior. 2. Escolher o valor que ocorre mais freqüentemente como a moda. Exemplo: 15, 15, 15, 9, 8, 8, 1, 1, 1, 1. A moda = 1 a contagem que ocorre mais freqüentemente. CUIDADO: Notar que a moda é muito instável. Se as duas contagens mais inferiores forem omitidas, a moda seria 15 em vez de 1.

27 Medidas de variabilidade As medidas de variabilidade são usadas para avaliar a extensão ou a dispersão de um conjunto de dados. Elas são freqüentemente mais usadas em: 1) análises estatísticas, e; 2) em projetos de pesquisa. Definição. Variabilidade: O grau para o qual os dados dentro dos limites de uma distribuição diferem entre si. As medidas de variabilidade mais freqüentemente usadas são o desvio padrão e seu quadrado, a variância. Ambas requerem ao menos um nível de intervalo de medição.

28 Variância e desvio padrão Definição. Variância: Uma medida de variabilidade que é a média dos desvios quadrados da média numa distribuição. A variância é o quadrado do desvio padrão. Símbolos: s 2, 2 Definição. Desvio Padrão: Uma medida de variabilidade que é a raiz quadrada da variância. Ele indica a média dos desvios dos dados da média de uma distribuição. Símbolos: s,

29 Desvio padrão e variância Fórmulas para Desvio Padrão: = ( X - Xm ) 2 / N = x 2 / N = N X 2 - ( X ) 2 / N 2 * Onde: X = soma dos dados X = média X 2 = soma de cada valor ao quadradoN = número de dados ou observações. ( X ) 2 = soma dos valores ao quadrado x = X - X ou contagem do desvio ( * ) Notar que N(N-1) é usado no lugar de N 2 quando calcula-se s, o desvio padrão da amostra.

30 Amplitude A amplitude é uma simples medida de variabilidade muitas vezes usada para uma rápida observação dos dados. Definição. Amplitude: Uma medida de variabilidade que é geralmente calculada pela subtração entre o menor valor e o maior valor.

31 Tabela de contingencia Um outro método útil para resumir e examinar os dados é usar uma tabela de contingência na qual as observações são tabuladas em cruz. Definição. Tabela de Contingência: Uma tabela que demonstra classificações agrupadas de duas ou mais variáveis, indicando o número de observações em cada uma das classificações agrupadas = células. Definição. Tabulação cruzada: A tabulação do número total de observações dentro de classificações associadas de duas ou mais variáveis.

32 Exemplo EXPOSIÇÃO EXEMPLO DE UMA TABELA DE CONTINGÊNCIA Bônus Preferenciais Dinheiro Férias Total Fêmeas Machos Total das 30 fêmeas e 20 dos 50 machos preferiram dinheiro como um bônus.

33 Percentagens A adição de porcentagens às distribuições de freqüência ou às tabelas de contingência freqüentemente ajuda na interpretação dos dados. Contudo, cuidado deve ser tomado quando porcentagens são usadas. 1. Não usar porcentagens com números pequenos. Eles seriam ilusórios. Por exemplo: Número e Percentual de Pessoas Que Adquiriram Tipos de Feijão Tipo Número % Feijão Verde 4 50 Feijão Pinto 2 25 Feijão Kidney Feijão Wax Total Um leitor vê que 25% das pessoas compraram feijão pinto, certamente ilusório embora considerando que somente 2 pessoas compraram também.

34 Pacotes estatísticos Para usar os pacotes estatísticos multifunção adquira os manuais dos programas e siga as orientações. Os manuais da maioria dos pacotes dá as orientações explícitas e requerem muito pouca experiência. Uma alternativa é ter uma pessoa com bom conhecimento no uso do pacote particular que conduz as análises. CUIDADO: Uma das menos desejáveis porém predominantes conseqüências do uso de pacotes estatísticos é que, por eles serem fáceis de usar, muitas pessoas inexperientes em procedimentos estatísticos seguidos de análises estatísticas não sabem como interpretar os resultados.

35 FIM


Carregar ppt "MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se."

Apresentações semelhantes


Anúncios Google