A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

PESQUISA DE MARKETING Edição Compacta Prof. Dr. Fauze Najib Mattar.

Apresentações semelhantes


Apresentação em tema: "PESQUISA DE MARKETING Edição Compacta Prof. Dr. Fauze Najib Mattar."— Transcrição da apresentação:

1 PESQUISA DE MARKETING Edição Compacta Prof. Dr. Fauze Najib Mattar

2 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 2 Capítulo 6 – Análise de Dados

3 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 3 Escolha do método Análise de Dados Muitas pesquisas de marketing têm apresentado conclusões baseadas em resultados obtidos com a utilização incorreta de técnicas de análises, comprometendo, dessa forma, sua qualidade, precisão e confiabilidade.

4 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 4 Análise de Dados Os 6 fatores a considerar na escolha do método de análise Tipo de escala da variável. Nível de conhecimento dos parâmetros da população. Tipo de análise desejada. Número de variáveis a serem analisadas conjuntamente. Número de amostras e seu grau de relacionamento. Relação de dependência entre as variáveis.

5 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 5 Análise de Dados Tipo de escala Fator muito importante para a determinação da técnica correta de análise é o tipo de escala utilizada para medir a variável. Em função das diferentes características das escalas, as técnicas possíveis de serem utilizadas na análise variam conforme a escala seja nominal, ordinal ou intervalar.

6 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 6 Análise de Dados Nível de conhecimento dos parâmetros da população Uma técnica estatística é chamada paramétrica quando o modelo do teste especifica certas condições sobre os parâmetros da população da qual a amostra foi obtida, para que possa ser utilizada. Uma técnica estatística não paramétrica é aquela que compreende um teste cujo modelo não especifica condições sobre os parâmetros da população da qual a amostra foi obtida.

7 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 7 Análise de Dados Nível de conhecimento dos parâmetros da população (continuação) Exigências a serem atendidas na aplicação do teste t: as observações precisam ser independentes; as amostras precisam ter sido retiradas de populações com distribuições normais; as populações precisam ter as mesmas variâncias (ou a relação entre as variâncias conhecida); as variáveis em estudo precisam ter sido medidas ao menos numa escala de intervalo que possibilite as quatro operações aritméticas.

8 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 8 Análise de Dados Tipo de análise Métodos descritivos – têm o objetivo de proporcionar informações sumarizadas dos dados contidos no total de elementos da amostra estudada. Métodos descritivos compreendem: Medidas de posição – servem para caracterizar o que é típico no grupo. Medidas de dispersão – servem para medir como os indivíduos estão distribuídos no grupo. Medidas de associação – servem para medir o nível de relacionamento existente entre duas ou mais variáveis.

9 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 9 Análise de Dados Tipo de análise (continuação) Métodos inferenciais – compreendem um conjunto grande de testes que servem para julgar a validade das hipóteses estatísticas sobre uma população ou para estimar seus parâmetros, a partir da análise dos dados de uma amostra dessa população. Os métodos inferenciais são baseados na teoria das probabilidades, de forma que a incerteza da inferência pode ser medida, isto é, o risco de efetuar inferências incorretas pode ser estabelecido. As técnicas inferenciais compreendem a estimação de parâmetros e os testes de hipóteses.

10 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 10 Análise de Dados Número de variáveis a serem analisadas simultaneamente Se o número de variáveis for respectivamente uma, duas ou mais de duas, o pesquisador encontrará métodos específicos aplicáveis a cada situação, denominados de: univariados; bivariados; multivariados.

11 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 11 Análise de Dados Número de amostras a analisar e grau de relacionamento entre elas Possibilidades: amostra simples; duas amostras relacionadas; duas amostras não relacionadas; amostras múltiplas relacionadas; amostras múltiplas não relacionadas.

12 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 12 Análise de Dados Número de amostras a analisar e grau de relacionamento entre elas (continuação) Amostras relacionadas e não relacionadas - diz respeito a se a escolha de um elemento para fazer parte da amostra interfere na probabilidade de escolha de outro ou se o resultado da avaliação de qualquer elemento da amostra possa ter interferido na avaliação de outro.

13 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 13 Análise de Dados Relação de dependência entre as variáveis Nos casos em que houver mais de uma variável a ser analisada simultaneamente, um fator também determinante para a escolha da técnica adequada de análise é a relação de dependência existente entre as variáveis. As variáveis podem ter entre si uma relação de dependência ou de interdependência.

14 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 14 Análise de Dados Relação de dependência entre as variáveis (continuação) Numa relação de dependência, uma (ou mais de uma) das variáveis é escolhida, segundo as condições estabelecidas pelo problema de pesquisa, para ser examinada, no sentido de se verificar sua dependência de outras variáveis. Numa relação de interdependência, o interesse está em verificar o relacionamento existente entre as próprias variáveis do conjunto, não sendo nenhuma escolhida, em especial, como sendo a variável dependente. Dos métodos descritivos de análise dos dados, as medidas de posição e as medidas de dispersão dependem apenas do tipo de escala de medição da variável sob análise.

15 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 15 Análise de Dados Métodos descritivos de análise de dados Medidas de posição e de dispersão para variáveis em escalas nominais, ordinais e intervalares mais utilizadas em pesquisas de marketing Escala da variável Medidas de PosiçãoDispersão NominalModaDistribuição de freqüências (absoluta e relativa) OrdinalMediana Quartis, decis e percentis Ordenamento Intervalar ou Razão Média aritméticaDistribuição de freqüência acumulada (absoluta e relativa) Amplitude Desvio-médio Desvio-padrão Coeficiente de variação Obs.: As medidas apresentadas são cumulativas, em cada coluna, no sentido de cima para baixo, isto é, todas as medidas aplicáveis às variáveis com escalas nominais são também aplicáveis àquelas com escalas ordinais, e todas as aplicáveis às variáveis com escalas ordinais o são também àquelas com escalas intervalares.

16 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 16 Análise de Dados Medidas de posição Tendência central Média Moda Mediana Separatrizes Quartil Decil Percentil Mediana Divisão das medidas de posição

17 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 17 Análise de Dados Dados nominais Moda é o valor ou categoria da variável que ocorre com a maior frequência. É uma medida típica de tendência central para variáveis nominais. Pode ser aplicada a variáveis ordinais ou intervalares, desde quem tenham sido agrupadas em classes. A classe que obtiver maior frequência é denominada classe modal.

18 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 18 Análise de Dados Exemplo de determinação da moda Empresa de transporte aéreo preferida Freqüência absoluta A20 B40 C10 D30 E50 F10 G 60 (moda) Total220

19 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 19 Análise de Dados Dados ordinais Mediana é o valor da variável que divide o grupo em dois subgrupos de igual tamanho (é o valor da variável correspondente ao elemento central da distribuição). É uma medida típica de tendência central para variáveis ordinais. Pode ser aplicada a variáveis intervalares.

20 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 20 Análise de Dados Dados ordinais (continuação) Determinação do valor da mediana: ordenar numericamente os dados; procurar o valor da variável correspondente ao elemento que divide o grupo em dois subgrupos quando a amostra tiver número ímpar de elementos; procurar a média dos valores dos dois elementos centrais, quando a amostra possuir um número par de elementos.

21 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 21 Análise de Dados Dados ordinais (continuação) Quartis são os valores da variável correspondentes aos três elementos que dividem o conjunto de dados ordenados em quatro subgrupos de tamanhos iguais. São chamados, respectivamente, de: 1º quartil – o valor da variável que divide os elementos do grupo em 25% e 75%; 2º quartil – o valor da variável que divide os elementos do grupo em 50% e 50%; 3º quartil – o valor da variável que divide os elementos do grupo em 75% e 25%. Decis e percentis são os valores da variável correspondentes aos três elementos que dividem o conjunto de dados ordenados em 10 e 100 partes iguais. Não são apresentadas as formas de cálculo devido a sua pouca utilização em pesquisa de marketing.

22 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 22 Onde: Q n = valor do quartil que se deseja calcular; Q 1 = 1º quartil; Q 2 = 2º quartil = Mediana; Q 3 = 3º quartil; ν = valor médio do intervalo de classe em que o quartil está situado; Q = frequência relativa acumulada do quartil a ser calculado. Assim, Q = 0,25 para o 1º quartil, Q = 0,50 para a mediana e Q = 0,75 para o 3º quartil; F rac = frequência relativa acumulada até a classe anterior à do quartil considerado; F rel = frequência relativa da classe em que o quartil está situado. Análise de Dados Fórmula para cálculo dos quartis: Q n = ν + (Q – F rac ) / F rel Dados ordinais (continuação)

23 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 23 Análise de Dados Média aritmética (ou simplesmente média) corresponde ao valor médio de um conjunto de dados. É uma medida de tendência central de aplicação exclusiva a variáveis intervalares. Existem duas fórmulas para o cálculo da média, dependendo da forma de apresentação dos dados. Dados intervalares

24 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 24 População X i N i=1 N µ = Amostra x i n i=1 n x = Escolha do Método e Métodos Descritivos de Análise de Dados Dados intervalares Fórmula para o cálculo da média para dados que não estejam na forma de distribuição de freqüências: Análise de Dados Fórmula para o cálculo da média para dados que estejam na forma de distribuição de freqüências: População N i=1 N µ = Amostra n i=1 n x = fifi XiXi xixi fifi Fórmulas para o cálculo da média

25 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 25 Análise de Dados As medidas de tendência central informam a respeito do ponto de concentração da maioria das respostas, porém não informam nada a respeito do grau de concentração dessas respostas, nem da maneira como as observações estão dispersas por toda a distribuição. O conhecimento da dispersão dos dados de uma variável permite avaliar a confiabilidade de uma medida de tendência central numa amostra como parâmetro da população. Medidas de dispersão

26 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 26 Análise de Dados A distribuição de freqüência absoluta é resultante da contagem das ocorrências de respostas por opção possível da variável. A distribuição de freqüência relativa é resultante da divisão da freqüência absoluta de cada opção pelo total de elementos da amostra. Constituem as únicas medidas de dispersão que podem ser aplicadas a variáveis nominais. Variáveis nominais

27 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 27 Análise de Dados Ordenamento é a disposição de todos os elementos do grupo de forma crescente ou decrescente, segundo as avaliações efetuadas para a variável ordinal pesquisada. Variáveis ordinais

28 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 28 Análise de Dados Uma rede de supermercados deseja avaliar o quanto três de suas lojas estão agradando a seus clientes, para, em função dos resultados, decidir em qual(ais) loja(s) devem ser tomadas providências administrativas e mercadológicas. Para tanto, realizou uma pesquisa junto a 9 consumidores de cada uma das lojas, quanto a seu grau de satisfação, avaliado através da atribuição de pontos para um grande número de tópicos de um mesmo instrumento. Variáveis ordinais (continuação) Exemplo:

29 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 29 Análise de Dados Variáveis ordinais (continuação) Dados brutos resultantes da avaliação do grau de satisfação em três lojas de uma rede de supermercados Loja ALoja BLoja C 7811372 1209093 1069980 7710069 8712397 869276 11112162 12810467 110132116

30 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 30 Análise de Dados Variáveis ordinais (continuação) Uma forma comumente encontrada em pesquisas de marketing é efetuar a soma das pontuações na vertical e comparar os resultados, e a partir desses resultados decidir qual (ais) loja (s) merece (m) mudanças. Por tratar-se de uma variável ordinal, esta prática está conceitualmente errada. A prática correta é proceder a um ordenamento conjunto, somar na vertical as várias posições ocupadas no ordenamento conjunto e, somente a seguir, comparar os resultados e tomar as decisões.

31 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 31 Análise de Dados Variáveis ordinais (continuação) Resultados do ordenamento conjunto da avaliação do grau de satisfação em três lojas de uma rede de supermercados Loja ALoja BLoja C 21724 51715 101320 221225 18314 191623 8427 21126 916 Total11484180

32 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 32 Análise de Dados A distribuição de freqüência absoluta acumulada é resultante da contagem acumulativa da ocorrência de respostas até determinado valor da variável. A distribuição de freqüência relativa acumulada é resultante da divisão da freqüência absoluta acumulada pelo total de elementos da amostra. Constituem medidas de dispersão exclusivas de serem aplicadas a variáveis intervalares. Variáveis intervalares

33 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 33 Análise de Dados Amplitude de uma distribuição é uma medida de dispersão típica de variáveis intervalares. A amplitude é a diferença entre o maior e o menor valor da variável observados numa amostra. A amplitude fornece a dimensão do campo de variação da variável. Variáveis intervalares (continuação) Fórmula para o cálculo da amplitude: A = x maior – x menor

34 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 34 População i=1 N DM = X i - µ N Amostra i=1 n DM = x i - x n Desvio-médio O desvio-médio é também uma medida de dispersão típica de variáveis intervalares e indica o grau de dispersão do total dos indivíduos num grupo, em relação a determinada variável. O desvio-médio é a média aritmética das diferenças (em módulo, ou seja, despreza-se o sinal) entre cada observação e a média das observações. Serve para comparar duas distribuições com igual média e saber qual das duas está mais ou menos dispersa. Fórmula para o cálculo do desvio-médio: Análise de Dados Variáveis intervalares (continuação)

35 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 35 Análise de Dados Variância é a soma dos quadrados das diferenças entre cada observação e a média, dividida pelo número de observações. Desvio-padrão é a raiz quadrada da variância. Variáveis intervalares (continuação)

36 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 36 Análise de Dados Fórmula para o cálculo do desvio-padrão Variáveis intervalares (continuação) N (X - µ) 2 Dados em distribuição de freqüência ComputacionalOriginalComputacional Original Dados brutos AmostraPopulação σ = N N x 2 X 2 X n (x - x) 2 S = x n n 2 2 N σ = N f(X) 2 fX 2 n S = n f(x) 2 fx 2

37 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 37 Amostra CV a = S / x População CV p = σ / µ Coeficiente de variação O desvio-padrão é uma medida absoluta da dispersão e é apresentado nas mesmas unidades de medida originais em que os dados foram coletados. Pode existir a necessidade da comparação da dispersão de diversas distribuições que não possuam as mesmas médias ou que não estejam nas mesmas escalas ou unidades de medida e que, por isso, não podem ser feitas com os desvios-padrão. O coeficiente de variação permite efetuar essas comparações. O coeficiente de variação é uma medida abstrata da dispersão e é obtido através da divisão do desvio-padrão pela média: Análise de Dados Variáveis intervalares (continuação)

38 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 38 Métodos de inferência A inferência diz respeito a como se podem assumir conclusões para toda uma população a partir das medições e da análise de apenas uma parte dela, de forma que o risco de se realizarem conclusões incorretas possa ser medido. A inferência diz respeito a dois tipos de problemas: estimar os parâmetros de uma população; realizar testes de hipóteses. Análise de Dados

39 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 39 Os métodos de inferência estatística possibilitam: assumir, com determinada probabilidade conhecida de erro, a média (ou a porcentagem) calculada numa amostra como estimativa do parâmetro da população; realizar os testes de hipóteses a respeito, por exemplo, da diferença da média entre duas distribuições. Métodos de inferência (continuação) Análise de Dados

40 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 40 Testes de hipóteses Procedimentos para realização do teste de hipóteses: 1.estabelecer a hipótese nula (H 0 ) e a hipótese alternativa (H 1 ), tendo em vista a hipótese da pesquisa; 2.selecionar o teste estatístico adequado à situação; 3.estabelecer um nível de significância; 4.determinar ou assumir a distribuição amostral da prova estatística sob a hipótese nula (H 0 ); Análise de Dados

41 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 41 Testes de hipóteses (continuação) Procedimentos para realização do teste de hipóteses: 5.com base em 2, 3 e 4 definir a região de rejeição da hipótese nula (H 0 ); 6.calcular o valor da prova estatística a partir dos dados da (s) amostra (s) ; 7.tomar a decisão quanto à não-rejeição ou à rejeição da hipótese nula (H 0 ) e, conseqüentemente, a adoção ou não da hipótese alternativa (H 1 ). Análise de Dados

42 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 42 Métodos da inferência – testes estatísticos apropriados segundo os métodos estatísticos, as escalas de mensuração e o número de amostras e seu relacionamento Método Escala de mensuração da variável TESTES DE INFERÊNCIA Uma amostra Duas amostrasVárias amostras Relacionadas Não relacionadas Relacionadas Não relacionadas Não paramétricos Nominal Binomial χ 2 Uma amostra McNemarχ 2 Duas amostrasCochran Qχ 2 Várias amostras independentes Ordinal Kolmogorov- Smirnov WilcoxonMediana Mann-Whitney U Kolmogorov- Smirnov Análise da variância por postos de Friedman Mediana – várias amostras independentes Análise da variância numa direção de Kruskal – Wallis Paramétricos Intervalar ou Razão ztzt trtr Diferença de médias z t Regressão t Análise da variância Análise de Dados

43 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 43 Testes de hipóteses (continuação) Regiões de rejeição para testes unicaudais e bicaudais Região de aceitação de H 0 Região de aceitação de H 0 Região de rejeição de H 0 Região de rejeição de H 0 Região de rejeição de H 0 p = 0,05 p = 0,025 a. Região de rejeição de um teste unicaudal quando α = 0,05 b. Região de rejeição de um teste bicaudal quando α = 0,05 Análise de Dados

44 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 44 Observação: A seguir, serão apresentados, como exemplo, três modelos de testes de hipóteses: teste para uma amostra; teste para duas amostras e teste para várias amostras, pois todos os outros testes seguem o mesmo padrão de raciocínio. Testes de hipóteses (continuação) Análise de Dados

45 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 45 Teste para uma amostra – variável nominal Teste qui-quadrado de uma amostra: É utilizado em pesquisas de marketing para verificar se a distribuição de freqüência absoluta observada de uma variável em uma amostra é significativamente diferente da distribuição de freqüência absoluta esperada (teórica ou conhecida). Exemplo de aplicação: Sabendo-se qual tem sido a distribuição da preferência dos consumidores em relação aos quatro tamanhos de embalagens de determinado produto, verificar se a distribuição da preferência observada numa amostra, nos tamanhos de embalagem, para uma nova marca do produto a ser lançada difere significativamente da distribuição conhecida. Análise de Dados

46 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 46 Teste para uma amostra – variável nominal (continuação) Condições para utilização: Exclusivamente para variáveis nominais ou ordinais. Observações independentes. Não pode ser utilizado se mais de 20% das freqüências absolutas forem inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos, a solução para possibilitar a utilização do teste é agrupar células até terem as condições atendidas. Teoria/ Conceito: É uma prova do tipo aderência, isto é, o quanto a distribuição observada (O i ) se ajusta à distribuição esperada (E i ). Através da comparação entre as O i s e as E i s, aceita-se ou rejeita-se H 0, a determinado nível de significância α. Análise de Dados

47 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 47 Teste para uma amostra – variável nominal (continuação) Procedimento sumarizado do teste: 1.Determinar H 0 como sendo a negativa da existência de diferenças entre a distribuição de freqüência observada e a esperada. 2.Estabelecer um nível de significância α. 3.Distribuir as freqüências observadas O i s pelas k categorias e, sob a hipótese H 0, determinar a distribuição de freqüência esperada E i s pelas k categorias. 4.Determinar a região de rejeição de H 0. Calcular os graus de liberdade (gl), e procurar, a seguir, na Tabela C (SIEGEL, 1981, p. 280) o valor do qui-quadrado tabelado correspondente para α e gl. Graus de liberdade: gl = k – 1, sendo k = número de categorias Análise de Dados

48 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 48 5.Decisão. Calcular o valor de qui-quadrado a partir dos O i s, segundo a fórmula: Onde: O i = número de observações classificadas na categoria i; E i = número de casos na categoria i, sob H 0 (distribuição teórica); Comparando o qui-quadrado calculado com o qui-quadrado tabelado, decidir-se pela aceitação ou rejeição de H 0. χ 2 = k i=1 (O i – E i ) 2 E i k i=1 (O i – E i ) 2 E i = somatório dos cálculos efetuados para todas as células, segundo a fórmula acima. Teste para uma amostra – variável nominal (continuação) Análise de Dados

49 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 49 Teste para uma amostra – variável nominal (continuação) Exemplo: Um gerente de produto pretende verificar se a posição que o produto ocupa na prateleira dos supermercados tem influência sobre a quantidade vendida, através de um experimento. Um supermercado possui, geralmente, prateleiras com sete divisões verticais, sendo a posição 1 correspondente à mais próxima do piso. Para a realização do experimento, o gerente conseguiu que, durante um dia, todas as posições verticais da prateleira fossem ocupadas pelo seu produto. Análise de Dados

50 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 50 Posição Total 1234567 Vendas (unidades) O i 10111525291917126 Vendas (unidades) E i 18 126 Com base nesses dados, o gerente quer saber se as diferenças verificadas nas posições são significativas, a ponto de poder montar, com sucesso, um plano para induzir os supermercadistas a colocar seu produto em determinadas posições. Ao final do dia, as tabulações das vendas por posição foram as seguintes: Teste para uma amostra – variável nominal (continuação) Análise de Dados

51 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 51 Procedimentos para o teste: 1.Determinação de: H 0 = não há diferenças significativas entre as posições 4 e 5 na prateleira. H 1 = as diferenças observadas para as posições 4 e 5 são significativamente diferentes para melhor em relação às demais posições (Teste unicaudal). 2.Nível de significância α = 0,02. 3.Distribuição de freqüências esperadas sob H 0. Se não houver diferenças entre as posições, a distribuição de freqüências será de 18 unidades por posição, conforme a tabela anterior. 4.Região de rejeição. Para α = 0,02 e gl = 7 – 1 = 6, o valor (Tabela C, SIEGEL, 1981, p. 280) de qui-quadrado tabelado é 15,03. Portanto, a região de rejeição é a correspondente a todas as ordenadas maiores ou iguais a 15,03 para o qui-quadrado calculado. Teste para uma amostra – variável nominal (continuação) Análise de Dados

52 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 52 5.Decisão. Cálculo de qui-quadrado = {(10 – 18) 2 + (11 – 18) 2 + (15 – 18) 2 + (25 – 18) 2 + (29 – 18) 2 + + (19 – 18) 2 + (17 – 18) 2 } / 18 = 16,3 Teste para uma amostra – variável nominal (continuação) Tendo em vista que o qui-quadrado calculado (16,3) é maior que o tabelado (15,03), rejeitamos H 0 em prol de H 1. Portanto, há diferença significativa, no nível de 0,02, para as posições 4 e 5 nas prateleiras dos supermercados e, por isso, o gerente deve realizar o plano promocional. Análise de Dados

53 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 53 Teste para duas amostras não relacionadas – variável nominal (continuação) Teste qui-quadrado para duas ou mais amostras (o caso de mais de duas amostras foi juntado, pois a metodologia é a mesma): É utilizado em pesquisas de marketing para verificar se as distribuições absolutas de duas ou mais amostras não relacionadas diferem significativamente em relação a determinada variável. Exemplo: verificar se as classes socioeconômicas diferem significativamente no consumo de determinado produto; verificar se a escolha do tamanho do automóvel difere significativamente em função do tamanho da família etc. Análise de Dados

54 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 54 Teste para duas amostras não relacionadas – variável nominal (continuação) Condições para utilização: Dados nominais. Distribuição dos dados em freqüências absolutas. Amostras não relacionadas ou independentes. Não pode ser utilizado se mais de 20% das freqüências absolutas forem inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos, a solução para tornar a utilização do teste possível é agrupar células até ter as condições atendidas. Análise de Dados Teoria/ Conceito: A prova qui-quadrado para duas ou mais amostras não relacionadas é, semelhantemente à prova qui-quadrado de uma amostra, uma prova não paramétrica do tipo aderência, isto é, o quanto a distribuição observada (O i ) se ajusta à distribuição esperada (E i ). Através da comparação entre as O i s e E i s, aceita-se ou rejeita-se H 0, em determinado nível de significância α.

55 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 55 Procedimento sumarizado do teste: 1.Determinar H 0 como sendo a negativa da existência de diferenças entre a distribuição de freqüência absoluta observada e a esperada. 2.Estabelecer um nível de significância α. 3.Distribuir as freqüências absolutas das r variáveis pelas j categorias. Sob a hipótese H 0, determinar a distribuição de freqüência absoluta esperada das r variáveis pelas k categorias. Verificar se as restrições ao uso do qui-quadrado quanto ao número de freqüências por células não estão ocorrendo. 4.Determinar a região de rejeição de H0. Determinar os graus de liberdade (gl), sendo r o número de linhas e k o número de colunas. Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) Graus de liberdade: = gl = (r – 1) (k – 1) Procurar a seguir, na Tabela C (SIEGEL, 1981, p. 280) o valor do qui- quadrado tabelado ( χ2) correspondente para α (teste unicaudal) ou α/2 (teste bicaudal) e gl. Todos os valores maiores ou iguais ao valor tabelado correspondem a ordenadas da região de rejeição de H 0. t

56 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 56 Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) 5.Decisão. Calcular o valor de qui-quadrado utilizando a seguinte fórmula: Onde: O ij = número de observações classificadas, simultaneamente, na linha i e na coluna j; E ij = número de casos esperados simultaneamente na linha i e na coluna j, sob H 0 (distribuição teórica);o cálculo de cada E ij é obtido pela multiplicação do total de observações da linha pelo total de observações da coluna, dividido pelo total de observações. χ 2 = r i=1 (O ij – E ij ) 2 E ij c k j=1 Comparando o qui-quadrado calculado com o qui-quadrado tabelado decidir- se pela aceitação ou rejeição de H 0. Se χ 2 χ 2, rejeita-se H 0. r i=1 = somatório dos cálculos efetuados para todas as r linhas e k colunas, segundo a fórmula apresentada. k j=1 c t

57 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 57 Exemplo: Um gerente de concessionárias de uma montadora de automóveis, analisando o desempenho de suas 417 concessionárias, em relação, simultaneamente, a inúmeros itens, classificou-os em baixo, médio e alto desempenho. A empresa mantém um intenso programa de treinamento dirigido aos proprietários e aos funcionários das concessionárias. Esse mesmo gerente, analisando os quadros de atendimento aos programas de treinamento, notou que um grande número de concessionárias não tem atendido regularmente aos programas. Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação)

58 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 58 Exemplo: Interessado em saber se há relação entre o atendimento aos programas de treinamento e o desempenho das concessionárias, solicitou que as duas informações fossem cruzadas, o que resultou na seguinte tabela: Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) Atendimento do treinamento Desempenho da concessionária NãoSimTotais O ij E ij O ij E ij Baixo147,3713,721 Médio2119,13435,955 Alto110118,6231222,4341 Totais145272417

59 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 59 Procedimentos para o teste: 1.H 0 = não existe diferença significativa entre o desempenho das concessionárias que atenderam aos programas de treinamento e o das que não. H 1 = há diferenças significativas entre as concessionárias que atenderam aos programas de treinamento e as outras (Teste unicaudal). 2.Nível de significância α = 0,01. 3.A distribuição das freqüências absolutas observadas (O ij ) das r variáveis pelas k categorias corresponde à tabela anterior solicitada ao gerente. Sob a hipótese H 0, a determinação da distribuição de freqüência absoluta esperada (E ij ) das r variáveis pelas k categorias segue o seguinte raciocínio: supondo que o nível de desempenho seja designado pela variável A e o atendimento ao treinamento pela variável B, teremos as seguintes possibilidades: Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação)

60 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 60 Procedimentos para o teste: A 1 = Baixo desempenho. A 2 = Médio desempenho. A 3 = Alto desempenho. B 1 = Não-atendimento ao treinamento. B 2 = Atendimento ao treinamento. Como as variáveis A e B são independentes, então a probabilidade de ocorrer o evento A 1 B 1 (concessionárias com baixo desempenho e que não atenderam ao treinamento) é dada pelo produto das probabilidades independentes para A 1 e B 1 : P(A 1 B 1 ) = P(A 1 ) P(B 1 ) P(A 1 ) = 21/ 417 e P(B 1 ) = 125/ 41 e P(A1B1) = 21/ 417 125/ 417 = 7,3, que corresponde à freqüência absoluta esperada da respectiva célula. E assim, sucessivamente, calculamos todas as demais. Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) ×

61 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 61 A seguinte fórmula facilita esses cálculos: Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) × E ij = A multiplicação do total de observações da linha pelo total de observações da coluna dividido pelo total de observações. Assim, para a mesma célula já calculada, teríamos: E ij = 21 145/ 417 = 7,3 Efetuando todos os cálculos, teremos os dados constantes da tabela anterior, com as freqüências absolutas observadas e esperadas. 4.Determinação da região de rejeição de H 0. Procurar na tabela de qui-quadrado o valor correspondente a α = 0.01 e gl = (3 – 1) (2 – 1) = 2. Esse valor é χ 2 = 9,21. Desta forma, todas as ordenadas com valores maiores ou iguais estarão na região de rejeição de H 0. t

62 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 62 5.Decisão. Calcular o valor do qui-quadrado a partir das O ij s e das E ij s, segundo a fórmula apresentada: = (14 – 7,3) 2 / 7,3 + (21 – 19,1) 2 / 19,1 + (110 – 118,6) 2 / 118,6 + + (7 – 13,7) 2 / 13,7 + (34 – 35,9) 2 /35,9 + (231 – 222,4) 2 /222,4 Como o qui-quadrado calculado (10,67) é maior que o tabulado (7,3) para α = 0,02, H 0 é rejeitada em favor de H 1. Portanto, no nível de confiança de α = 1,01, as concessionárias que atenderam aos programas de treinamento tiveram um desempenho significativamente melhor do que as outras. Análise de Dados Teste para duas amostras não relacionadas – variável nominal (continuação) t (χ2)(χ2) c χ2χ2 = 10,67 c χ2χ2

63 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 63 Teste para várias amostras não relacionadas – variável ordinal Análise da variância por classificação numa só direção de Kruskal-Wallis: A utilização em pesquisas de marketing da análise da variância de Kruskal-Wallis é a mesma do teste Mann-Whitney U para situações em que amostras de mais de duas variáveis independentes estejam sendo comparadas. É a contrapartida não paramétrica da análise da variância num só sentido, cuja utilização exige que as distribuições das populações sejam normais e com variâncias homogêneas. Análise de Dados

64 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 64 Teste para várias amostras não relacionadas – variável ordinal (continuação) Condições para utilização: Serve para a comparação de três ou mais variáveis independentes. Medições ao menos ordinais. Escalas de medição idênticas nos diversos grupos. Os dados precisam ser ordenados. Análise de Dados

65 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 65 Teoria/ Conceito: O procedimento para o teste compreende a combinação dos escores das n amostras num único rol ordenado do maior para o menor escore, numerados, respectivamente, de 1 a n. A seguir, todas as classificações obtidas para os escores de cada amostra são somadas. Teste para várias amostras não relacionadas – variável ordinal (continuação) Quanto mais parecidas forem essas somas, mais parecidas serão as amostras e, conseqüentemente, as populações de onde foram extraídas; analogamente, quanto mais diferentes forem, mais diferentes serão as amostras e a população de onde foram extraídas. O teste Kruskal-Wallis determina se as somas dos escores são tão diferentes que as amostras e as populações de onde foram extraídas não são idênticas, a determinado nível de confiabilidade. Análise de Dados

66 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 66 Procedimento sumarizado do teste: 1.Definir H 0 como não havendo diferenças entre os escores das n variáveis consideradas. 2.Definir um nível de confiabilidade α para a realização do teste. Teste para várias amostras não relacionadas – variável ordinal (continuação) 3.Para amostras com tamanho n > 5, sob H 0, a estatística de H, usada para o cálculo do teste, é dada pela seguinte fórmula, cuja distribuição é a mesma de qui-quadrado com gl = k – 1: H = 12 n(n+1) R2njR2nj - 3(n+1) j=1 k j Onde: k = número de amostras; n j = número de casos na j-ésima coluna; n = número de casos na combinação de todas as amostras; R j = soma das classificações na j-ésima amostra; k j=1 R2njR2nj j = soma de todos os quadrados de R j divididos por n j Análise de Dados

67 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 67 Procedimento sumarizado do teste: 4.Região de rejeição. Corresponde a todos os valores de H calculados que forem maiores ou iguais ao qui-quadrado tabelado (Tabela C, SIEGEL, 1981, p. 280) para a e gl = k – 1. 5.Decisão. Calcular o valor de H utilizando a fórmula anteriormente apresentada. Se H for maior ou igual ao qui-quadrado tabelado para α e gl = k – 1, rejeite H 0 em prol de H 1. Teste para várias amostras não relacionadas – variável ordinal (continuação) Análise de Dados

68 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 68 Exemplo: Para verificar a necessidade de reformulações em três de suas lojas, uma cadeia de supermercados encomendou uma pesquisa para avaliar o grau de satisfação dos consumidores de cada uma das lojas. A escala utilizada pela agência de pesquisa foi a do tipo Likert, composta por uma série de afirmações às quais os consumidores apontam o seu grau de concordância. De cada uma das três lojas foram selecionados aleatoriamente nove consumidores. Teste para várias amostras não relacionadas – variável ordinal (continuação) Análise de Dados

69 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 69 AvaliaçõesOrdenação conjunta ABCABC 781137221724 120909351715 1069980101320 7710069221225 871239718314 869276191623 111121628427 1281046721126 110132116916 Totais11484180 Resultado tabulado das avaliações efetuadas Teste para várias amostras não relacionadas – variável ordinal (continuação) Análise de Dados

70 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 70 Procedimentos para o teste: 1.H 0 = não há diferenças na satisfação dos consumidores em relação às três lojas consideradas. 2.H 1 = há diferenças significativas na satisfação dos consumidores das três lojas (Teste bicaudal). 3.α = 0,10. 1.A distribuição de H, para H 0, é a mesma de qui-quadrado com gl =3 – 1 = 2. 1.Região de rejeição. Corresponde a todos os valores de H calculados que forem maiores ou iguais ao qui-quadrado tabelado para α/ 2 = 0,05 e gl = 2. Portanto, a região de rejeição é compreendida por todos os valores maiores ou iguais a 5,99. Teste para várias amostras não relacionadas – variável ordinal (continuação) Análise de Dados

71 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 71 Procedimentos para o teste: 5. Decisão. Calculando o valor de H, utilizando a fórmula: teremos: HcHc HcHc HcHc = = = 12 27(27+1) 84 2 9 - 3(27+1) 12 756 12.946 +7.056 + 32.400 9 - 84 114 2 9 180 2 9 + 8,51 + Teste para várias amostras não relacionadas – variável ordinal (continuação) HcHc = 12 n(n+1) j=1 k R2 njR2 nj j - 3(n+1) Análise de Dados

72 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 72 Procedimentos para o teste: Conclusão: Como H c = 8,51 é maior que o qui-quadrado tabelado = 5,99, rejeitamos H 0 em prol de H 1. Portanto, há diferenças significativas, no nível de 0,10, no grau de satisfação dos consumidores para as três lojas, sendo a loja C a que apresenta maiores problemas, seguida pela loja A. A loja C deveria receber reformulações no seu funcionamento. Teste para várias amostras não relacionadas – variável ordinal (continuação) Análise de Dados

73 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 73 Inferência estatística Dois diferentes testes de inferência estatística são apropriados para variáveis intervalares: o teste z e o teste t. A escolha entre um e outro dependerá do conhecimento do desvio padrão da população e do tamanho da amostra. Esses testes são utilizados em hipóteses a respeito da média da população, das diferenças entre médias, das proporções na população, das diferenças entre proporções e do coeficiente de regressão. Análise de Dados

74 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 74 Teste da média para uma amostra – variável intervalar Teste z: O teste z é utilizado em pesquisas de marketing para comparar a média de uma amostra com a média hipotética da população e decidir com base na média da amostra se a média hipotética da população pode ser aceita como verdadeira. Análise de Dados

75 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 75 Teste da média para uma amostra – variável intervalar (continuação) Condições para utilização: Exclusivamente para variáveis intervalares. Qualquer tamanho da amostra se o desvio padrão da população for conhecido. Somente para amostras de tamanho igual ou maior do que 30 elementos, se o desvio padrão da população não for conhecido. Para amostras de tamanho menor do que 30, o teste t será o mais recomendado. Análise de Dados

76 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 76 Teoria/ Conceito: O teste consiste em verificar se a média obtida na amostra (х) pode ser aceita como a média hipotética da população (µ). _ Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

77 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 77 Procedimento sumarizado do teste: 1.Determinar H 0 como sendo a média da amostra igual à média hipotética da população (ou a negativa da existência de diferença entre essas duas médias). Conseqüentemente, H 1, a hipótese alternativa, será a existência de diferença entre essas duas médias (Teste bicaudal). Ou que a média da amostra é maior (ou menor) que a média hipotética da população (Teste unicaudal). 2.Estabelecer um nível de significância. 3.Calcular os valores de z, segundo as fórmulas: Caso 1: a variância da população é conhecida: Z c = х - µ σ x - _ Z c = х - µ σ/ n _ ou x _ µ σxσx - Onde:= = = média da amostra; média hipotética da população; desvio-padrão da média que é igual a σ/ n, onde n é o tamanho da amostra e σ, o desvio-padrão da população. Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

78 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 78 Procedimento sumarizado do teste: Z c = х - µ S x - _ Z c = х - µ S/ n _ ou x _ µ SxSx - Onde:= = = média da amostra; média hipotética da população; estimativa do desvio-padrão da média que é igual a S/ n, onde n é o tamanho da amostra e S, a estimativa do desvio-padrão da população. Teste da média para uma amostra – variável intervalar (continuação) Caso 2: a variância da população é desconhecida: Análise de Dados

79 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 79 Procedimento sumarizado do teste: 4.Determinar a região de rejeição de z ao nível de significância α estabelecido. Procurar na tabela da distribuição padronizada de z o valor crítico Z t para o nível de significância estabelecido. 5.Decidir comparando os valores de Z c e Z t. Se o valor de Z calculado (Z c ) for maior que de Z tabelado (Z t ), a hipótese nula (H 0 ) é rejeitada e a hipótese alternativa (H 1 ) é aceita. Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

80 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 80 Procedimento sumarizado do teste: Esses mesmos passos devem ser utilizados quando os dados forem apresentados em proporção, e a fórmula para z a ser utilizada quando o desvio-padrão da variância for conhecida e n > 30 é: Onde: p = proporção de ocorrência na amostra; P = proporção hipotética de ocorrência na população; S = desvio padrão da proporção; n = número de elementos da amostra. Z = p – P = p – P S pq/ n Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

81 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 81 Exemplo: O comprador de uma rede de 500 farmácias está interessado em verificar a viabilidade de adotar a comercialização de uma nova marca de sabonete de um fornecedor tradicional. Sua experiência anterior, em função da categoria do produto e da margem de comercialização oferecida, indica que para essa comercialização ser viável e lucrativa é necessário vender no mínimo uma média de 100 unidades/ loja/ dia. O fornecedor concordou em fornecer uma partida do produto que permitiu a realização de um teste de vendas numa amostra probabilística de 32 lojas da rede. Com base nos dados da tabela a seguir, o comprador deve decidir se adota ou não a comercialização dessa nova marca de sabonete. Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

82 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 82 Os resultados obtidos de vendas por loja Vendas Lojaxx2x2 xx2x2 111613.4561711012.100 210511.02518704.900 312014.40019959.025 4938.64920908.100 513217.4242112014.400 611412.9962211513.225 7979.4092312515.625 810811.66424989.604 9867.3962510310.609 1012315.1292611212.544 1110511.02527928.464 1210210.4042810110.201 1312315.1292910911.881 14887.7443013217.424 1511412.9963111914.161 16948.8363210110.201 Teste da média para uma amostra – variável intervalar (continuação) Análise de Dados

83 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 83 Teste da média para uma amostra – variável intervalar (continuação) Procedimento para o teste: 1.Determinar H 0 : H 0 = média é menor ou igual a 100. H 1 = média é maior que 100. Portanto, um teste do tipo unicaudal. 2.Estabelecer um nível de significância. Seja o nível de significância de α = 0,05. 3.Calcular os valores de z. Nesse caso, utilizamos a fórmula: Z c = (x - µ) / S x sendo S x = S / n - - _ x = x i / n = 3.412 / 32 = 106,625 _ n i=1 S x = (x) 2 / n = 372.441 / 32 – 106,625 = 11.638,78 – 11.368,89 = 269,89 S x = 16,428 Z c = (106,625 – 100) / (6,625 / (16,428 / 32)) = 6,625 / 2,904 = 2,281 Z c = 2,281 - - Análise de Dados

84 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 84 Procedimento para o teste: 4.Determinar a região de rejeição de z. Procurar na tabela da distribuição padronizada de z o valor correspondente ao nível de significância de 0,05, que é, para o teste unicaudal, 1,65. 5.Decidir comparando os valores de Z c e Z t. Como o valor de Z calculado (2,281) é maior que o de Z tabelado (1,65), a hipótese nula (H 0 ) é rejeitada e a hipótese alternativa (H 1 ) é aceita para α = 0,05. Portanto, a nova marca de sabonete deverá ser aceita para ser comercializada pela rede de farmácias. Teste da média para uma amostra – variável intervalar (continuação) Observação: Teste t da média para uma amostra: a utilização em pesquisas de marketing do teste t é análoga à do teste z. Análise de Dados

85 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 85 Teste para duas amostras não relacionadas – variável intervalar Teste z da diferença entre duas médias: O teste z da diferença entre duas médias é utilizado em pesquisas de marketing para verificar se a diferença observada entre duas médias obtidas de amostras não relacionadas é suficientemente grande para ser considerada significativa. Condições para utilização: Exclusivamente para variáveis intervalares. Medições devem ser efetuadas na mesma unidade ou escala. Qualquer tamanho de amostras, se o desvio padrão da população for conhecido. Para amostras de tamanho maior do que 30, se o desvio padrão da população não for conhecido. Se o tamanho da amostra for menor ou igual a 30, o teste recomendado é o t. Análise de Dados

86 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 86 Neste caso, o cálculo do teste será efetuado pela fórmula: Z = (x 1 – x 2 ) – (µ 1 - µ 2 ) σ x - x 1 2 - __ - __ Onde: x 1 e x 2 = médias das amostras 1 e 2, respectivamente; µ 1 e µ 2 = as médias desconhecidas das populações 1 e 2, respectivamente, que sob H 0 são idênticas; σ x – x = 1 2 -- é o desvio-padrão da diferença das médias e é igual a: σ x - x = σ 2 + σ 2 x1x1 x2x2 - - 2 1 _ _ Teoria/ Conceito: O princípio que norteia este teste é o de que, se as médias amostrais de duas populações são normalmente distribuídas, a distribuição de sua soma ou diferença também será normalmente distribuída, desde que as populações que lhes deram origem sejam normalmente distribuídas ou as amostras sejam maiores do que 30. Teste para duas amostras não relacionadas – variável intervalar (continuação) Análise de Dados

87 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 87 Teoria/ Conceito: Teste para duas amostras não relacionadas – variável intervalar (continuação) Sendo: σ2σ2 x1x1 = σ2σ2 1 n1n1 e σ2σ2 x2x2 - = σ2σ2 2 n2n2 - σ x - x = σ 2 + σ 2 - - 21 Teremos: 1 2 n1n1 n2n2 Análise de Dados

88 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 88 Exemplo: Um fabricante de cigarros realizou uma pesquisa entre 100 fumantes em duas classes socioeconômicas e constatou que os fumantes da classe socioeconômica A/B fumam em média 20 cigarros/ dia e os da classe C/D uma média de 25 cigarros/ dia. Sabe se de estudos anteriores que o desvio padrão da população de fumantes na classe A/B é 10 e na classe C/D é 14. Esse fabricante deseja saber se a diferença verificada no consumo de cigarros entre as duas amostras deverá ser aceita como verdadeira na população ou atribuída apenas a variações eventuais. Teste para duas amostras não relacionadas – variável intervalar (continuação) Análise de Dados

89 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 89 3.Calcular os valores de z utilizando as fórmulas apresentadas no item teoria/ conceito: __ Z = (x 1 – x 2 ) – (µ 1 - µ 2 ) σ x - x 1 2 - - Teste para duas amostras não relacionadas – variável intervalar (continuação) Procedimento para o teste: 1.Determinar H 0 = não há diferença significativa entre fumantes das classes A/B e C/D, ou seja, µ 1 = µ 2. H 1 = há diferença significativa, ou seja, µ 1 µ 2. É um teste bicaudal. 2.Estabelecer um nível de significância. Seja o nível de significância de α = 0,05. Análise de Dados

90 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 90 Procedimento para o teste: 4.Determinar a região de rejeição de z. Procurar na tabela da distribuição padronizada de z o valor correspondente a 0,025 (0,05/ 2 por ser teste bicaudal), que é –1,96. 5.Decidir comparando os valores de Z c e Z t. Como o valor de Z calculado ( – 2,90) excede o de Z tabelado (–1,96) para 0,05 de significância, a hipótese nula (H 0 ) é rejeitada e aceita se a hipótese alternativa H 1. Portanto, há uma diferença estatisticamente significativa no nível de 0,05 no consumo médio diário de cigarros entre as duas classes consideradas. Teste para duas amostras não relacionadas – variável intervalar (continuação) Observação: Teste t da diferença entre duas médias: a utilização em pesquisa de marketing do teste t da diferença de duas médias é análoga à do teste z. Análise de Dados

91 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 91 Resumo dos testes z e t sobre inferências da média para uma amostra e duas amostras não relacionadas σ conhecidoσ desconhecido Uma amostra Z = x - µ σ x - - - - Z = x µ σ - - ~ N(0,1) n / ou n < 30 T Z Z e S = utilizar a tabela t para gl = n - 1 (x i - x) = = = - x µ SxSx onde S x = - S n -- 2 n n 30 x - µ - SxSx - n S / x - µ - n qualquer: ou Análise de Dados

92 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 92 Resumo dos testes z e t sobre inferências da média para uma amostra e duas amostras não relacionadas (continuação) σ conhecidoσ desconhecido Duas amostras não relacionadas - -- (x 1 - x 2 ) (µ 1 - µ 2 ) σ x - σ x 1 2 n qualquer: Z = n < 30 T Z = = = = (x 1 - x 2 ) - (µ 1 - µ 2 ) S x - x 1 2 - - n 30 (x 1 - x 2 ) - S x - x 2 1 - - - - - - onde S x - x 21 -- SxSx SxSx + 2 2 12 - - S2S2 S2S2 + 1 2 n1n1 n2n2 utilizar a tabela t para gl = n 1 + n 2 - 2 -- ~ N(0,1) Análise de Dados

93 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 93 Teste para duas amostras relacionadas – variável intervalar Exemplo: Um fabricante de vinhos pretende lançar uma nova marca. Desenvolveu duas versões para a embalagem e a adoção de uma ou outra deveria ser decidida através de pesquisa. Para realizar a pesquisa, solicitou que o novo vinho fosse engarrafado em cada uma das versões de embalagem. Essas duas versões foram colocadas à venda numa amostra aleatória de cinco lojas de uma rede de supermercados. Teste t r : O teste t r é o indicado para o caso de duas amostras relacionadas. Análise de Dados

94 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 94 Vendas em unidades LojaEmbalagem 1Embalagem 2Diferença (d) 172675 260528 365605 443412 554504 Resultados das vendas do vinho nas duas embalagens Com base nesses dados, qual embalagem deve ser adotada para o novo vinho? Teste para duas amostras relacionadas – variável intervalar (continuação) Análise de Dados

95 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 95 3.Calcular os valores de t. O cálculo de t, neste caso, é obtido através da seguinte fórmula: T c = (x d – D) / {(S d / (n – 1))} _ Procedimentos para o teste: 1.Determinar H 0. H 0 = não há diferença entre as médias de venda das duas embalagens. H 1 = há diferença significativa entre as médias de venda das duas embalagens. Portanto, um teste do tipo bicaudal. 2.Estabelecer um nível de significância. Seja o nível de significância de α = 0,05. Teste para duas amostras relacionadas – variável intervalar (continuação) Análise de Dados

96 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 96 Procedimentos para o teste: Onde:xdxd _ = = = = média das diferenças observadas entre as duas amostras em cada loja; D diferença esperada para H 0, ou seja, D = 0; n número de diferenças, que no caso é 5; SdSd desvio-padrão das diferenças observadas em relação à diferença média, que é calculado pela seguinte fórmula: = didi diferenças observadas entre as embalagens 1 e 2; d = média das diferenças observadas entre as embalagens 1 e 2. _ Teste para duas amostras relacionadas – variável intervalar (continuação) S d = (d 1 – d) 2 n i=1 n - 1 _ Análise de Dados

97 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 97 n qualquer: onden qualquer:onde Aplicando estas formulações aos dados da tabela, teremos os seguintes resultados: _ xdxd = = (5 + 8 + 5 + 2 + 4) / 5 = 4,8 SdSd {(5 – 4,8) 2 + (8 – 4,8) 2 + (5 – 4,8) 2 + (2 – 4,8) 2 + (4 – 4,8) 2 } / (5 – 1) = 6,5 = TcTc (4,8 – 0) / (6,5 / 4) = 1,6 Teste para duas amostras relacionadas – variável intervalar (continuação) Procedimentos para o teste: Análise de Dados

98 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 98 4.Determinar a região de rejeição de t. Procurar na tabela da distribuição padronizada de t o valor correspondente a α/ 2 = 0,025 (pois o teste é bicaudal) para gl = n – 1 = 5 – 1 = 4, que é 2,776. 5.Decidir comparando os valores de T c e T t. Como o valor de T calculado (1,6) é menor que o de T tabelado (2,776), a hipótese nula (H 0 ) é aceita no nível de significância de 0,05. Portanto, a diferença observada na maior compra da embalagem 2 não é significativa, e a adoção de qualquer uma das embalagens é indiferente. Teste para duas amostras relacionadas – variável intervalar (continuação) Procedimentos para o teste: Análise de Dados

99 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 99 Métodos para medir a associação As medidas de associação servem para verificar se dois ou mais conjuntos de dados estão relacionados e para medir o nível de relacionamento ou associação existente. Em marketing e pesquisas de marketing, existem inúmeras situações em que a medida da associação ou do relacionamento entre duas ou mais variáveis é extremamente útil. Análise de Dados

100 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 100 Métodos para medir a associação (continuação) Exemplo: Relacionar quanto a preferência para um produto, associada à classe social dos consumidores, ajuda nos processos de segmentação de mercado e de planejamento de marketing. Relacionar quanto a intensidade dos gastos promocionais está relacionada aos resultados de vendas ou de participação no mercado também ajuda no planejamento futuro desses gastos, tendo em vista os objetivos de vendas ou de participação de mercado visados. Análise de Dados

101 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 101 A escolha do método não paramétrico para a medida da associação irá depender de: considerar uma ou mais de uma variável independente; se as escalas de medição são nominais ou ordinais; da existência ou não de variável dependente; se a escala de medição é ordinal ou intervalar. Métodos para medir a associação (continuação) Análise de Dados

102 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 102 Método Escala de mensuração da variável Número de variáveis independentes NominalOrdinalIntervalar ou Razão Nº de variáveis dependentes Nº de variáveis dependentes Nº de variáveis dependentes NenhumaUmaNenhumaUmaNenhumaUma Não Paramétrico Nominal Uma Coeficiente de Contingência Mais de uma Índice de Associação Preditiva Ordinal Uma Coeficiente de Correlação de Postos de Spearman Coeficiente de Correlação de Postos de Kendall Mais de uma Coeficiente de Concordância de Kendall Métodos paramétricos e não paramétricos de medidas de associação - - - Análise de Dados

103 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 103 Método Escala de mensuração da variável Número de variáveis independentes NominalOrdinalIntervalar ou Razão Nº de variáveis dependentes Nº de variáveis dependentes Nº de variáveis dependentes NenhumaUmaNenhumaUmaNenhumaUma Paramétrico Intervalar ou Razão Uma Análise da Regressão Mais de uma Análise Fatorial com Variável Dummy Análise de Conglomerados Análise de Regressão Múltipla com Variável Dummy Análise Fatorial Análise de Conglomerados Análise da Regressão Múltipla Métodos paramétricos e não paramétricos de medidas de associação (continuação) - -- Análise de Dados

104 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 104 Coeficiente de CONTINGÊNCIA C O coeficiente de correlação de postos de Spearman é o mais conhecido e utilizado coeficiente para estabelecer a correlação de dois conjuntos de dados ordenados. Em pesquisas de marketing, sua utilização ocorre quando, de um mesmo grupo de pessoas, são obtidas medições ordinais de duas diferentes variáveis cujo relacionamento se deseja conhecer, tais como classe social e preferência para o produto. Pode também ser utilizado para comparar a associação existente entre dois quaisquer conjuntos de dados ordenados. Métodos para medir a associação (continuação) Análise de Dados

105 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 105 Coeficiente de correlação de postos de Spearman R s O coeficiente de correlação de postos de Spearman é o mais conhecido e utilizado coeficiente para estabelecer a correlação de dois conjuntos de dados ordenados. Em pesquisas de marketing, sua utilização ocorre quando, de um mesmo grupo de pessoas, são obtidas medições ordinais de duas diferentes variáveis cujo relacionamento se deseja conhecer, tais como classe social e preferência para o produto. Pode também ser utilizado para comparar a associação existente entre dois quaisquer conjuntos de dados ordenados. Métodos para medir a associação (continuação) Análise de Dados

106 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 106 Condições para utilização: Dois conjuntos de variáveis da mesma amostra ou de amostras diferentes. Variáveis medidas ao menos em escalas ordinais. Métodos para medir a associação (continuação) Análise de Dados

107 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 107 Teoria/Conceito: O coeficiente mede a disparidade de classificação entre dois conjuntos de dados ordenados. Os dois conjuntos de dados a comparar são ordenados, independentemente, do maior para o menor valor das medições, atribuindo-se, seqüencialmente, aos maiores valores a posição 1, e aos menores, a posição n. Comparando-se essas duas ordenações, pode ser deduzido que, quanto mais homogêneas e coincidentes forem, menores serão as diferenças algébricas observadas entre uma e outra, e vice-versa. Métodos para medir a associação (continuação) Análise de Dados

108 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 108 Teoria/Conceito: Se o relacionamento entre os dois conjuntos de classificações ordenadas for perfeito, todas as diferenças nos pares de classificação serão iguais a zero; analogamente, caso o relacionamento seja exatamente o inverso, todas as diferenças serão máximas (por exemplo, um mesmo respondente que tenha avaliado a primeira variável num valor que resultou numa classificação 1 e, a segunda, numa classificação n). Métodos para medir a associação (continuação) Análise de Dados

109 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 109 Teoria/Conceito: A princípio, o somatório das diferenças poderia dar uma noção da magnitude da similaridade ou discrepância entre as classificações; porém, como as diferenças são algébricas, as negativas tendem a cancelar as positivas, e o valor resultante ficaria deturpado. Para contornar esse problema é utilizada, para medir a magnitude das discrepâncias observadas, a raiz quadrada da soma dos quadrados das diferenças observadas. Métodos para medir a associação (continuação) Análise de Dados

110 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 110 Teoria/Conceito: O cálculo do coeficiente de correlação é obtido pela subtração da divisão desse valor pelo seu máximo valor possível (quando a discrepância for máxima). Esse coeficiente varia de 0 (não há correlação) até 1 (correlação máxima). Métodos para medir a associação (continuação) Análise de Dados

111 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 111 1. Ordenar as observações de cada uma das variáveis separadamente e atribuir posições para as classificações de 1 a n. 2. Calcular a diferença d e o seu quadrado para as observações pareadas de cada elemento da amostra. Métodos para medir a associação (continuação) Procedimento sumarizado para o cálculo de R s : Análise de Dados

112 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 112 3.Somar todos os quadrados das diferenças. 4.Com os dados assim obtidos, calcular o valor do coeficiente de correlação de postos (R s ), utilizando a seguinte fórmula: Métodos para medir a associação (continuação) R s = 1 - 6 d i i=1 n 2 n 3 - n Onde: R s = coeficiente de correlação de postos de Spearman; n = número de observações; d i = diferença algébrica entre as classificações. Procedimento sumarizado para o cálculo de R s : Análise de Dados

113 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 113 1.Definir H 0 como não havendo correlação entre os dois conjuntos de dados. 2.Definir um nível de significância α para testar H 0. 3.Para n = 10, a significância de se obter um R s sob H 0 pode ser testada, utilizando-se a seguinte fórmula para o cálculo de t cuja distribuição é idêntica à distribuição t de Student para gl = n – 2: Métodos para medir a associação (continuação) T = R s n - 2 1 - R s 2 Para n < 10, procurar o valor na Tabela P (SIEGEL, 1981, P. 315). Procedimento sumarizado para o teste de R s : Análise de Dados

114 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 114 4.Região de rejeição. Procurar na tabela da distribuição t de Student {Tabela B de Siegel (1981, p. 279)} o valor correspondente a α e gl = n – 2. A região de rejeição estará compreendida por todos os valores maiores ou iguais ao t tabelado. 5.Decisão. A decisão será tomada comparando-se o T calculado com o T tabelado para o nível de significância α e gl = n – 2. Se o T calculado for maior ou igual ao T tabelado, H 0 é rejeitada em prol de H 1. Métodos para medir a associação (continuação) Procedimento sumarizado para o teste de R s : Análise de Dados

115 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 115 Uma empresa, desejando saber quanto o nível de satisfação com um seu produto está relacionado ao nível socioeconômico do consumidor, realizou uma pesquisa junto a uma amostra aleatória de 15 consumidores. O nível de satisfação foi medido segundo o grau de concordância para uma série de afirmações, e o nível socioeconômico, por uma escala desenvolvida na empresa. Os resultados dessas duas medições estão na tabela a seguir: Métodos para medir a associação (continuação) Exemplo: Análise de Dados

116 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 116 Exemplo: Métodos para medir a associação (continuação) Pesquisado Nível de satisfaçãoNível socioeconômico d i d i 2 PontuaçãoOrdem (1)PontuaçãoOrdem (2) (1) – (2) 1822424– 24 2988466 24 3875392 39 4401371 00 5116136510 39 6113128814– 24 7111118612– 11 8833568– 525 9854629– 525 10126159215 00 1110610547 39 12117148111 39 1310398713– 416 14896403 39 15957455 24 Total128 Análise de Dados

117 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 117 1.Ordenar as observações de cada uma das variáveis separadamente e, atribuindo posições para as classificações de 1 a 15, obtêm-se os dados da tabela anterior. 2.Calcular as diferenças (d) e os quadrados das diferenças (d 2 ) para as observações pareadas de cada elemento da amostra e, em seguida somando todos os quadrados das diferenças (d 2 ), obteremos os dados necessários para o cálculo do índice de correlação (veja tabela anterior). 3.Aplicar a tabela vista a esses dados ter-se-á para R s : Métodos para medir a associação (continuação) Procedimento para o cálculo de R s : = 1 – R s = 1 – = 0,77 6 × 128 15 3 – 15 768 3.360 Análise de Dados

118 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 118 1.H 0 = não há correlação entre classe social e o nível de satisfação dos consumidores. H 1 = há correção entre a classe social e o nível de satisfação dos consumidores (Teste bicaudal). 2.α = 0,02. 3.Como n é maior que 10, a significância de se obter um R s sob H 0 pode ser testada, utilizando-se a fórmula vista para o cálculo de t, cuja distribuição é idêntica à distribuição t de Student para gl = 15 – 2 = 13. Métodos para medir a associação (continuação) Procedimentos para o teste de R s : Análise de Dados

119 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 119 5.Decisão. Como n = 15, H o pode ser testada, utilizando-se, para o cálculo de T, a fórmula T = R s + [(n – 2) / (1 – R s )] 4.Região de rejeição. O valor tabelado de t para α / 2 = 0,01 e gl = 13 é 2,65. A região de rejeição estará compreendida por todos os valores maiores ou iguais a 2,65. Métodos para medir a associação (continuação) Sendo o T calculado (4,35) maior que o T tabelado (2,65), H 0 é rejeitada em prol de H 1, no nível de significância α = 0,02. Portanto, existe uma correlação positiva de 0,77 entre a classe social e o nível de satisfação dos consumidores. Procedimentos para o teste de R s : 2 T c = R s n - 2 1 - R s 2 15 - 2 T c = 4,35 T c = 0,77 1 – 0,77 2 0,77 13 0,407 = 0,77 5,65 × Análise de Dados

120 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 120 Coeficiente de concordância de Kendall W: O coeficiente de concordância de Kendall W determina qual é o grau de associação entre mais de dois conjuntos ordenados. Esse tipo de medida da associação é, particularmente, interessante em pesquisas de marketing para os casos em que há, por exemplo, vários consumidores avaliando, através de classificações, simultaneamente vários produtos (ou várias embalagens, ou várias propagandas etc.). Métodos para medir a associação (continuação) Condições para utilização: Conjunto de n objetos avaliados por k avaliadores. Avaliações em escalas ordinais originadas de comparação dos n objetos. Análise de Dados

121 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 121 Teoria/ Conceito: Uma das formas de solução do problema consiste em calcular todos os índices de correlações de Spearman (R s ) de todos os possíveis pares de classificações e em seguida calcular a média para determinar o coeficiente de correlação de todo o conjunto. É um caminho muito trabalhoso e, por isso, não recomendável. A outra forma, mais fácil, é imaginar o que ocorre quando não há nenhuma concordância entre todos os conjuntos, e quando há total concordância. O coeficiente de concordância será um índice de divergência entre a concordância verdadeira verificada nos dados e o máximo de concordância possível. Métodos para medir a associação (continuação) Análise de Dados

122 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 122 Procedimento sumarizado para o cálculo de W: 1.Sendo k = número de avaliadores e n = número de objetos avaliados, construir uma tabela n × k com as classificações observadas. 2.Calcular R n, a soma das classificações de cada objeto. 3.Determinar a média dos R n, ou seja, R n / k. Calcular as diferenças algébricas entre cada R n e essa média e elevar ao quadrado. Obter S, somando todos os resultados. Métodos para medir a associação (continuação) 4.Calcular o índice de concordância de Kendall W, aplicando a seguinte fórmula aos dados obtidos nos itens 1, 2 e 3: W = S 1/ 12 k 2 (n 3 – n) Onde: S = somatório do quadrado das diferenças observadas; k = número de avaliadores: n = número de objetos avaliados. Análise de Dados

123 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 123 Exemplo: Uma empresa realizou uma pesquisa procurando avaliar a ordem de preferência dos consumidores para as 8 marcas concorrentes de um mesmo produto. Foram obtidas as opiniões de uma amostra aleatória de 20 consumidores. Com base nos resultados apresentados na tabela seguinte, a empresa deseja saber qual foi o grau de concordância na avaliação desses 20 consumidores. Métodos para medir a associação (continuação) Análise de Dados

124 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 124 Consumidor (k) Produto (n) ABCDEFGH 131245768 243125876 335874612 453216487 512548376 631452678 721346785 832146578 913542786 1023415687 1124316875 1232154687 1354312867 1431245867 1553216487 1621346785 1713542786 1832154687 1921346785 2053216487 Totais (R n )5848606696124142126 R n = 720 Rmédio (720/ 8)90 d–32–42–30–246345236 d2d2 1.0241.764900576361.1562.7041.296 S = d 2 = 1.024 + 1.764 + 900 + 576 + 36 + 1.156 + 2.704 + 1.296 = 9.456 Tabela de resultados da avaliação dos consumidores Análise de Dados

125 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 125 Exemplo: Efetuando os procedimentos indicados para o cálculo de W, obtêm-se os dados que constam das linhas R n, R médio, d, d 2 e S na tabela anterior. Aplicando a fórmula para o cálculo de W, tem-se: W = 9.456 20 2 (8 3 – 8) / 12 W = 9.456 400 × 12 ×504 W = 0,562 Portanto, a concordância na avaliação dos 20 consumidores na ordenação das oito marcas foi de 0,562. Métodos para medir a associação (continuação) Análise de Dados

126 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 126 Métodos de correlação e regressão A regressão refere se à natureza da associação estatística, isto é, à correspondência de uma variável- critério em relação a uma ou mais variáveis- prognóstico. A correlação diz respeito ao grau de associação ou correspondência existente entre uma variável critério e uma ou mais variáveis prognóstico. Análise de Dados

127 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 127 Diagramas de dispersão Y X X Y Correlação e regressão (continuação) Análise de Dados

128 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 128 Curva de mínimos quadrados Y X (X n,Y n ) dndn (X 1,Y 1 ) d1d1 d2d2 (X 2,Y 2 ) Correlação e regressão (continuação) Análise de Dados

129 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 129 n qualquer: onden qualquer: onde Para o caso particular de uma reta, a curva de regressão que se ajusta aos dados tem a seguinte equação: Y = a 1 + a 2 X Onde: Y= a variável-critério, e representa o valor esperado de Y dado determinado valor de X; X = a variável-prognóstico; a1a1 = valor de Y para X = 0; a2a2 = valor médio de Y por unidade de X. Regressão linear simples Análise de Dados

130 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 130 As constantes a 1 e a 2 são determinadas mediante a resolução do sistema de equações: Regressão linear simples (continuação) Y = a 1 n + a 2 X XY = a 1 X + a 2 X 2 (Y) (X 2 ) – (X) (YX) n(X 2 ) – (X) 2 a1a1 = n(XY) – (X) (Y) n(X 2 ) – (X) 2 a2a2 = Resultando em: Análise de Dados

131 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 131 Exemplo de regressão simples e correlação simples: Uma empresa produtora de bens de consumo de massa levantou um histórico de dez anos das vendas, em milhares de unidades, de um seu produto, os investimentos, em milhões de reais, em comunicação (propaganda, promoção de vendas etc.) e o número de vendedores para este mesmo produto. Regressão linear simples (continuação) Análise de Dados

132 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 132 Ano X Comunicação (milhões de R$) Z N o de vendedores Y Vendas (milhares de unidades) 19949,51095 19956,5860 19967,0960 19978,01280 19987,51580 19998,51180 20007,51385 20015,5760 20028,01585 20036,01065 Resultados do levantamento Regressão linear simples (continuação) Análise de Dados

133 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 133 Relação entre investimentos em comunicação e vendas Vendas (milhares de unidades) Comunicação (milhões de R$ 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 50 67 8 9 10 60 70 80 90 100 Y X Regressão linear simples (continuação) Análise de Dados

134 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 134 Cálculos efetuados a partir dos dados originais do problema AnoX2X2 XYZ2Z2 ZYY2Y2 XZ(X-X)(Z-Z)(Y-Y) 199490,25902,51009509.025952,12,0 199542,25390,0644803.60052-0,9-3-15 199649,00420,0815403.60063-0,4-2-15 199764,00640,01449606.400960,615 199856,25600,02251.2006.400112,50,145 199972,25680,01218806.40093,51,1-5 200056,25637,51691.1057.22597,50,1210 200130,25330,0494203.60038,5-1,9-4-15 200264,00680,02251.2757.2251200,6410 200336,00390,01006504.22560-1,4-10 Total560,505.670,01.2788.46057.700828-0- Regressão linear simples (continuação) _ _ _ Análise de Dados

135 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 135 Cálculos efetuados a partir dos dados originais do problema (cont.) Ano[(X-X) (Y-Y)][(Z-Z) (Y-Y)][(X-X) (Z-Z)](X-X) 2 (Z-Z) 2 (Y-Y) 2 [(X-X) (Z-Z) (Y-Y)] 19944,2-2-2,14,411400-4,2 199513,545-2,70,819225-40,5 19966,0300,80,164225-12,0 19973,050,60,361253,0 19980,520,40,0116252,0 19995,50-1,21-255,5 20001,0200,20,0141002,0 200128,5607,63,6116225-114,0 20026,0402,40,361610024,0 200314,0101,41,961100-14,0 Total120,02288,612,90681.450148,2 Regressão linear simples (continuação) _______ _ _ ___ Análise de Dados

136 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 136 Aplicando-se as equações para determinar a 1 e a 2 aos dados de X e Y dessa tabela, tem-se: (Y) (X 2 ) – (X) (YX) n(X 2 ) – (X) 2 a1a1 = 750 × 560,5 – 74 × 5.670 10 560,5 – 74 2 × = a1a1 = 795 129 a1a1 = 6,162 n(XY) – (X) (Y) n(X 2 ) – (X) 2 a2a2 = 10 × 5.670 – 74 × 750 10 560,5 – 74 2 × = a1a1 = 1.200 129 a2a2 = 9,302 Regressão linear simples (continuação) Análise de Dados

137 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 137 A equação de regressão resultante para o exemplo será: X = 9 Y = 6,162 + 9,302 9 = 89,880 Regressão linear simples (continuação) O coeficiente a 1 é o valor onde a reta corta o eixo de Y e corresponde ao valor de Y para X = 0. O coeficiente a 2 é denominado coeficiente de regressão bruto, e seu significado para o exemplo é o de que, em média, as vendas crescem 9.302 unidades para cada R$ 1.000,00 de investimentos em comunicação, o que possibilita predizer qual deverá ser o incremento no volume de vendas para dado incremento no investimento em comunicações. Y = 6,162 + 9,302 X Assim, se X = 5 Y = 6,162 + 9,302 5 = 52,672 E se × × Análise de Dados

138 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 138 C ompreende a regressão linear de uma variável critério em relação a duas ou mais variáveis prognóstico. Regressão linear múltipla Análise de Dados

139 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 139 n qualquer: onden qualquer:onde Coeficiente de correlação A variação total ocorrida com uma variável Y (critério) será resultante em parte pela variação ocorrida nas variáveis X, Z etc. (prognóstico), e o restante da variação de Y será resultante de outros fatores desconhecidos. A variação total de Y pode ser expressa da seguinte forma: Onde: Y est = o valor de Y estimado; (Y – Y est ) = a variação não explicada; (Y est – Y)2 = a variação explicada. (Y – Y) 2 = (Y – Y est ) 2 + (Y est – Y) 2 _ _ _ Análise de Dados

140 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 140 n qualquer: onden qualquer:onde Este coeficiente nos dá uma medida da quantidade da variação explicada na variável critério pelas variáveis prognóstico consideradas. Se a variação explicada for nula, esse quociente será igual a zero; se a variação total for toda explicada, este quociente será igual a um. Coeficiente de correlação (continuação) Define-se como coeficiente de determinação e nota-se por r 2 o quociente da variação explicada pela variação total. r 2 = variação explicada/ variação total = (Y est – Y) 2 (Y – Y) 2 _ _ Análise de Dados

141 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 141 Esta expressão também pode ser escrita, desprezando o sinal, sob a forma: O coeficiente de correlação é a medida do grau de associação entre a variável Y (critério) e as variáveis X, Z etc.; é definido como raiz quadrada do coeficiente de determinação e nota-se por r. Coeficiente de correlação (continuação) r2r2 = S 2 y. X Sy 2 1 – r = variação explicada variação total = (Y est – Y) 2 (Y – Y) 2 _ _ Análise de Dados

142 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 142 O coeficiente de correlação varia entre – 1 e + 1. Sendo – 1 significa que há total correlação negativa, + 1 total correlação positiva e 0, a inexistência de correlação. O coeficiente de correlação também pode ser expresso por: Onde: S 2 y.x = variância de y em relação a x; Sy 2 = variância de y. Coeficiente de correlação (continuação) r2r2 = S 2 y. x Sy2Sy2 1 – Análise de Dados

143 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 143 Exemplos de diagramas de dispersão com os coeficientes de correlação linear associados r = 0,90 r = 0 r = 0,55 r = - 0,85 Coeficiente de correlação (continuação) Análise de Dados

144 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 144 Coeficiente de correlação simples O coeficiente de correlação simples é a medida do grau de associação linear entre duas variáveis. Sendo a fórmula matemática que representa esta associação igual a Y = a 1 + a 2 X, a formulação geral para r ficará reduzida a: A fórmula para o cálculo do coeficiente de correlação simples só poderá ser utilizada quando os seguintes pressupostos forem atendidos: X e Y precisam ser variáveis aleatórias e as observações originárias de amostras com distribuições normalmente distribuídas, tanto para X quanto para Y. _ _ r = (X – X) (Y –Y) (X – X) 2 (Y – Y) 2 = cov (X, Y) var(X) var(Y) _ _ Análise de Dados

145 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 145 Análise fatorial É a denominação atribuída às técnicas estatísticas paramétricas multivariadas utilizadas para estudar o inter-relacionamento entre um conjunto de variáveis observadas. Diferentemente da regressão múltipla, em que uma variável é, explicitamente, considerada critério e as demais prognóstico, na análise fatorial todas as variáveis são consideradas simultaneamente. Análise de Dados

146 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 146 Emprego da análise fatorial em pesquisas de marketing Identificação da estrutura Redução do volume de dados Construção de escalas Transformação dos dados Análise de Dados

147 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 147 Passos da análise fatorial Cálculo das correlações. Extração dos fatores iniciais. Rotação da matriz. Análise de Dados

148 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 148 Exemplo dos passos na análise fatorial Variáveis Correlação entre variáveis 123456789 1. Desempenho1,76,48,20,08,25,05,28,18 2. Modelo moderno1,47,19,07,25,10,30,21 3. Conforto1,22,13,22,09,31,26 4. Confiança na marca1,42,53,00,20,33 5. Durabilidade/ qualidade1,36,01,09,18 6. Segurança1,08,31,33 7. Espaço (passageiros e bagagens)1,45,34 8. Economia (combustível e manutenção)1,48 9. Preço de aquisição1 Análise de Dados

149 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 149 30,3632,6636,98100,0023,2225,0451,74% variância comum 20,3421,8824,7867,0015,5616,7834,66% variância total 1,831,972,236,031,401,513,12Soma dos quadrados –,68,36,13,61–,42,22,629. Preço de aquisição –,77,13,28,69–,52–,04,658. Economia (combustível e manutenção) –,83–,13–,02,70–,77–,04,337. Espaço (passageiros e bagagens) –,20,73,20,62,16,44,636. Segurança,03,76–,02,57,29,59,385. Durabilidade/ qualidade –,08,81,14,69,27,53,584. Confiança na marca –,17,15,69,53,16–,32,633. Conforto –,01,07,89,80,26–,51,692. Modelo moderno –,05,08,90,83,31–,52,681. Desempenho C Econômico B Racional A Emocional h2h2 CBAVariáveis Matriz giradaMatriz principal de fatores Fatores principais extraídos da matriz de correlação e a matriz girada ortogonal (rotação varimax) Análise fatorial (continuação) Análise de Dados

150 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 150 Permite ao pesquisador classificar objetos ou indivíduos observados em relação a inúmeras variáveis em subgrupos ou conglomerados não definidos a priori mas que surgem em função da análise realizada. Uma das principais aplicações da análise de conglomerados em marketing é a subdivisão do mercado em segmentos utilizando medidas multivariadas dos consumidores, como: demográficas, sociais, econômicas e psicográficas. Cada agrupamento (conglomerado) terá por característica grande similaridade interna e grande dissimilaridade externa. Análise de conglomerados Análise de Dados

151 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 151 Exemplo de análise de conglomerados Consumidor Pontuação obtida na variável Renda (X 1 )Ocupação (X 2 ) A25,00 B–20,00–22,50 C30,0020,00 D25,0017,50 E2,5010,00 F–15,00–17,50 G2,50– 5,00 H0,50 I–25,00–20,00 Análise de Dados

152 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 152 Identificação visual de conglomerados 0 5 10 1520 25 30 5 10 15 20 25 5 10 15 20 25 105 Renda A C D S1S1 G E H S2S2 I F S3S3 B Análise de conglomerados (continuação) Análise de Dados

153 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 153 Distância euclidiana de duas medidas d D,H = (X 1H – X 1D ) + (X 2H – X 2D ) 2 2 d D,H = (5 – 25) + (5 – 17,5) 2 2 d D,H = 23,6 Análise de conglomerados (continuação) Análise de Dados

154 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 154 Matriz das distâncias médias A B C D E F G H I A0,0 B32,70,0 C3,532,80,0 D3,730,12,80,0 E13,519,714,611,90,0 F29,23,529,326,616,30,0 G18,714,218,615,97,510,80,0 H14,118,614,611,82,815,15,10,0 I33,62,834,031,220,35,115,719,50,0 Análise de conglomerados (continuação) Análise de Dados

155 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 155 Método das ligações simples Distância Pares de consumidores 2,8CD, BI e EH 3,5AC e BF 3,7AD 5,1FI e GH 7,5EG Análise de conglomerados (continuação) Análise de Dados

156 PESQUISA DE MARKETING – Edição Compacta Mattar Mattar 156 Diagrama de visualização dos conglomerados A CD 2,8 3,5 3,7 B IF 5,1 2,8 3,5 E HG 5,1 2,8 7,5 Análise de Dados


Carregar ppt "PESQUISA DE MARKETING Edição Compacta Prof. Dr. Fauze Najib Mattar."

Apresentações semelhantes


Anúncios Google