Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Técnicas Estatísticas de Agrupamento
Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo Disciplina: EAD 351 Técnicas Estatísticas de Agrupamento
2
Aplicação no PASW Statistics
3
Exemplo 3
4
Considere o exemplo de uma analista de gestão de pessoas que deseja agrupar os candidatos em três grupos considerando duas variáveis: o tempo de formação do candidato e o tempo que o candidato permaneceu na empresa anterior. A Tabela apresenta os valores das variáveis para os cinco candidatos.
5
Neste exemplo será utilizado o software PASW Statistics versão 18.
6
Importar a Base de Dados
7
Para importar um arquivo clicar em File, localizar o arquivo no computador e clicar em open.
8
Caso a primeira linha do arquivo a ser importado tiver o nome das variáveis deixar a opção que está marcada selecionada e clicar em OK.
9
O PASW Statistics importou de forma adequada a a base de dados.
10
Clicar em Variable View para verificar o tipo de cada variável.
11
A variável candidato é uma string e não uma variável numérica
A variável candidato é uma string e não uma variável numérica. Para trocar o tipo de variável clicar em TYPE , selecionar o tipo desejado e clicar em OK.
12
Agora a variável candidato é uma string.
13
Cluster Hierárquico
14
Selecionar Analyze , Classify e Hierarchical Cluster
15
Selecionar as variáveis que deverão ser utilizadas para formar os grupos e selecionar a variável Label.
16
As variáveis que deverão ser utilizadas para formar os grupos e a variável Label foram selecionadas.
17
No menu Statistics, Fazer estas seleções :
18
No menu Plots. Fazer estas seleções :
19
No menu Method, Selecionar um dos métodos de agrupamento
20
Neste exemplo selecionar o vizinho mais próximo (Nearest Neighbor )
21
No menu Method, Selecionar uma das medidas
22
Neste exemplo selecionar a Distância Euclidiana
23
Após a seleção das opções clicar em ok
24
O PASW Statistics gera um output com todos os resultados.
25
Número de elementos da base de dados e a matriz com as distâncias Euclidianas.
26
O PASW Statistics mostra quais os elementos que foram agrupados e em que distância.
No estágio 1, o elemento 1 foi agrupado ao elemento 2 na distância 2,236. No estágio 2, o elemento 3 foi agrupado ao elemento 4 na distância 5,657. No estágio 3, o grupo (1+2) foi agrupado ao elemento 5 na distância 9,220. No estágio 4, o grupo (1+2+5) foi agrupado ao grupo (3+4) na distância 10,00.
27
Dendrograma O PASW Statistics gera o dendograma.
Neste dendograma o PASW Statistics não apresenta no eixo vertical as distâncias euclidianas originais. O PASW Statistics faz uma mudança de escala. Dendrograma
28
Exercício
29
1 – Considerando a matriz de distância quais os 2 Pokemons mais parecidos?
ENTREGAR
30
2 – Faça o dendograma ENTREGAR
31
Banco de Dados: MCDONALDS.xls
Exemplo 4 Banco de Dados: MCDONALDS.xls
32
Neste exemplo pretende-se agrupar os lanches do Mcdonalds de acordo com as variáveis apresentadas.
33
Método Hierárquico
34
As variáveis que deverão ser utilizadas no cluster foram selecionadas e a variável Label foi selecionada.
35
No menu Statistics, Fazer estas seleções :
36
No menu Plots, Fazer estas seleções :
37
Método Hierárquico Vizinho mais próximo (Nearest neighbor)
38
Selecionar: Cluster Method: Vizinho mais próximo (Nearest neighbor) Measure : Distância Euclidiana (Euclidian distance) Transform Values: Z scores (transforma cada variável e considera as variáveis padronizadas).
39
A variável padronizada é denominada Z.
X: variável aleatória com média e desvio padrão S Z: variável aleatória padronizada com média 0 e variância 1.
40
Dendrograma
41
base de dados: MCdonalds1.xls
Exercício 1 base de dados: MCdonalds1.xls
42
Considerando as variáveis padronizadas, o método da centróide e a matriz de distância Euclidiana , faça o dendograma. Obtenha 5 grupos com a base de dados: MCdonalds1.xls 1 – Quais os lanches estão em cada grupo. Responder com o número do lanche e não com o nome. Considerar a formação da esquerda para a direita: Grupo 1: Grupo 2: Grupo 3: Grupo 4: Grupo 5: ENTREGAR
43
Exercício 2 base de dados: POKEMON1.xls
44
Todas as variáveis devem estar como : ESCALA.
45
Considerando as variáveis padronizadas, o método do vizinho mais distante e a matriz de distância Euclidiana, faça o dendograma. Obtenha 4 grupos com a base de dados: POKEMON1.xls. Considerar a formação da esquerda para a direita. 1 – Quais elementos (Pokemon) estão em cada grupo ? ENTREGAR
46
ENTREGAR Abrir a base de dados no excel.
Considerar as variáveis originais e não as variáveis padronizadas. 2 – Complete a tabela abaixo com a média da variável para cada grupo. Caracterize os grupos. ENTREGAR
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.