Técnicas Estatísticas de Agrupamento

Slides:



Advertisements
Apresentações semelhantes
SPSS. 1 - Inserir dados na planilha: digite os dados na planilha.
Advertisements

CLASSIFICAÇÃO EM IMAGENS MULTIESPECTRAIS. Classificação em imagens multiespectrais Imagens multiespectrais Espaço de atributos Classificação Seleção de.
Ministério da Defesa INCRA SIPAM Tutorial QGis Instalação de Extensão BrOffice Uso da Planilha-Modelo.
Sistemas Lógicos 2 O MAPA DE KARNAUGH. Um mapa de Karnaugh provê um método sistemático para simplificação de expressões Booleanas e, se usado adequadamente,
OS – Cadastrar Ordem de Serviço. OBJETIVO: Cadastrar ordem de serviço para clientes sem que seja necessário efetuar uma venda ( semelhante ao orçamento,
Regressão Linear Múltipla Arquivo: seleção2.sav. Base de dados Variáveis independentes: X 1, X 2, X 3,..., X 14 Variável dependente ou Resposta: Y 1428.
Treinamento. 1. Estrutura de Acesso 2. Pessoas.
Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1.
Classificação não supervisionada de imagens. Classificação de imagens Consiste na identificação de tipos de cobertura de solos, de acordo com os padrões.
ESTATÍSTICA AULA 03 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
Resultante de um sistema de forças
UNIVERSIDADE FEDERAL DE SANTA CATARINA FACULDADE DE ENGENHARIA SANITÁRIA AMBIENTAL FLORIANÓPOLIS AUTOCAD: COMANDOS 2D DISCIPLINA: CAD PARA ENG. SANITÁRIA.
Como os dados do exercício tem cabeçalho devemos selecionar a opção pertinente.
ESTATÍSTICA (parte 3) Gráficos manuais e no Excel
Finanças na Aquisição de Aeronaves
UNIVERSIDADE REGIONAL DE BLUMENAU
Finanças na Aquisição de Aeronaves
O OBJETIVO FUNDAMENTAL DA DISCIPLINA
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Análise de Agrupamento Camilo Daleles Rennó
Medidas de Dispersão para uma amostra
Medidas de Dispersão Aula 8.
Estatística Básica Medidas de Dispersão
GRÁFICOS ESTATÍSTICOS NO EXCEL
Prof. Dr. Adolpho Walter Pimazoni Canton
Análise de Clusters.
Fundamentos de Programação 1
Como que passa? 1ª Avaliação (06/10) 13/10 Seminário (01/12)
ESTATÍSTICA Aula 5.
Abordagens Mistas e Triangulação
Probabilidade e Estatística Aplicadas à Contabilidade II
ESTATÍSTICA AULA 06 ANÁLISE EXPLORATÓRIA DE DADOS II – Unidade 4
ESTATÍSTICA AULA 04 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
Probabilidade e Estatística Aplicadas à Contabilidade I
TMEC011 – ESTATÍSTICA APLICADA
Introdução e objetivos
Soft Starter ATS48 Comunicação ATS48, CLP Ethernet e IHM em Modbus TCP.
Alunos Enturmados/Identificação dos Alunos
Cadastro de Funcionário
Cadastro de Turma Veja como gerenciar as turmas da sua escola no sistema Novo Alterar Copiar Consultar Trocar Matriz Curricular Excluir Imprimir CSI.
Instruções para o uso do Excel:
Recuperação Especial A funcionalidade Recuperação Especial foi adicionada na última atualização do sistema. Ela funciona como uma segunda recuperação ou.
Turma AEE/Atividade Complementar
Cadastro de Funcionário
Diário Escolar Documentos Escolares / Relatórios Por Turma
Prestadores de serviço
Livro de Matrícula Documentos Escolares / Relatórios
Histórico Escolar O Histórico Escolar mantém os resultados das avaliações do aluno por período letivo Pesquisar Incluir Alterar Consultar Excluir Equivalências.
XVIII CONGRESSO ANUAL DA SPE – SPE2010
Cálculo e Encerramento
Grupos de Acesso A funcionalidade Grupos de Acesso permite criar acessos personalizados no sistema, definindo quais funcionalidades cada grupo criado poderá.
Avaliação e Frequência
Inventário Balanço de Estoque
Financeiro - Conta Contábil
Tutoriais do AVA UNIUBE ON-LINE
Conceitos Básicos do Excel. O Excel é um editor de planilhas eletrônicas para visualização, gerenciamento e análise de dados, mas também possui alguns.
Aula 2 - Estatística Descritiva Prof. Roosevelt A da Silva
Procedimentos antes e após coleta dos dados
Inscrição GDAE Equipe de Atribuição de Aulas - CELP/DRHU/SE 2011.
Responsável Técnico Victory Fernandes; CREA-Ba: 43019
ANOVA.
Passo a passo – Aluno Tarefas Iniciais.
Estatística amintas paiva afonso.
Exercícios de clustering
Site: Estatística Prof. Edson Nemer Site:
Instrução de como Lançar Notas no SIGA
Estatística Medidas de tendência central Média aritmética.
Passo a passo – Aluno Tarefas Iniciais.
Tipos Primitivos de Dados
(UFRJ) Uma confecção vai fabricar 3 tipos de roupa utilizando materiais diferentes. Considere a matriz F = (aij) abaixo, na qual aij representa quantas.
Transcrição da apresentação:

Técnicas Estatísticas de Agrupamento Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo Disciplina: EAD 351 Técnicas Estatísticas de Agrupamento

Aplicação no PASW Statistics

Exemplo 3

Considere o exemplo de uma analista de gestão de pessoas que deseja agrupar os candidatos em três grupos considerando duas variáveis: o tempo de formação do candidato e o tempo que o candidato permaneceu na empresa anterior. A Tabela apresenta os valores das variáveis para os cinco candidatos.

Neste exemplo será utilizado o software PASW Statistics versão 18.

Importar a Base de Dados

Para importar um arquivo clicar em File, localizar o arquivo no computador e clicar em open.

Caso a primeira linha do arquivo a ser importado tiver o nome das variáveis deixar a opção que está marcada selecionada e clicar em OK.

O PASW Statistics importou de forma adequada a a base de dados.

Clicar em Variable View para verificar o tipo de cada variável.

A variável candidato é uma string e não uma variável numérica A variável candidato é uma string e não uma variável numérica. Para trocar o tipo de variável clicar em TYPE , selecionar o tipo desejado e clicar em OK.

Agora a variável candidato é uma string.

Cluster Hierárquico

Selecionar Analyze , Classify e Hierarchical Cluster

Selecionar as variáveis que deverão ser utilizadas para formar os grupos e selecionar a variável Label.

As variáveis que deverão ser utilizadas para formar os grupos e a variável Label foram selecionadas.

No menu Statistics, Fazer estas seleções :

No menu Plots. Fazer estas seleções :

No menu Method, Selecionar um dos métodos de agrupamento

Neste exemplo selecionar o vizinho mais próximo (Nearest Neighbor )

No menu Method, Selecionar uma das medidas

Neste exemplo selecionar a Distância Euclidiana

Após a seleção das opções clicar em ok

O PASW Statistics gera um output com todos os resultados.

Número de elementos da base de dados e a matriz com as distâncias Euclidianas.

O PASW Statistics mostra quais os elementos que foram agrupados e em que distância. No estágio 1, o elemento 1 foi agrupado ao elemento 2 na distância 2,236. No estágio 2, o elemento 3 foi agrupado ao elemento 4 na distância 5,657. No estágio 3, o grupo (1+2) foi agrupado ao elemento 5 na distância 9,220. No estágio 4, o grupo (1+2+5) foi agrupado ao grupo (3+4) na distância 10,00.

Dendrograma O PASW Statistics gera o dendograma. Neste dendograma o PASW Statistics não apresenta no eixo vertical as distâncias euclidianas originais. O PASW Statistics faz uma mudança de escala. Dendrograma

Exercício

1 – Considerando a matriz de distância quais os 2 Pokemons mais parecidos? ENTREGAR

2 – Faça o dendograma ENTREGAR

Banco de Dados: MCDONALDS.xls Exemplo 4 Banco de Dados: MCDONALDS.xls

Neste exemplo pretende-se agrupar os lanches do Mcdonalds de acordo com as variáveis apresentadas.

Método Hierárquico

As variáveis que deverão ser utilizadas no cluster foram selecionadas e a variável Label foi selecionada.

No menu Statistics, Fazer estas seleções :

No menu Plots, Fazer estas seleções :

Método Hierárquico Vizinho mais próximo (Nearest neighbor)

Selecionar: Cluster Method: Vizinho mais próximo (Nearest neighbor) Measure : Distância Euclidiana (Euclidian distance) Transform Values: Z scores (transforma cada variável e considera as variáveis padronizadas).

A variável padronizada é denominada Z. X: variável aleatória com média e desvio padrão S Z: variável aleatória padronizada com média 0 e variância 1.

Dendrograma

base de dados: MCdonalds1.xls Exercício 1 base de dados: MCdonalds1.xls

Considerando as variáveis padronizadas, o método da centróide e a matriz de distância Euclidiana , faça o dendograma. Obtenha 5 grupos com a base de dados: MCdonalds1.xls 1 – Quais os lanches estão em cada grupo. Responder com o número do lanche e não com o nome. Considerar a formação da esquerda para a direita: Grupo 1: Grupo 2: Grupo 3: Grupo 4: Grupo 5: ENTREGAR

Exercício 2 base de dados: POKEMON1.xls

Todas as variáveis devem estar como : ESCALA.

Considerando as variáveis padronizadas, o método do vizinho mais distante e a matriz de distância Euclidiana, faça o dendograma. Obtenha 4 grupos com a base de dados: POKEMON1.xls. Considerar a formação da esquerda para a direita. 1 – Quais elementos (Pokemon) estão em cada grupo ? ENTREGAR

ENTREGAR Abrir a base de dados no excel. Considerar as variáveis originais e não as variáveis padronizadas. 2 – Complete a tabela abaixo com a média da variável para cada grupo. Caracterize os grupos. ENTREGAR