Apresentação: Léia Michelle de Souza

Slides:



Advertisements
Apresentações semelhantes
Grafos eulerianos 1.
Advertisements

RECORTE DE FIGURAS Algoritmo proposto para Recorte de Segmentos (atribuído a Ivan Sutherland e Dan Cohen) Para o entendimento do algoritmo a ser proposto,
Estruturação de Linguagens (Pascal e C++)
Fluxo em Redes Prof. Ricardo R. Santos.
Sistemas especialistas
Algoritmos distribuídos para ambientes virtuais de larga escala
Funções de mais de uma variável - Limite e Continuidade
Exercícios PAA- Grafos
Solved Exercises 1. Finding the Peak. Let A= a1,…,an be a sequence of n numbers with the following property: there is p in {1,…,n} for which (i) the.
Análise de Resposta Transitória e de Regime Estacionário. 5. 4
Pontes Seja (G) o número de componentes conexas de G. Uma ponte é uma aresta a tal que (G - a) > (G)
Projeto conceitual Mostra ao cliente exatamente o que o sistema fará
Pesquisa em profundidade
1 Funções Trajectória de Projéctil DI/FCT/UNL 1º Semestre 2004/2005.
PERCEPTRON (CONTINUAÇÃO)
Prof. Júlio Cesar Nievola
Método Hierárquico Aglomerativo de Clusterização Algoritmo CURE
Método K-medóides Algoritmos PAM e CLARA
Análise de Clusters – Introdução Método K-means
Método de Clusterização baseado em Densidade Algoritmo DBSCAN
Otimização de Consultas em SQL Parte I - Planos de Execução e Equivalências de Expressões da Álgebra Relacional AULA 19 Profa. Sandra de Amo Programa.
Otimização de Consultas em SQL Planos de Execução e Equivalências de Expressões da Álgebra Relacional AULA 24 Profa. Sandra de Amo GBC053 – BCC
Avaliação de Clusteres
Meta - heurísticas Prof. Aurora
Monitores.
Algoritmos Distribuídos Professora: Lúcia Drummond
Medida do Tempo de Execução de um Programa
Medida do Tempo de Execução de um Programa
Busca Online Alexandra Barros Geber Ramalho. Busca Offine x Busca Online Busca Offline (ou planejamento clássico) –Computa a solução (do estado inicial.
Ronaldo Celso Messias Correia –
Pesquisa Operacional - Profa Úrsula L. F. Ribeiro
Máquina de Estados Uma máquina de estados finitos ou autômato finito é uma modelagem de um comportamento composto por estados, transições e ações Um estado.
List Ranking: Um Estudo Experimental
Árvore Geradora Mínima
INF 1771 – Inteligência Artificial
List Ranking. List Ranking (1) Seja L uma lista representada por um vetor s tal que s[i] é o nó sucessor de i na lista L, para u, o último elemento da.
Meta - heurísticas Prof. Aurora
Unidade 3 Controle de Concorrência
CLUSTERING: UMA REVISÃO AOS ALGORITMOS BÁSICOS
Aprendizagem de Máquina - Agrupamento
Caracterização de consumos
Caminhamento em Grafos: Busca em Largura e Busca em Profundidade
Exercícios PAA- Grafos
K-Means / Clustering.
Métodos de Agrupamentos baseados em Grafos
Conjuntos São agrupamentos formados a partir de uma característica comum. Aos componentes do conjunto, dá-se o nome de elementos.
Aula 03 – BCC202 Análise de Algoritmos (Parte 1) Túlio Toffolo www
E NHANCED S ELF -O RGANIZING I NCREMENTAL N EURAL N ETWORK FOR O NLINE U NSUPERVISED L EARNING Cesar Lima José Francisco Maíra Nascimento.
Avaliação de Clusteres Parte II
Estruturas de Dados e Ordenação
QuickSort Dividir: A[p…r] é particionado (reorganizado) em dois subvetores não vazios A[p…q] e A[q+1…r] tal que cada elemento de A[p…q] é menor ou igual.
Aula 8. Classificação Não Supervisonada por Regiões
Busca Combinatorial e Métodos de Heurística
Sistemas de Recomendação – Filtragem Colaborativa
Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.
Algoritmos de Agrupamento (Clustering): Métodos Hierárquicos e k-médias Marcílio C. P. de Souto DIMAp/UFRN.
Aprendizado não-supervisionado
Recuperação Inteligente de Informação
Validação de Agrupamentos
Introdução a VHDL Monitoria de Digitais.
Hugo Feitosa Yuri Lacerda.  Introdução  Projeto  Protótipo  Avaliação  Trabalhos Futuros  Conclusões.
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
Curso de Ventos Estelares Marcelo Borges Fernandes.
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
1 Reunião do Grupo de Estudos do Serviço de Informática do InCor Artigo-base: Nonparametric Snakes (Umut Ozertem e Deniz Erdogmus) 28 de março de 2008.
Text Clustering Anaury Norran Italo Lima Robertson Novelino Tomás Almeida.
Laboratório de Classificação Supervisionada Laboratório de Geoprocessamento do Departamento de Engenharia de Transportes da EPUSP setembro de 2011.
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 12 Aprendizado não Supervisionado Mapas auto-organizáveis Max Pereira.
Introdução a Análise de Redes Sociais Aula 07 Dalton Martins Laboratório de Políticas Públicas Participativas Gestão da Informação Universidade.
Exercícios de clustering
Transcrição da apresentação:

Apresentação: Léia Michelle de Souza A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise M. Ester, H-P. Kriegel, J. Sander, X. Xu Apresentação: Léia Michelle de Souza

Algoritmos Baseados em Densidade Esses algoritmos assumem que os clusters são regiões de alta densidade de padrões separadas por regiões com baixa densidade, no espaço de padrões. Um cluster é definido como um componente denso conectado em qualquer direção dada pela densidade.

Densidade – Características Principais Descoberta de grupos de forma arbitrária; Tratamento de Ruído; Apenas uma escaneada; É necessário parâmetros de densidade como condições. Separar regiões de objetos de alta e baixa densidade.

DBScan – Density Based Spatial Clustering of Applications with Noise É um algoritmo baseado em densidade para agrupar os objetos ou pontos.

1. Parâmetros Para se iniciar um algoritmo DBScan é necessário definir dois parâmetros principais: Raio - Distância entre um objeto (Ponto) e seus vizinhos. MinPts - Objetos(Pontos) Central.

2. Parâmetros Eps Valor que descreve a Medida de Proximidade, isto é, quantos pontos vizinhos próximos, um par de pontos necessita ter em comum para serem considerados próximos. Raio máximo da vizinhança MinPts Valor relativo a densidade mínima, ou seja, número de vizinhos próximos que um ponto precisa ter para ser considerado “Core Point”. Número de pontos mínimo em Eps desse ponto.

3. Parâmetros Neps(p) : {q  D | dist(p,q) < = Eps} Um ponto p é alcançável pela densidade de um ponto q Eps, MinPts se: 1) p  Neps(q) 2)Condição de Ponto Núcleo: |Neps(q)| >= MinPts

Exemplo 1 p : border point q : core point MinPts = 5 Eps = 1cm p q

1. Densidades Alcançável pela Densidade Um ponto p é alcançável pela densidade de um ponto q Eps, MinPts se existe uma cadeia de pontos p1,...,pn,p1 = q,pn = p tal que pi+1 é diretamente alcançável pela Densidade de pi. p p1 q

2. Densidades Conectado pela Densidade Um ponto p é conectado pela densidade a um ponto q Eps, MinPts se existir um ponto O para ambos, p e q são alcançáveis pela densidade de O. p q O

1. Regras para gerar Clusters Um ponto pertence a um cluster K somente se estiver localizado no raio de um ponto central do cluster; Um ponto central p, no raio de um outro ponto central pi qualquer, precisa pertencer ao mesmo cluster K; Um ponto não central p, no raio de um ponto central p1...pi, onde i>0 precisa pertencer ao mesmo cluster cujo objeto central esteja entre p1...pi; Um ponto não central p que não estiver no raio de nenhum objeto central é considerado ruído.

2. Regras para gerar Clusters Para a geração de Clusters é necessário que se teste o raio de cada ponto da base de dados. Se o raio de um objeto (ponto) p contém mais de um ponto central (MinPts), então criaremos um novo Clusters para o objeto p. Os objetos (pontos) no raio p são então adicionados ao novo Cluster. Pode-se ocorrer que um objeto central que já pertença a um Cluster, seja encontrado dentro de outro Cluster.

3. Regras para gerar Clusters Os dois Clusters serão agrupados em um só e o processo se encerra quando não existir novos pontos a serem adicionados a qualquer Cluster. C2 C1

Algoritmo do DBScan Escolha um Ponto arbitrariamente P Recupere todos os pontos alcançáveis pela densidade de p,Eps,MinPts Se p é um ponto core, forma-se um grupo Se p é um ponto fronteira, não há pontos alcançáveis pela densidade de p, visitar o próximo ponto Continue o processo até que todos os pontos tenham sido processados

Distância entre dois pontos Dist(S1,S2) = min{dist(p,q) | p  S1,q  S2} DBScan (SetOfPoints, Eps,MinPts) //SetOfPoints is UNCLASSIFIED ClusterId : = nextId(NOISE); FOR i FROM 1 TO SetOfPoints.size DO Point :=SetOfPoints.get(i); IF Point.ClId = UNCLASSIFIED THEN IF ExpandCluster(SetOfPoints,Point,ClusterId,Eps,MinPts) THEN ClusterId := nextId(ClusterId) END IF END FOR END;//DBScan

Clusters While seeds <> Empty DO END WHILE RETURN True; ExpandCluster(SetOfPoints,Point,ClId,Eps,Minpts):Boolean; seeds:=SetOfPoints,regionQuery(Point,Eps); IF seeds.size<MinPts THEN SetOfPint.changeClId(Point,NOISE); RETURN false; ELSE SetOfPoints.changeClIds(seeds,ClId); Seeds.delete(Point); While seeds <> Empty DO CurrentP:=seeds.firts(); Result:= SetOfPoints.regionQuery(currentP,Eps); IF result.size > = MinPts THEN FOR i FROM 1 TO result.size DO resultP:=result.get(i); IF resultP.ClId IN {UNCLASSIFIED,NOISE} THEN IF resultP.ClId = UNCLASSIFIED THEN seeds.append(resultP); END IF SetOfPoints.changeClId(result,ClId); END IF END FOR Seeds.delete(currentP); END WHILE RETURN True; END;

Parâmetros Valor de Eps Valor de MinPt Resultado Alto Poucos clusters grandes e densos Baixo Muitos clusters pequenos e menos densos Clusters grandes e menos densos Clusters pequenos e densos

Avaliação de desempenho Agrupamentos descobertos por CLARANS

Avaliação de desempenho Agrupamentos descobertos por DBSCAN

Run Time em segundos

Algoritmo DBScan Vantagem Desvantagem Eficiente em tratar grandes bases de dados Menos sensível a ruídos Forma clusters de formato arbitrário Usuário não precisa especificar a quantidade de clusters Desvantagem Sensível aos parâmetros de entrada(Eps e MinPt)

Problemas do DBScan Agrupamentos diferentes podem ter mesmo densidades diferentes. Agrupamentos podem estar em hierarquias.

Referências Bibliográficas