A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

TRACTS T RA JECTORY C LASSIFICATION USING T IME S ERIES Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares.

Apresentações semelhantes


Apresentação em tema: "TRACTS T RA JECTORY C LASSIFICATION USING T IME S ERIES Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares."— Transcrição da apresentação:

1 TRACTS T RA JECTORY C LASSIFICATION USING T IME S ERIES Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares

2 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; O Método TRACTS; Experimentos Realizados; Conclusão. 2/54

3 I NTRODUÇÃO – M OTIVAÇÃO Grande disponibilidade de dados de trajetórias: GPS; Celulares (triangulação e GPS); RFID; Análise dos padrões comportamentais dos objetos móveis a partir de suas trajetórias. 3/54

4 I NTRODUÇÃO – M OTIVAÇÃO Diversos trabalhos tem sido propostos para realizar análise de dados espaço-temporais; Poucos tem utilizado o conceito de classificação. 4/54

5 I NTRODUÇÃO – O BJETIVO DO T RABALHO 5/54

6 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 6/54

7 C ONCEITOS – T RAJETÓRIA 7/54

8 C ONCEITOS - C LASSIFICAÇÃO Produzir um modelo de classificação; Classificar novos registros. 8/54

9 C ONCEITOS - C LASSIFICAÇÃO Avaliação do modelo usando a Matriz de Confusão, gerando métricas: Acurácia; Erro; Taxa de VP; Taxa de VN 9/54

10 C ONCEITOS – S ÉRIES T EMPORAIS Séries temporais consistem de sequência de valores ou eventos obtidos sobre repetidas medidas de tempo; Muitas aplicações envolvendo séries temporais tem sido utilizadas. 10/54

11 C ONCEITOS – S ÉRIES T EMPORAIS – T RANSFORMAÇÕES Discrete Fourier transform (DFT) (Faloutsos et. al., 1994 ); Piecewise linear e Piecewise constant models (PAA) (Chakrabarti et. al, 2002); Haar Wavelet (Haar, 1910). Adaptative piecewise constant approximation (APCA) (Geurts, 2001); 11/54

12 C ONCEITOS – SAX Realiza o tratamento de séries temporais: Facilita a mineração de dados através do uso de árvores de sufixo, hashing, modelos de markov, etc; Permite o uso de algoritmos de processamento de texto e de bioinformática. 12/54

13 C ONCEITOS – SAX Primeiro é realizada a conversão da série temporal para uma representação PAA; Após, é realizada a conversão da representação PAA para símbolos; Manter a equiprobabilidade. 13/54

14 C ONCEITOS – SAX – M ÚLTIPLAS S ÉRIES T EMPORAIS 14/54

15 C ONCEITOS – B ITMAPS DE S ÉRIES T EMPORAL 15/54

16 C ONCEITOS – B ITMAPS DE S ÉRIES T EMPORAL 16/54

17 C ONCEITOS – B ITMAPS DE S ÉRIES T EMPORAL Mapa de bits gerado para as strings c 1 : baccbdca e c 2 : dcddaabb. 17/54

18 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 18/54

19 T RABALHOS R ELACIONADOS Trabalhos focados para um domínio específico: (Panagiotakis et. al., 2009): baseado na similaridade; Depende fortemente da relação espacial entre as trajetórias; (Lee & Hoff, 2007): descobrir a atividade esportiva; Além de uma grande necessidade de parametrização, necessita de diversas trajetórias semelhantes para caracterizar uma atividade esportiva; (Zheng et. al., 2008): descobrir o meio de transporte; Apesar do bom processo de classificação, parte da acurácia é dependente da semântica de transição específica entre meios de transporte, prejudicando a sua generalização; (García et. al., 2006): identificação do modo de voo; O trabalho realiza com muita competência a classificação do modo de voo a partir das trajetórias de aviões, mas os filtros de Kalmam utilizados acabam sendo muito especializados nessa tarefa, prejudicando também a generalização do método. 19/54

20 T RABALHOS R ELACIONADOS Um método geral foi proposto por (Lee, Han, Gonzalez & Li, 2008), que introduziu o método TraClass; O processo é dividido em duas etapas: Clusterização; Classificação: Trajectory Based (TB): Fornece rótulos de classe para trajetória com base na etapa anterior; Region Based (RB): Descobre as regiões com maior número de trajetórias de uma única classe, permitindo estabelecer uma região para aquela classe. 20/54

21 T RABALHOS R ELACIONADOS ClusterizaçãoClassificação 21/54

22 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 22/54

23 O M ÉTODO TRACTS 23/54

24 O M ÉTODO TRACTS 24/54

25 O M ÉTODO TRACTS – P REPARAÇÃO 25/54

26 O M ÉTODO TRACTS – C ARACTERIZAÇÃO Realiza a extração dos valores das características da trajetória; Fornece a semântica necessária para análise no processo de classificação; Quais devem ser as características extraídas de cada uma das trajetórias do conjunto de dados? 26/54

27 O M ÉTODO TRACTS – C ARACTERIZAÇÃO Trajetórias de objetos móveis sempre terão algumas características espaço-temporais, tais como velocidade, aceleração e direção. 27/54

28 O M ÉTODO TRACTS – C ARACTERIZAÇÃO Características globais: Comprimento; Duração; Deslocamento; Características locais: Velocidade entre dois pontos consecutivos; Aceleração entre duas velocidades consecutivas; Direção entre dois pontos consecutivos; Variação da direção entre duas direções consecutivas; 28/54

29 O M ÉTODO TRACTS – C ARACTERIZAÇÃO Para cada uma das características locais, para cada trajetória, é realizada a transformação dos valores das características para séries temporais. 29/54

30 O M ÉTODO TRACTS – T RANSFORMAÇÃO Primeiramente, as séries temporais são transformadas pelo método SAX: Todas as séries temporais são normalizadas para cada característica; Cada série temporal é transformada em uma sequência de caracteres. 30/54

31 O M ÉTODO TRACTS – T RANSFORMAÇÃO As sequências de caracteres são transformadas em mapas de bits através do método TSB; 31/54

32 O M ÉTODO TRACTS – T RANSFORMAÇÃO Velocidade_aa: 15,38 Velocidade_ab: 34,62 Velocidade_ba: 30,77 Velocidade_bb: 19,23 32/54

33 O M ÉTODO TRACTS - T RANSFORMAÇÃO Velocidade_a Velocidade_b Velocidade_c Aceleração_a Aceleração_b Aceleração_c Direção_a Direção_b Direção_c... Comprimento Deslocamento Duração... Classe 33/54

34 O M ÉTODO TRACTS – C LASSIFICAÇÃO Utiliza os atributos como entrada nos algoritmos de classificação tradicionais; O modelo de classificação é gerado e avaliado; Podem ser gerados tantos modelos quanto forem necessários, através da execução de diversos algoritmos, até que seja gerado um modelo de classificação com a acurácia esperada. 34/54

35 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 35/54

36 E XPERIMENTOS R EALIZADOS A validação do método TRACTS foi realizada com os mesmos dados do método proposto pelo grupo de Jiawei Han (Lee et. al., 2008); Foram utilizadas três bases de dados de trajetórias: Conjunto de trajetórias de três tipos de animais distintos, rastreados por RFID; Trajetórias de navegação de dois barcos; Trajetórias de furacões. 36/54

37 E XPERIMENTOS R EALIZADOS A classe do conjunto de dados de animais era cada um dos tipos de animais: Alce; Gado; Veado; Nos dados dos barcos a classe foi o nome dos mesmos: Point Sur; Point Lobos; Para os furacões, a classe foi a força máxima atingida por cada um dos furacões: F1; F2; F3; F4; F5. 37/54

38 E XPERIMENTOS R EALIZADOS 38/54

39 E XPERIMENTOS R EALIZADOS – A RQUIVO W EKA 39/54

40 E XPERIMENTOS R EALIZADOS – R ESULTADO W EKA 40/54

41 E XPERIMENTOS R EALIZADOS – R ESULTADOS Domínio# Trajetórias# Pontos# Séries Temporais Tempo Geração Animais ,06s Barcos ,92s Furacões ,89s 41/54

42 E XPERIMENTOS R EALIZADOS – R ESULTADOS (A NIMAIS ) Configuraç ão do método Total de atributos utilizados Acurácia de classificaçã o Algoritmo utilizadoTempo geração do modelo de classificação TRACTS ,07% Kstar0,01 TRACTS ,47% Adaboost+BayesNet0,6 TRACTS ,26% Bagging+SMO3,6 TRACTS ,65% SMO0,31 TRACTS ,26% SMO0,42 TRACTS ,26% SMO0,69 TRACTS ,23% SMO0,17 TRACTS ,26% Bagging+RandomForest2,8 TRACTS ,05% Bagging+SMO5,5 TRACTS ,65% Bagging+SMO16,5 TRACTS ,89% SMO0,89 TRACTS ,47% Adaboost+J481,6 TRACTS ,65% Adaboost+NaiveBayes1,6 TRACTS ,05% SMO0,34 TRACTS ,26% SMO0,66 TRACTS ,86% Bagging+SMO2,8 TRACTS ,44% Bagging+SMO5,5 TRACTS ,65% SMO0,47 TRACTS ,07% SMO2,01 Média -95,24% -2,45 42/54 Tam. alfabetoprofundidade

43 E XPERIMENTOS R EALIZADOS – M ELHORES R ESULTADOS DO M ÉTODO TRACTS DomínioConfig. TRACTS # Atributos Acurácia Classif. AlgoritmoTempo AnimaisTRACTS ,23%SMO0,17s BarcosTRACTS %NaiveBayes0,01s FuracõesTRACTS ,24%AODEsr0,44s 43/54

44 E XPERIMENTOS R EALIZADOS –R ESULTADO C OMPARATIVO MétodoAcurácia AnimaisBarcosFuracõesMédia TRACTS 97,23%100,00%71,24% 89,49% TraClass RB-TB 83,30%98,20%73,10% 84,87% TraClass TB-Only 50,00%84,40%65,40% 66,60% 44/54

45 E XPERIMENTOS R EALIZADOS Os motivos principais para a dificuldade de classificação das trajetórias de furacões foram: A classe de toda a trajetória era definida pelo comportamento de parte dela; O domínio de dados era formado por objetos móveis da natureza, ou seja, com comportamento caótico. Nos domínios onde existia um comportamento racional do objeto móvel, a acurácia de classificação das trajetórias foi claramente superior; 45/54

46 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 46/54

47 C ONCLUSÃO O método TRACTS demonstrou-se eficaz na tarefa de criar um modelo de classificação com boa acurácia; De forma geral o método foi superior a um outro método proposto para o mesmo fim, sem comprometimento da propriedade de independência de domínio considerado. 47/54

48 C ONCLUSÃO – C ONTRIBUIÇÕES Primeiro método de classificação de trajetórias que transforma trajetórias em séries temporais; Utilização de algoritmos tradicionais de classificação para realizar a construção de modelos de classificação de trajetórias; Manter uma boa independência quanto ao domínio considerado no conjunto de dados, possibilitando uma análise pura das características da trajetória. 48/54

49 C ONCLUSÃO – P UBLICAÇÕES Esse trabalho resultou no seguinte artigo publicado: Santos, I.P., & Alvares, L.O. (2011). TRACTS: Um método para a classificação de trajetórias de objetos móveis usando séries temporais. 8º Encontro Nacional de Inteligencia Artificial (ENIA) – CSBC, Proceedings (pp ). Natal, Brasil: Springer. 49/54

50 C ONCLUSÃO – T RABALHOS F UTUROS Estudo em outros domínios de aplicação, utilizando outras características geométricas da trajetória (locais e globais); Busca de novos métodos de tratamento de strings, além do TSB, que também possibilitem a detecção de padrões interessantes a partir da string gerada pelo método SAX; Submissão de artigo para uma revista internacional. 50/54

51 C ONCLUSÃO – R EFERÊNCIAS Chakrabarti, K., Keogh, E., Mehrotra, S., & Pazzani, M. (2002, Junho). Locally adaptive dimensionality reduction for indexing large time series databases. ACM Transactions on Database Systems, pp. 151–162. Faloutsos, C., Ranganathan, M., & Manolopoulos, Y. (1994 ). Fast subsequence matching in time-series databases. SIGMOD international conference on Management of data, Proceedings (pp. 419–429). New York, NY, EUA: ACM. Geurts, P. (2001). Pattern Extraction for Time Series Classification. European Conference on Principles of Data Mining and Knowledge Discovery PKDD, Proceedings (pp. 115–127). London, UK: Springer. Kamber, M., & Han, J. (2006). Data Mining: Concepts and Techniques. San Francisco, CA, EUA: Morgan Kaufmann. Kumar, N., Lolla, V. N., Keogh, E., Lonardi, S., Ratanamahatana, C. A., & Wei, L. (2005). Time-series Bitmaps: A Practical Visualization Tool for working with Large Time Series Databases. 5th SIAM International Conference on Data Mining - SDM'05, Proceedings (pp ). Newport Beach, CA, EUA: SIAM. Lee, J.-G., Han, J., Gonzalez, H., & Li, X. (2008). TraClass: trajectory classification using hierarchical region-based and trajectory-based clustering. VLDB Endowment (pp ). Auckland, Nova Zelândia: VLDB Endowment. Lonardi, S. (2001). Global detectors of unusual words: design implementation and applications to pattern discovery in biosequences. Department of Computer Sciences, Purdue University. 51/54

52 E STRUTURA DE A PRESENTAÇÃO Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. 52/54

53 TRACTS T RA JECTORY C LASSIFICATION USING T IME S ERIES Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares P ERGUNTAS ?

54 E XPERIMENTOS R EALIZADOS – R ESULTADOS DomínioTamanho Alfabeto SAXTempo Geração Animais35260,02s Animais75327,01s Barcos3218,21s Barcos7208,62s Furacões3395,12s Furacões7433,95s 54/54

55 E XPERIMENTOS R EALIZADOS – R ESULTADOS DomínioAlfabeto SAXProfundidadeTempo Geração Animais3188,06s Animais741180,94s Barcos3119,58s Barcos741097s Furacões314,12s Furacões741132,96s 55/54


Carregar ppt "TRACTS T RA JECTORY C LASSIFICATION USING T IME S ERIES Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares."

Apresentações semelhantes


Anúncios Google