A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

TRACTS Trajectory Classification using Time Series

Apresentações semelhantes


Apresentação em tema: "TRACTS Trajectory Classification using Time Series"— Transcrição da apresentação:

1 TRACTS Trajectory Classification using Time Series
Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares

2 Estrutura de Apresentação
Introdução; Conceitos Utilizados; O Método TRACTS; Experimentos Realizados; Conclusão.

3 Introdução – Motivação
Grande disponibilidade de dados de trajetórias: GPS; Celulares (triangulação e GPS); RFID; Análise dos padrões comportamentais dos objetos móveis a partir de suas trajetórias. Nos anos recentes está havendo uma disponibilidade cada vez maior de dados espaço-temporais a partir de dispositivos de localização, tais como GPS, Celulares e RFID. Esses dados espaço-temporais podem ser convertidos em trajetórias. Essas trajetórias podem revelar padrões comportamentais muito interessantes dos objetos móveis que as produziram.

4 Introdução – Motivação
Diversos trabalhos tem sido propostos para realizar análise de dados espaço-temporais; Poucos tem utilizado o conceito de classificação. Ultimamente muitos trabalhos de análise de trajetória tem sido publicados, possibilitando a busca de Pontos de Interesse (POIs), sequência de locais visitados, predição de destinos e inferências de meio de transporte. Entretanto, poucos trabalhos utilizam o conceito de classificação de trajetória para realizar a análise dos dados espaço-temporais.

5 Introdução – Objetivo do Trabalho
A partir de um conjunto de trajetórias o método deve ser capaz de processá-las e produzir um modelo de classificação que tenha um alto grau de acurácia na classificação de trajetórias previamente não rotuladas.

6 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. Para que seja possível embasar melhor o método proposto, serão citados alguns dos conceitos utilizados nesse trabalho

7 Conceitos – Trajetória
Uma trajetória é uma sequência de pontos. Cada um desses pontos é representado pela tupla (id,x,y,z,t), representando, respectivamente, o identificador da trajetória, o espaço tridimensional ocupado pela trajetória e o tempo no qual o ponto foi registrado. Frequentemente as trajetórias são representadas em um espaço bi-dimensional, possuindo dessa forma somente as componentes X e Y.

8 Conceitos - Classificação
Produzir um modelo de classificação; Classificar novos registros. O trabalho atual utiliza como conceito básico o conceito de classificação da mineração de dados. Ele consiste em produzir um modelo de dados a partir de um conjunto inicial de dados e atributos, para que posteriormente seja possível classificar atributos ainda não rotulados.

9 Conceitos - Classificação
Avaliação do modelo usando a Matriz de Confusão, gerando métricas: Acurácia; Erro; Taxa de VP; Taxa de VN Para que o modelo de classificação gerado possa ser avaliado, existem métricas que podem avaliar a eficácia na classificação de exemplos ainda não rotulados. Para isso, usa-se a Matriz de Confusão, que permite extrair diversos indicadores, tais como Acurácia, Erro, Taxa de VP e Taxa de VN.

10 Conceitos – Séries Temporais
Séries temporais consistem de sequência de valores ou eventos obtidos sobre repetidas medidas de tempo; Muitas aplicações envolvendo séries temporais tem sido utilizadas. Séries temporais pode ser dito como uma sequência de valores obtido em intervalos de tempo, geralmente em intervalos regulares de tempo, como a cada segundo, cada hora, cada semana, etc.

11 Conceitos – Séries Temporais – Transformações
Discrete Fourier transform (DFT) (Faloutsos et. al., 1994 ); Piecewise linear e Piecewise constant models (PAA) (Chakrabarti et. al, 2002); Haar Wavelet (Haar, 1910). Adaptative piecewise constant approximation (APCA) (Geurts, 2001); Alguns dos métodos que possibilitam a redução de dimensionalidade das séries temporais. Entretanto, para longas séries temporais, algumas dessas técnicas ainda podem ser computacionalmente ineficientes, devido a grande quantidade de dados representados. Dessa forma, técnicas mais avançadas de redução dimensional podem ser necessárias.

12 Conceitos – SAX Realiza o tratamento de séries temporais:
Facilita a mineração de dados através do uso de árvores de sufixo, hashing, modelos de markov, etc; Permite o uso de algoritmos de processamento de texto e de bioinformática. Entre os métodos que permitem realizar o tratamento de séries temporais, podemos destacar o SAX. Além de proporcionar um eficiente método para reduzir a dimensionalidade das séries temporais, o método discretiza essas séries temporais em uma sequência de caracteres, facilitando o processo de mineração de dados e possibilitando o aproveitamento de algoritmos existentes nas áreas de processamento de texto e bioinformática.

13 Conceitos – SAX Primeiro é realizada a conversão da série temporal para uma representação PAA; Após, é realizada a conversão da representação PAA para símbolos; Manter a equiprobabilidade. Primeiro a série temporal é representada através de uma aproximação de Piecewise (PAA) o qual é transformado em uma sequência de caracteres. É possível observar nessa imagem que a série temporal teve a sua dimensão reduzida de 128 para apenas 8.

14 Conceitos – SAX – Múltiplas Séries Temporais
Entretanto, se forem observadas todas as séries temporais consideradas no conjunto transformado, a equiprobabilidade dos elementos é obtida.

15 Conceitos – Bitmaps de Séries Temporal
Ou Time Series Bitmap (TSB), proposto por (Kumar et. al., 2005) e permite o tratamento de strings; Transformar sequências de caracteres em mapas de bits. O tamanho da matriz de bits gerada é definido a partir de dois parâmetros: Dimensão (𝜕); Resolução ou Profundidade (𝜌); Um dos métodos que possibilitam o tratamento de sequencia de caracteres é o método chamado Time Series Bitmap, ou Bitmaps de Séries Temporais.

16 Conceitos – Bitmaps de Séries Temporal
Três mapas de bits com dimensão 𝜕=4 e três profundidades distintas. Considerando uma string formada por 4 tipos de letras: a, b, c e d, é possível formar uma matriz de bits com dimensão obrigatória de 4 e com uma profundidade que pode variar conforme necessidade de profundidade de análise. Como falado anteriormente, o tamanho da matriz de bitmap cresce exponencialmente com a sua profundidade.

17 Conceitos – Bitmaps de Séries Temporal
Mapa de bits gerado para as strings c1: baccbdca e c2: dcddaabb. Considerando o exemplo das duas strings geradas anteriormente, é possível formar as seguintes matrizes de bitmap, com três profundidades distintas, como exemplo.

18 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. Alguns trabalhos relacionados que serviram como referência para o método desenvolvido

19 Trabalhos Relacionados
Trabalhos focados para um domínio específico: (Panagiotakis et. al., 2009): baseado na similaridade; Depende fortemente da relação espacial entre as trajetórias; (Lee & Hoff, 2007): descobrir a atividade esportiva; Além de uma grande necessidade de parametrização, necessita de diversas trajetórias semelhantes para caracterizar uma atividade esportiva; (Zheng et. al., 2008): descobrir o meio de transporte; Apesar do bom processo de classificação, parte da acurácia é dependente da semântica de transição específica entre meios de transporte, prejudicando a sua generalização; (García et. al., 2006): identificação do modo de voo; O trabalho realiza com muita competência a classificação do modo de voo a partir das trajetórias de aviões, mas os filtros de Kalmam utilizados acabam sendo muito especializados nessa tarefa, prejudicando também a generalização do método. No levantamento bibliográfico realizado durante o trabalho, encontramos diversos trabalhos relacionados a classificação de trajetórias, mas a grande maioria deles se focava em solucionar problemas para um domínio específico. Entre esses trabalhos, podemos citar <ler trabalhos e as observações de cada um>. É importante ressaltar que todos os trabalhos foram muito competentes em realizar o processo de classificação nos domínios para os quais foram concebidos, mas provavelmente teriam uma certa dificuldade se outros domínios de dados fossem impostos a eles.

20 Trabalhos Relacionados
Um método geral foi proposto por (Lee, Han, Gonzalez & Li, 2008), que introduziu o método TraClass; O processo é dividido em duas etapas: Clusterização; Classificação: Trajectory Based (TB): Fornece rótulos de classe para trajetória com base na etapa anterior; Region Based (RB): Descobre as regiões com maior número de trajetórias de uma única classe, permitindo estabelecer uma região para aquela classe. Um dos trabalhos que pesquisamos que realiza uma classificação de trajetórias independente do domínio considerado é o método TraClass. O método se divide em duas etapas principais <ler o slide>

21 Trabalhos Relacionados
Clusterização Classificação Nessas duas figuras, é possível visualizar o processo de construção das duas etapas do método TraClass. Na clusterização é feita a partição e agrupamento das trajetórias e na classificação (nesse caso de furacões) é detectada a região com trajetórias de mesma classe (as quais foram rotuladas com base na etapa anterior)

22 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. Agora, o método TRACTS será apresentado.

23 O Método TRACTS Objetivo: construir um método capaz de realizar classificação de trajetórias utilizando algoritmos tradicionais de classificação; Problema: como utilizar algoritmos tradicionais de classificação com dados espaço-temporais? Formato (𝑖𝑑, 𝑥, 𝑦, 𝑧, 𝑡); Quais atributos? Quais classes? Como falado anteriormente, uma das formas de realizar a descoberta de conhecimento a partir de trajetórias de objetos móveis é a classificação de trajetórias. Entretanto, diferentemente dos dados tradicionais de classificação, as trajetórias estão no formato (id,x,y,z,t), que dificulta a utilização direta por algoritmos de classificação tradicional. Dessa forma, existe a questão de como aproveitar a vasta quantidade de algoritmos tradicionais de classificação para as trajetórias? Como é possível classificar dados no formato (id,x,y,z,t), que atributos e classes serão utilizadas?

24 O Método TRACTS Cada uma das quatro grande etapas do método TRACTS tem sub-etapas que se assemelham muito ao processo KDD, permitindo inclusive a volta para etapas anteriores, caso necessário.

25 O Método TRACTS – Preparação
Formata os dados geográficos dos dispositivos de rastreamento para um formato padrão (𝑖𝑑, 𝑥, 𝑦, 𝑧, 𝑡); Reconstrói as trajetórias de acordo com a necessidade (ex.: segmenta as trajetórias); Elimina os ruídos das trajetórias. Na etapa de preparação os dados são modificas para ficarem no formato desejado de trabalho nas etapas seguintes do método. Os dados brutos dos dispositivos móveis são processados para ficarem no formato padrão (id,x,y,z,t), bem como na projeção desejada (UTM, Coordenadas Geográficas) Conforme necessidade, as trajetórias são reconstruídas através de técnicas de segmentação (como quando existe somente uma única grande trajetória e deseja-se segmentá-la em diversas menores) E também existe a eliminação de dados ruidosos da trajetória, de forma a não interferirem no seu processo de análise de forma incorreta.

26 O Método TRACTS – Caracterização
Realiza a extração dos valores das características da trajetória; Fornece a semântica necessária para análise no processo de classificação; Quais devem ser as características extraídas de cada uma das trajetórias do conjunto de dados? A etapa de caracterização é a etapa fundamental do método, pois extrai os valores das caraterísticas de cada uma das trajetórias, proporcionando a semântica necessária para o processo de classificação. Mas quais características devem ser extraídas?

27 O Método TRACTS – Caracterização
Trajetórias de objetos móveis sempre terão algumas características espaço-temporais, tais como velocidade, aceleração e direção. Como estamos trabalhando com trajetórias de objetos em movimento, certas características serão sempre universais para todas as trajetórias, tais como velocidade entre dois pontos, aceleração entre três pontos e direção vetorial absoluta entre dois pontos, assim como a variação de cada uma dessas características em determinado intervalo. Além disso, essas características podem revelar comportamentos distintos de objetos móveis em suas trajetórias, o que é fundamental para o processo de classificação.

28 O Método TRACTS – Caracterização
Características globais: Comprimento; Duração; Deslocamento; Características locais: Velocidade entre dois pontos consecutivos; Aceleração entre duas velocidades consecutivas; Direção entre dois pontos consecutivos; Variação da direção entre duas direções consecutivas; Para implementação do método, sete características foram utilizadas. Três globais (comprimento, duração e deslocamento) e quatro locais (Velocidade entre dois pontos consecutivos, aceleração entre duas velocidades consecutivas, direção entre dois pontos consecutivos, variação da direção entre duas direções consecutivas)

29 O Método TRACTS – Caracterização
Para cada uma das características locais, para cada trajetória, é realizada a transformação dos valores das características para séries temporais. As características globais já estariam prontos para utilização em um eventual processo de classificação, entretanto as características locais não podem ser utilizadas diretamente, necessitando de um processo mais elaborado de transformação. Dessa forma, cada uma das trajetórias, para cada uma de suas características, são transformadas em séries temporais.

30 O Método TRACTS – Transformação
Primeiramente, as séries temporais são transformadas pelo método SAX: Todas as séries temporais são normalizadas para cada característica; Cada série temporal é transformada em uma sequência de caracteres. A etapa de transformação é utilizada somente para as séries temporais das características globais das trajetórias. Nessa etapa, as características de cada trajetória (que agora são séries temporais) são transformadas em atributos para o processo de classificação. O método SAX é utilizado em cada série temporal. As séries temporais que representam as mesmas características são normalizadas, de forma a estabelecer uma equiprobabilidade entre as múltiplas séries temporais, conforme explicado anteriormente. Com isso, cada série temporal é transformada em uma sequência de caracteres.

31 O Método TRACTS – Transformação
As sequências de caracteres são transformadas em mapas de bits através do método TSB; Cada uma das sequências de caracteres são transformadas matrizes TSB. As células são os atributos. Os valores de cada uma dessas células são normalizados com valores percentuais, permitindo a correlação com as demais matrizes do conjunto de dados.

32 O Método TRACTS – Transformação
Velocidade_aa: 15,38 Velocidade_ab: 34,62 Velocidade_ba: 30,77 Velocidade_bb: 19,23 A partir de uma string SAX de uma determinada série temporal representando a característica velocidade de uma trajetória, é possível visualizar como a matriz TSB é formada, os valores normalizados e os respectivos atributos gerados.

33 O Método TRACTS - Transformação
Velocidade_a Velocidade_b Velocidade_c Aceleração_a Aceleração_b Aceleração_c Direção_a Direção_b Direção_c ... Comprimento Deslocamento Duração Classe

34 O Método TRACTS – Classificação
Utiliza os atributos como entrada nos algoritmos de classificação tradicionais; O modelo de classificação é gerado e avaliado; Podem ser gerados tantos modelos quanto forem necessários, através da execução de diversos algoritmos, até que seja gerado um modelo de classificação com a acurácia esperada. A última etapa do método consiste em estruturar os atributos e seus respectivos valores de forma que possam ser utilizados no processo de classificação. Diversos modelos, a partir de cada algoritmo de classificação, pode ser gerado, até que um modelo com acurácia satisfatória seja gerado.

35 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. Agora serão mostrados os experimentos realizados com base no método TRACTS.

36 Experimentos Realizados
A validação do método TRACTS foi realizada com os mesmos dados do método proposto pelo grupo de Jiawei Han (Lee et. al., 2008); Foram utilizadas três bases de dados de trajetórias: Conjunto de trajetórias de três tipos de animais distintos, rastreados por RFID; Trajetórias de navegação de dois barcos; Trajetórias de furacões. O método TRACTS foi validado com os mesmos dados utilizados no trabalho de Jiawei Han, que criou o método TraClass, o qual foi também utilizado como base comparativa dos resultados obtidos. Três domínios de dados foram utilizados: de animais, barcos e furacões.

37 Experimentos Realizados
A classe do conjunto de dados de animais era cada um dos tipos de animais: Alce; Gado; Veado; Nos dados dos barcos a classe foi o nome dos mesmos: Point Sur; Point Lobos; Para os furacões, a classe foi a força máxima atingida por cada um dos furacões: F1; F2; F3; F4; F5. Os dados dos animais possuíam trajetórias de três animais distintos: Alce, Gado e Veado. Nos dos barcos, duas grandes trajetórias contínuas foram analisadas de dois barcos: PointSur e PointLobos Já nos furacões, cada um deles era definido pela força máxima que ele alcançava, independentemente de quanto tempo essa força permaneceu na trajetória.

38 Experimentos Realizados
Para cada um dos conjunto de dados, as trajetórias, no formato (𝑖𝑑, 𝑥, 𝑦, 𝑧, 𝑡) foram tratadas para eliminação de ruído e sofreram processo de segmentação, conforme necessário; Foram extraídas as características de cada uma das trajetórias (locais e globais); As características locais foram transformadas em séries temporais, as quais sofreram um processo de transformação pelo processo SAX e TSB; Foram montados os arquivos de entrada para a ferramenta Weka e houve o processo de classificação. Para todos os domínios, seguiu-se cada uma das etapas do método TRACTS: a etapa de preparação, a de caracterização, de transformação e de classificação, onde foi utilizada a ferramenta Weka para análise dos dados de entrada em forma de arquivo.

39 Experimentos Realizados – Arquivo Weka
Um exemplo de arquivo gerado pelo Weka para os dados de animais, utilizando quatro características locais, três globais, com um alfabeto SAX de 3 letras e profundidade 1 pode ser visualizado nessa figura. Como é possível observar, são gerados os dados percentuais de cada uma das células da matriz TSB para as características locais e os valores das características globais são colocados diretamente no arquivo.

40 Experimentos Realizados – Resultado Weka
Cada arquivo gerado pelo método era informado como entrada para a ferramenta Weka, que por sua vez criava um modelo de classificação e já realizava um teste para validar a acurácia do modelo gerado.

41 Experimentos Realizados – Resultados
Domínio # Trajetórias # Pontos # Séries Temporais Tempo Geração Animais 253 287134 1012 634,06s Barcos 404 56622 1616 61,92s Furacões 1367 39777 5468 161,89s Algumas estatísticas de execução do modelo para cada domínio: Aqui é possível observar os dados estatísticos de cada um dos domínios de dados e as séries temporais geradas para cada um deles (para as características locais). Como é possível observar, o tempo de geração das séries temporais é proporcional principalmente ao número de pontos, mas também possui um overhead em relação ao número de trajetórias.

42 Experimentos Realizados – Resultados (Animais)
Configuraç ão do método Total de atributos utilizados Acurácia de classificaçã o Algoritmo utilizado Tempo geração do modelo de classificação TRACTS.3.1 16 94,07% Kstar 0,01 TRACTS.3.2 40 94,47% Adaboost+BayesNet 0,6 TRACTS.3.3 112 95,26% Bagging+SMO 3,6 TRACTS.3.4 328 95,65% SMO 0,31 TRACTS.3.5 976 0,42 TRACTS.3.6 2920 0,69 TRACTS.4.1 20 97,23% 0,17 TRACTS.4.2 68 Bagging+RandomForest 2,8 TRACTS.4.3 260 96,05% 5,5 TRACTS.4.4 1028 16,5 TRACTS.4.5 4100 92,89% 0,89 TRACTS.5.1 24 Adaboost+J48 1,6 TRACTS.5.2 104 Adaboost+NaiveBayes TRACTS.5.3 504 0,34 TRACTS.5.4 2504 0,66 TRACTS.7.1 32 94,86% TRACTS.7.2 200 96,44% TRACTS.7.3 1376 0,47 TRACTS.7.4 9608 2,01 Média - 95,24% 2,45 Aqui é apresentada a tarefa de classificação do método TRACTS , em diversos parâmetros diferentes de tamanho de alfabeto e profundidade, para o domínio dos animais. No domínio dos furacões, foi realizado o mesmo procedimento. Tam. alfabeto profundidade

43 Experimentos Realizados – Melhores Resultados do Método TRACTS
Domínio Config. TRACTS # Atributos Acurácia Classif. Algoritmo Tempo Animais TRACTS.4.1 20 97,23% SMO 0,17s Barcos TRACTS.3.2 39 100% NaiveBayes 0,01s Furacões TRACTS.4.3 260 71,24% AODEsr 0,44s Aqui é possível observar o melhor resultado de acurácia de classificação obtido por um modelo de classificação gerado a partir do método TRACTS para cada um dos três domínios de dados considerados. Uma observação importante é que o melhor resultado de cada um dos métodos não necessariamente utilizou uma quantidade grande de atributos, ou seja, a necessidade de uma grande profundidade de atributos não é essencial para todos os domínios de dados. Apenas no domínio dos furacões foi observado um número maior de atributos, que nesse domínio sim acabou sendo um indicador de maiores níveis de acurácia.

44 Experimentos Realizados –Resultado Comparativo
Método Acurácia Animais Barcos Furacões Média TRACTS 97,23% 100,00% 71,24% 89,49% TraClass RB-TB 83,30% 98,20% 73,10% 84,87% TraClass TB-Only 50,00% 84,40% 65,40% 66,60% Realizando a comparação do método TRACTS com os resultados obtidos no método TraClass, quando fazemos a comparação da metodologia análoga ao TRACTS (TB-Only) é possível observar uma grande superaçào em todos os domínios considerados. Quando comparado com a abordagem do TraClass que utiliza também regiões (e não somente as características geométricas da trajetória) o método TRACTS foi superior no domínio dos Animais e dos Barcos, sendo um pouco inferior no domínio dos furacões. Entretanto, a média geral do TRACTS foi superior a ambas abordagens do método TraClass.

45 Experimentos Realizados
Os motivos principais para a dificuldade de classificação das trajetórias de furacões foram: A classe de toda a trajetória era definida pelo comportamento de parte dela; O domínio de dados era formado por objetos móveis da natureza, ou seja, com comportamento caótico. Nos domínios onde existia um comportamento racional do objeto móvel, a acurácia de classificação das trajetórias foi claramente superior; Houve certa dificuldade para classificar as trajetórias de um domínio com classe definida por parte do comportamento da trajetória. A natureza caótica do comportamento do objeto móvel também dificulta a detecção de um padrão de comportamento.

46 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. E finalmente, a conclusão.

47 Conclusão O método TRACTS demonstrou-se eficaz na tarefa de criar um modelo de classificação com boa acurácia; De forma geral o método foi superior a um outro método proposto para o mesmo fim, sem comprometimento da propriedade de independência de domínio considerado. A partir dos resultados observados, é possível afirmar que o método TRACTS demonstrou-se eficaz na tarefa de classificação de trajetórias. O método foi, no geral, superior a um método semelhante.

48 Conclusão – Contribuições
Primeiro método de classificação de trajetórias que transforma trajetórias em séries temporais; Utilização de algoritmos tradicionais de classificação para realizar a construção de modelos de classificação de trajetórias; Manter uma boa independência quanto ao domínio considerado no conjunto de dados, possibilitando uma análise pura das características da trajetória. Como contribuições do método é possível citar: <ler os pontos>

49 Conclusão – Publicações
Esse trabalho resultou no seguinte artigo publicado: Santos, I.P., & Alvares, L.O. (2011). TRACTS: Um método para a classificação de trajetórias de objetos móveis usando séries temporais. 8º Encontro Nacional de Inteligencia Artificial (ENIA) – CSBC, Proceedings (pp ). Natal, Brasil: Springer. Esse trabalho produziu um artigo publicado no ENIA 2011.

50 Conclusão – Trabalhos Futuros
Estudo em outros domínios de aplicação, utilizando outras características geométricas da trajetória (locais e globais); Busca de novos métodos de tratamento de strings, além do TSB, que também possibilitem a detecção de padrões interessantes a partir da string gerada pelo método SAX; Submissão de artigo para uma revista internacional. Como trabalhos futuros, serão utilizados alguns outros domínios de aplicação, bem como outras características geométricas da trajetória, já que o método TRACTS prevê a utilização de qualquer tipo de característica geométrica das trajetórias. Também serão prospectados alguns novos métodos de tratamento de strings, que assim como o TSB possibilitem a obtenção de atributos que possam ser imputados para a etapa de classificação do método.

51 Conclusão – Referências
Chakrabarti, K., Keogh, E., Mehrotra, S., & Pazzani, M. (2002, Junho). Locally adaptive dimensionality reduction for indexing large time series databases. ACM Transactions on Database Systems , pp. 151–162. Faloutsos, C., Ranganathan, M., & Manolopoulos, Y. (1994 ). Fast subsequence matching in time-series databases. SIGMOD international conference on Management of data, Proceedings (pp. 419–429). New York, NY, EUA: ACM. Geurts, P. (2001). Pattern Extraction for Time Series Classification. European Conference on Principles of Data Mining and Knowledge Discovery PKDD, Proceedings (pp. 115–127). London, UK: Springer. Kamber, M., & Han, J. (2006). Data Mining: Concepts and Techniques. San Francisco, CA, EUA: Morgan Kaufmann. Kumar, N., Lolla, V. N., Keogh, E., Lonardi, S., Ratanamahatana, C. A., & Wei, L. (2005). Time-series Bitmaps: A Practical Visualization Tool for working with Large Time Series Databases. 5th SIAM International Conference on Data Mining - SDM'05, Proceedings (pp ). Newport Beach, CA, EUA: SIAM. Lee, J.-G., Han, J., Gonzalez, H., & Li, X. (2008). TraClass: trajectory classification using hierarchical region-based and trajectory-based clustering. VLDB Endowment (pp ). Auckland, Nova Zelândia: VLDB Endowment. Lonardi, S. (2001). Global detectors of unusual words: design implementation and applications to pattern discovery in biosequences. Department of Computer Sciences, Purdue University. Algumas referências utilizadas nessa apresentação.

52 Estrutura de Apresentação
Introdução; Conceitos Utilizados; Trabalhos Relacionados; O Método TRACTS; Experimentos Realizados; Conclusão. Apresentação finalizada.

53 TRACTS Trajectory Classification using Time Series
Perguntas? Perguntas? Aluno: Irineu Junior Pinheiro dos Santos Orientador: Luis Otávio de Campos Álvares

54 Experimentos Realizados – Resultados
Domínio Tamanho Alfabeto SAX Tempo Geração Animais 3 5260,02s 7 5327,01s Barcos 218,21s 208,62s Furacões 395,12s 433,95s O tempo para a geração das strings SAX também acaba sendo fortemente relacionada com o número de pontos da trajetória e em parte com o número de trajetórias do conjunto de dados.

55 Experimentos Realizados – Resultados
Domínio Alfabeto SAX Profundidade Tempo Geração Animais 3 1 88,06s 7 4 1180,94s Barcos 19,58s 1097s Furacões 4,12s 1132,96s Entretanto, o tempo de geração das matrizes de bitmap é muito mais influenciada pela profundidade da matriz TSB do que qualquer outra característica das trajetórias, que tem um papel muito menor nesse caso. É possível dizer que o tempo de geração da matriz TSB é exponencialmente proporcional a profundidade da matriz.


Carregar ppt "TRACTS Trajectory Classification using Time Series"

Apresentações semelhantes


Anúncios Google