Clustering and classifying time series are fundamental tasks in various fields, such as biology, finance, and medicine. A crucial step in these algorithms includes selecting an appropriate distance measure that effectively captures similarities and differences between time series. This thesis evaluates EgoDist, a set of eight graph-based similarity measures, that compute distances between time series by mapping them into graphs, leveraging visibility algorithms. The performance of EgoDist is assessed in clustering and classification tasks and compared with traditional distance metrics such as Euclidean Distance, Dynamic Time Warping, and Shape-based methods. These similarity measures were tested on a dataset that contains 110 synthetically generated time series, obtaining promising results and outperforming the benchmarking distance measures. However, when applied to real-world datasets from the UCR Time Series Archive, EgoDist distance measure achieves competitive results only in specific cases, while traditional methods generally perform better. This thesis highlights the potential of graph-based methods for time series analysis and identifies the strengths and limitations of EgoDist.
Il clustering e la classificazione delle serie temporali sono metodologie fondamentali in vari settori, come biologia, finanza e medicina. In questi algoritmi è di particolare importanza utilizzare una misura di distanza appropriata che sia in grado di catturare in modo efficace le somiglianze e le differenze tra le serie temporali. Questa tesi si focalizza su EgoDist, ovvero una famiglia di otto misure di somiglianza tra grafi, che calcolano la distanza tra le serie temporali trasformandole in grafi, sfruttando degli algoritmi di visibilità. Le prestazioni di EgoDist sono valutate attraverso algoritmi di clustering e di classificazione, e vengono confrontate con misure di distanza tradizionali come la distanza Euclidea, la Dynamic Time Warping, e i metodi basati sulla forma delle serie temporali. Queste misure di similarità sono state testate su un dataset contenente 110 serie temporali generate sinteticamente, ottenendo risultati promettenti e superando le metriche di distanza di riferimento. Tuttavia, EgoDist, quando viene applicata a dataset reali dell'UCR Time Series Archive, ottiene risultati competitivi solo in casi specifici, mentre i metodi tradizionali generalmente hanno prestazioni migliori. Questa tesi evidenzia il potenziale dei metodi di distanza basati su grafi per l'analisi di serie temporali e identifica i punti di forza e di debolezza di EgoDist.
Time series clustering and classification: a network-based approach
NUMEROLI, RITA
2024/2025
Abstract
Clustering and classifying time series are fundamental tasks in various fields, such as biology, finance, and medicine. A crucial step in these algorithms includes selecting an appropriate distance measure that effectively captures similarities and differences between time series. This thesis evaluates EgoDist, a set of eight graph-based similarity measures, that compute distances between time series by mapping them into graphs, leveraging visibility algorithms. The performance of EgoDist is assessed in clustering and classification tasks and compared with traditional distance metrics such as Euclidean Distance, Dynamic Time Warping, and Shape-based methods. These similarity measures were tested on a dataset that contains 110 synthetically generated time series, obtaining promising results and outperforming the benchmarking distance measures. However, when applied to real-world datasets from the UCR Time Series Archive, EgoDist distance measure achieves competitive results only in specific cases, while traditional methods generally perform better. This thesis highlights the potential of graph-based methods for time series analysis and identifies the strengths and limitations of EgoDist.File | Dimensione | Formato | |
---|---|---|---|
2025_04_Numeroli_Thesis_01.pdf
solo utenti autorizzati a partire dal 07/03/2026
Descrizione: testo tesi
Dimensione
3.37 MB
Formato
Adobe PDF
|
3.37 MB | Adobe PDF | Visualizza/Apri |
2025_04_Numeroli_Executive_Summary_02.pdf
solo utenti autorizzati a partire dal 07/03/2026
Descrizione: executive summary
Dimensione
782.11 kB
Formato
Adobe PDF
|
782.11 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/235045