Data scarcity is among the main challenges when dealing with time series forecasting tasks and more and more researchers struggle to find new solutions to overcome this problem. This work focuses on the concept of Transfer Learning in a prediction task regarding a time series, for which we do not have a large number of observations. We introduce a novel approach that integrates various Feature Engineering techniques and the use of a Vector Database to optimize the complexity of the entire process. The entire algorithm is composed of three blocks: the time series are firstly processed to create a representation of the underlying characteristics of the analyzed data, while contributing to the dimensionality reduction of the problem. Then, we use a vector database to store and search within the representational characteristics obtained, and lastly we compute the forecast by combining the predictions of the models trained on the most similar time series with respect to the target. We have tested the efficacy of our method, also by comparing it to one of the most used evaluation metrics for time series, the Dynamic Time Warping, both in terms of accuracy and complexity.
La scarsità di dati è una delle principali sfide quando ci si occupa di effettuare predizioni di serie temporali e sempre più ricercatori cercano nuove soluzioni per superare questo problema. Questo lavoro si concentra sul concetto di Transfer Learning applicato nel caso di una predizione di una nuova serie temporale di cui non abbiamo a dispozione un elevato numero di osservazioni, proponendo un nuovo approccio che integra tecniche di Feature Engineering e Vector Database per l'ottimizzazione computazionale dell'intero processo. L'intero algoritmo è suddivisibile in tre fasi: le serie temporali vengono analizzate creando una rappresentazione basata sulle caratteristiche intrinseche alla sequenza di dati analizzata, contribuendo inoltre alla riduzione della dimensione del problema affrontato. Si prosegue utilizzando un database vettoriale per trovare le serie temporali più simili e infine si utilizzano i modelli allenati su queste ultime per eseguire la predizione finale. Abbiamo testato l'efficacia del nostro metodo, comparandolo con uno dei metodi più noti per la comparazione di serie temporali, la Dynamic Time Warping, sia in termini di accuratezza che di complessità.
Feature-based weighted transfer learning for time series forecasting
Cristofaro, Giulio
2023/2024
Abstract
Data scarcity is among the main challenges when dealing with time series forecasting tasks and more and more researchers struggle to find new solutions to overcome this problem. This work focuses on the concept of Transfer Learning in a prediction task regarding a time series, for which we do not have a large number of observations. We introduce a novel approach that integrates various Feature Engineering techniques and the use of a Vector Database to optimize the complexity of the entire process. The entire algorithm is composed of three blocks: the time series are firstly processed to create a representation of the underlying characteristics of the analyzed data, while contributing to the dimensionality reduction of the problem. Then, we use a vector database to store and search within the representational characteristics obtained, and lastly we compute the forecast by combining the predictions of the models trained on the most similar time series with respect to the target. We have tested the efficacy of our method, also by comparing it to one of the most used evaluation metrics for time series, the Dynamic Time Warping, both in terms of accuracy and complexity.File | Dimensione | Formato | |
---|---|---|---|
2024_04_Cristofaro.pdf
solo utenti autorizzati dal 19/03/2025
Descrizione: Executive Summary and Thesis
Dimensione
5.08 MB
Formato
Adobe PDF
|
5.08 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/218523