This work is based on the development of some extensions of Hidden Markov Models (HMMs), a widespread statistical tool for modelling a large range of time series and longitudinal datasets, widely used in many research fields like biostatistics, signal processing and finance. Specifically, we extend their use to more complex situations in order to apply them to two types of data: multivariate and functional data. In the first case, we construct a HMM where the observations can be modelled as a mixture of both continuous and discrete distributions, and we use copulas to model the dependence structure of the continuous observations. In the second part of the work, we study high-dimensional datasets, belonging to the context of Functional Data Analysis. Since we want to catch the temporal dependence among sequences of data through the HMMs, where the outcome can be either a univariate or multivariate functional observation, we focus on the study of functional time series. With the techniques presented in this work we are able to describe these data and, after estimating the parameters of the underlying hidden process, we can also learn some information about their grouping structure.

Questo lavoro è basato sullo sviluppo di alcune estensioni degli Hidden Markov Models (HMMs), uno strumento statistico molto diffuso per la modellizzazione di una vasta gamma di tipologie di dataset longitudinali e serie temporali, ampiamente utilizzato in molti campi di ricerca come la biostatistica, l'elaborazione di segnali e la finanza. Nello specifico, estendiamo il loro uso a situazioni più complesse, così da applicarli a due tipologie di dati: i dati multivariati e i dati funzionali. Nel primo caso, costruiamo un HMM dove le osservazioni possono essere studiate utilizzando un modello mistura di distribuzioni sia continue che discrete, e usiamo le copule per modellizzare la struttura di dipendenza delle osservazioni continue. Nella seconda parte del lavoro, studiamo dati ad alta dimensionalità, appartenenti al contesto della Functional Data Analysis (FDA). Poiché vogliamo catturare la dipendenza temporale tra sequenze di dati utilizzando gli HMM, dove l'osservazione può essere un dato funzionale sia univariato che multivariato, ci concentriamo sullo studio di serie temporali funzionali. Con le tecniche presentate in questo lavoro, siamo in grado di descrivere questi dati e, dopo aver effettuato la stima dei parametri del processo nascosto sottostante, è possibile anche apprendere delle informazioni riguardanti la loro struttura di raggruppamento.

Hidden Markov models for multivariate, functional and complex data

MARTINO, ANDREA

Abstract

This work is based on the development of some extensions of Hidden Markov Models (HMMs), a widespread statistical tool for modelling a large range of time series and longitudinal datasets, widely used in many research fields like biostatistics, signal processing and finance. Specifically, we extend their use to more complex situations in order to apply them to two types of data: multivariate and functional data. In the first case, we construct a HMM where the observations can be modelled as a mixture of both continuous and discrete distributions, and we use copulas to model the dependence structure of the continuous observations. In the second part of the work, we study high-dimensional datasets, belonging to the context of Functional Data Analysis. Since we want to catch the temporal dependence among sequences of data through the HMMs, where the outcome can be either a univariate or multivariate functional observation, we focus on the study of functional time series. With the techniques presented in this work we are able to describe these data and, after estimating the parameters of the underlying hidden process, we can also learn some information about their grouping structure.
SABADINI, IRENE MARIA
SABADINI, IRENE MARIA
GUATTERI, GIUSEPPINA
20-feb-2020
Questo lavoro è basato sullo sviluppo di alcune estensioni degli Hidden Markov Models (HMMs), uno strumento statistico molto diffuso per la modellizzazione di una vasta gamma di tipologie di dataset longitudinali e serie temporali, ampiamente utilizzato in molti campi di ricerca come la biostatistica, l'elaborazione di segnali e la finanza. Nello specifico, estendiamo il loro uso a situazioni più complesse, così da applicarli a due tipologie di dati: i dati multivariati e i dati funzionali. Nel primo caso, costruiamo un HMM dove le osservazioni possono essere studiate utilizzando un modello mistura di distribuzioni sia continue che discrete, e usiamo le copule per modellizzare la struttura di dipendenza delle osservazioni continue. Nella seconda parte del lavoro, studiamo dati ad alta dimensionalità, appartenenti al contesto della Functional Data Analysis (FDA). Poiché vogliamo catturare la dipendenza temporale tra sequenze di dati utilizzando gli HMM, dove l'osservazione può essere un dato funzionale sia univariato che multivariato, ci concentriamo sullo studio di serie temporali funzionali. Con le tecniche presentate in questo lavoro, siamo in grado di descrivere questi dati e, dopo aver effettuato la stima dei parametri del processo nascosto sottostante, è possibile anche apprendere delle informazioni riguardanti la loro struttura di raggruppamento.
Tesi di dottorato
File allegati
File Dimensione Formato  
Martino_Thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 7.23 MB
Formato Adobe PDF
7.23 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152654