The general framework in which the present dissertation is placed is the analysis of high dimensional and complex data. The peculiarity of all the problems and case studies that will be described in the following is the combination of different sources of complexity: we will consider high dimensional (functional) data, spatially dependent data, geo referenced data on a (possibly huge) lattice. The main aim is performing data classi cation, i.e. reconstructing a latent fi eld of labels which infl uences the distribution of the observed (functional) signal. This problem motivates the fi rst part, and most of the second part, of the dissertation. Indeed, the general paradigm here discussed, at least in the framework of spatially dependent functional data, can be adapted to different problems arising in the applications, and to other purposes, e.g. dimensional reduction, regression. The main focus of the dissertation is the development of methods and algorithms for the classi cation of functional data in the presence of spatial dependence. It is articulated in three parts: the fi rst part concerns the classifi cation of functional data when spatial dependence is not present, as a specifi c case of a more general framework in which spatial dependence is taken into account. This latter general framework is developed in the second part, where innovative classifi cation and dimensional reduction methods, suited for the case of functional data indexed by the sites of a spatial lattice, are presented. Finally, in the third part of the dissertation, the analyses conducted within the eni S.p.A. project that funded the PhD grant are detailed: this scienti c endeavour has motivated the development of many of the methods described in the fi rst two parts of the dissertation. Hence, the third part of the dissertation is subject to confidentiality constraints, and can not be disclosed.

L'ambito generale in cui si situa il presente lavoro di tesi è l'analisi di dati complessi e ad alta dimensionalità. La peculiarità di tutti i problemi e i casi applicativi descritti nella tesi è la combinazione di differenti fonti di complessità: saranno considerati dati funzionali, dati spazialmente dipendenti, dati geo-referenziati su una griglia di dimensioni anche considerevoli. L'obiettivo principale è risolvere un problema di classificazione, ovvero ricostruire un campo latente di etichette che influenza la distribuzione del segnale (funzionale) osservato. Questo problema modellistico motiva la prima parte della tesi, e un cospicuo sottoinsieme della seconda. Tuttavia, il paradigma generale che viene qui introdotto e descritto, almeno per quanto concerne il trattamento di dati funzionali spazialmente dipendenti, puo' essere facilmente declinato per i diversi obiettivi eventualmente posti dai problemi applicativi considerati, ad esempio la risoluzione di problemi di riduzione dimensionale, o la stima di modelli lineari. Il focus principale del presente lavoro di tesi è lo sviluppo di metodi e algoritmi per la classificazione di dati funzionali in presenza di dipendenza spaziale. La tesi si articola in tre parti: nella prima viene affrontata la classificazione di dati funzionali qualora la dipendenza spaziale non sia presente, come caso particolare dell'ambito più generale che include anche la dipendenza spaziale. Tema, quest'ultimo, compiutamente sviluppato nella seconda parte della tesi, in cui viene presentata una tecnica innovativa per la classificazione e la riduzione dimensionale di dati funzionali riferiti ai siti di una griglia spaziale. Infine, nella terza parte della tesi vengono dettagliate le analisi condotte nell'ambito del progetto, stipulato con eni S.p.A., che ha finanziato la borsa di dottorato: questo ampio progetto multidisciplinare, che ha visto il coinvolgimento di sei diversi Dipartimenti del Politecnico di Milano, ha motivato lo sviluppo della maggior parte dei metodi descritti nelle prime due parti della tesi. La terza parte della tesi è dunque soggetta a vincolo di confidenzialità, e non puo' essere rilasciata a terzi senza concessione esplicita da parte dell'ente finanziatore.

Classification of functional data in the presence of spatial dependence. Methods, algorithms and case studies

VITELLI, VALERIA

Abstract

The general framework in which the present dissertation is placed is the analysis of high dimensional and complex data. The peculiarity of all the problems and case studies that will be described in the following is the combination of different sources of complexity: we will consider high dimensional (functional) data, spatially dependent data, geo referenced data on a (possibly huge) lattice. The main aim is performing data classi cation, i.e. reconstructing a latent fi eld of labels which infl uences the distribution of the observed (functional) signal. This problem motivates the fi rst part, and most of the second part, of the dissertation. Indeed, the general paradigm here discussed, at least in the framework of spatially dependent functional data, can be adapted to different problems arising in the applications, and to other purposes, e.g. dimensional reduction, regression. The main focus of the dissertation is the development of methods and algorithms for the classi cation of functional data in the presence of spatial dependence. It is articulated in three parts: the fi rst part concerns the classifi cation of functional data when spatial dependence is not present, as a specifi c case of a more general framework in which spatial dependence is taken into account. This latter general framework is developed in the second part, where innovative classifi cation and dimensional reduction methods, suited for the case of functional data indexed by the sites of a spatial lattice, are presented. Finally, in the third part of the dissertation, the analyses conducted within the eni S.p.A. project that funded the PhD grant are detailed: this scienti c endeavour has motivated the development of many of the methods described in the fi rst two parts of the dissertation. Hence, the third part of the dissertation is subject to confidentiality constraints, and can not be disclosed.
SECCHI, PIERCESARE
BISCARI, PAOLO
VANTINI, SIMONE
8-mag-2012
L'ambito generale in cui si situa il presente lavoro di tesi è l'analisi di dati complessi e ad alta dimensionalità. La peculiarità di tutti i problemi e i casi applicativi descritti nella tesi è la combinazione di differenti fonti di complessità: saranno considerati dati funzionali, dati spazialmente dipendenti, dati geo-referenziati su una griglia di dimensioni anche considerevoli. L'obiettivo principale è risolvere un problema di classificazione, ovvero ricostruire un campo latente di etichette che influenza la distribuzione del segnale (funzionale) osservato. Questo problema modellistico motiva la prima parte della tesi, e un cospicuo sottoinsieme della seconda. Tuttavia, il paradigma generale che viene qui introdotto e descritto, almeno per quanto concerne il trattamento di dati funzionali spazialmente dipendenti, puo' essere facilmente declinato per i diversi obiettivi eventualmente posti dai problemi applicativi considerati, ad esempio la risoluzione di problemi di riduzione dimensionale, o la stima di modelli lineari. Il focus principale del presente lavoro di tesi è lo sviluppo di metodi e algoritmi per la classificazione di dati funzionali in presenza di dipendenza spaziale. La tesi si articola in tre parti: nella prima viene affrontata la classificazione di dati funzionali qualora la dipendenza spaziale non sia presente, come caso particolare dell'ambito più generale che include anche la dipendenza spaziale. Tema, quest'ultimo, compiutamente sviluppato nella seconda parte della tesi, in cui viene presentata una tecnica innovativa per la classificazione e la riduzione dimensionale di dati funzionali riferiti ai siti di una griglia spaziale. Infine, nella terza parte della tesi vengono dettagliate le analisi condotte nell'ambito del progetto, stipulato con eni S.p.A., che ha finanziato la borsa di dottorato: questo ampio progetto multidisciplinare, che ha visto il coinvolgimento di sei diversi Dipartimenti del Politecnico di Milano, ha motivato lo sviluppo della maggior parte dei metodi descritti nelle prime due parti della tesi. La terza parte della tesi è dunque soggetta a vincolo di confidenzialità, e non puo' essere rilasciata a terzi senza concessione esplicita da parte dell'ente finanziatore.
Tesi di dottorato
File allegati
File Dimensione Formato  
2012_05_PhD_Vitelli_01.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 36.59 MB
Formato Adobe PDF
36.59 MB Adobe PDF Visualizza/Apri
2012_05_PhD_Vitelli_02.pdf

non accessibile

Descrizione: Testo della tesi secretato
Dimensione 26.34 MB
Formato Adobe PDF
26.34 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/56881