In this manuscript we analyze Blind Source Separation problems for high-dimensional, massive, and complex data, and we propose new methods to face these statistical problems. Blind Source Separation problem consists of retrieving a set of unobserved source signals from a set of observed mixed signals, according to some a priori hypotheses on the sources and/or on the mixing process that generates the mixed signals. In this thesis we develop a new algorithm, named Hierarchical Independent Component analysis (HICA), able to represent data through a non-orthogonal, data-drive, multi-resolution basis based on sparsity and multi-scale assumption on the mixing matrix. We also describe its theoretical properties. Then we present a new algorithm, named spatial colored Independent Component Analysis (scICA), to implement an Independent Component Analysis when sources are spatial stochastic processes. Finally we also analyze the Nonnegative Matrix Factorization (NMF) algorithm focusing in particular on the problem of the constraints and how to implement NMF for functional data. For every method described in this thesis we present applicative examples regarding Electroencephalography (EEG) signals analysis, geo-referred data on the mobile-phone traffic in the city of Milan (Italy), and decomposition of chemical mixtures through the analysis of gas-chromatograms.

In questa tesi è stata analizzata la Blind Source Separation nell’ambito di grandi dataset, complessi e ad alta dimensionalità e sono stati proposti nuovi metodi per affrontare questo tipo di problema. La Blind Source Separation consiste nel ricavare un insieme di sorgenti non osservate a partire da un insieme di segnali osservati ottenuti come combinazioni delle sorgenti, basandosi su alcune ipotesi a priori sulle sorgenti e/o sul processo di mixing che genera i segnali osservati. In questa tesi è stato sviluppato un nuovo algoritmo, chiamato Hierarchical Indepedent Component Analysis (HICA), in grado di rappresentare i dati attraverso una base non ortogonale, data-driven e multi risoluzione, basandosi su assunzioni di sparsità e multi risoluzione sulla matrice di mixing. Sono state inoltre analizzate le proprietà teoriche dell’HICA. In seguito è stato presentato un nuovo algoritmo, chiamato spatial colored Independent Component Analaysis (scICA), che implementa un’analisi delle componenti indipendenti nel caso in cui le sorgenti siano processi stocastici spaziali. Infine è stato analizzato l’algoritmo della Nonnegative Matrix Factorization (NMF) facendo riferimento in particolare al problema dei vincoli e all’implementazione dell’algoritmo nel caso di dati funzionali. Per ogni metodo descritto sono stati presentati alcuni esempi applicativi riguardanti l’analisi di segnali elettroencefalografici (EEG), dati geo-referenziati riguardanti il traffico telefonico nella città di Milano e la decomposizione di miscele chimiche attraverso l’analisi di gas-cromatogrammi.

Blind source separation methods for high dimensional, massive, and complex data

ZANINI, PAOLO

Abstract

In this manuscript we analyze Blind Source Separation problems for high-dimensional, massive, and complex data, and we propose new methods to face these statistical problems. Blind Source Separation problem consists of retrieving a set of unobserved source signals from a set of observed mixed signals, according to some a priori hypotheses on the sources and/or on the mixing process that generates the mixed signals. In this thesis we develop a new algorithm, named Hierarchical Independent Component analysis (HICA), able to represent data through a non-orthogonal, data-drive, multi-resolution basis based on sparsity and multi-scale assumption on the mixing matrix. We also describe its theoretical properties. Then we present a new algorithm, named spatial colored Independent Component Analysis (scICA), to implement an Independent Component Analysis when sources are spatial stochastic processes. Finally we also analyze the Nonnegative Matrix Factorization (NMF) algorithm focusing in particular on the problem of the constraints and how to implement NMF for functional data. For every method described in this thesis we present applicative examples regarding Electroencephalography (EEG) signals analysis, geo-referred data on the mobile-phone traffic in the city of Milan (Italy), and decomposition of chemical mixtures through the analysis of gas-chromatograms.
LUCCHETTI, ROBERTO
SECCHI, PIERCESARE
VANTINI, SIMONE
3-apr-2014
In questa tesi è stata analizzata la Blind Source Separation nell’ambito di grandi dataset, complessi e ad alta dimensionalità e sono stati proposti nuovi metodi per affrontare questo tipo di problema. La Blind Source Separation consiste nel ricavare un insieme di sorgenti non osservate a partire da un insieme di segnali osservati ottenuti come combinazioni delle sorgenti, basandosi su alcune ipotesi a priori sulle sorgenti e/o sul processo di mixing che genera i segnali osservati. In questa tesi è stato sviluppato un nuovo algoritmo, chiamato Hierarchical Indepedent Component Analysis (HICA), in grado di rappresentare i dati attraverso una base non ortogonale, data-driven e multi risoluzione, basandosi su assunzioni di sparsità e multi risoluzione sulla matrice di mixing. Sono state inoltre analizzate le proprietà teoriche dell’HICA. In seguito è stato presentato un nuovo algoritmo, chiamato spatial colored Independent Component Analaysis (scICA), che implementa un’analisi delle componenti indipendenti nel caso in cui le sorgenti siano processi stocastici spaziali. Infine è stato analizzato l’algoritmo della Nonnegative Matrix Factorization (NMF) facendo riferimento in particolare al problema dei vincoli e all’implementazione dell’algoritmo nel caso di dati funzionali. Per ogni metodo descritto sono stati presentati alcuni esempi applicativi riguardanti l’analisi di segnali elettroencefalografici (EEG), dati geo-referenziati riguardanti il traffico telefonico nella città di Milano e la decomposizione di miscele chimiche attraverso l’analisi di gas-cromatogrammi.
Tesi di dottorato
File allegati
File Dimensione Formato  
2014_04_PhD_Zanini.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 7.48 MB
Formato Adobe PDF
7.48 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/89867