In this work, we present the notion of Spearman index to quantify the dependence among two families of functional data generalizing the classical bivariate concept to situations where the observations are curves generated by a stochastic process. The tool, based on the notion of grade of an observation in a sample, is introduced as generalization, to the infinite dimensional case, of the analogous index of multivariate statistics. In particular, several properties of the Spearman index are illustrated emphasizing the importance of having a consistent estimator of the index of the original processes. Then, we use the notion of Spearman index to define the Spearman Matrix, a new mathematical object expressing the pattern of dependence among the components of a multivariate functional dataset. A simulation study aimed at testing the performance of the Spearman index in different scenario in correctly detecting the pattern of dependence between the components of bivariate functional datasets is also provided. Finally, the notion of Spearman Matrix is exploit to analyze two different populations of multivariate curves (specifically, Electrocardiographic signals of healthy and unhealthy people), in order to check if the pattern of dependence between the components is different in the two cases. Thus, we provide four tests of hypothesis verifying the equality between the Spearman matrices of the two populations. The first one is an adaptation, to the functional case, of existing permutation-based testing procedure proposed in literature to compare the correlation matrices of different populations of multivariate data, based on the notion of the generalized cosine measure between two symmetric matrices. The other three tests exploit the bootstrap approach and the notion of distance between two matrices.

In questo lavoro viene presentata la nozione di indice di Spearman per quantificare la dipendenza tra due famiglie di dati funzionali generalizzando il classico concetto di dati bivariati a situazioni in cui le osservazioni sono punti appartenenti a curve generate da un processo stocastico. Lo strumento, basato sulla nozione di grado di un’osservazione in una popolazione campione, viene presentato come generalizzazione, al caso dimensionale infinito, dell’analogo indice della statistica multivariata. In particolare, vengono illustrate diverse proprietà dell’indice di Spearman sottolineando l’importanza di avere uno stimatore consistente dell’indice statistico dei processi originali. Quindi, utilizziamo la nozione di indice di Spearman per definire la matrice di Spearman, un nuovo oggetto matematico che esprime il modello di dipendenza tra le componenti di un dataset funzionale multivariato. Viene inoltre fornito uno studio di simulazione volto a testare le prestazioni dell’indice di Spearman in differenti scenari nel rilevare correttamente il pattern di dipendenza tra le componenti di dataset funzionali bivariati. Infine, la nozione di matrice di Spearman viene sfruttata per analizzare due diverse popolazioni di curve multivariate (nello specifico, segnali elettrocardiografici di persone sane e malate), al fine di verificare se il modello di dipendenza tra le componenti è diverso nei due casi. Pertanto, forniamo quattro test di ipotesi che verificano l’uguaglianza tra le matrici di Spearman delle due popolazioni. Il primo test è un adattamento, al caso funzionale, della procedura di test basata sulle permutazioni già esistente e proposta in letteratura per confrontare le matrici di correlazione di diverse popolazioni di dati multivariati, sulla base della nozione di misura del coseno generalizzato tra due matrici simmetriche. Gli altri tre test sfruttano l’approccio bootstrap e la nozione di distanza tra due matrici.

A non-parametric-based inferential framework for multivariate functional data: an application to ECG signals

Ronzulli, Michael
2021/2022

Abstract

In this work, we present the notion of Spearman index to quantify the dependence among two families of functional data generalizing the classical bivariate concept to situations where the observations are curves generated by a stochastic process. The tool, based on the notion of grade of an observation in a sample, is introduced as generalization, to the infinite dimensional case, of the analogous index of multivariate statistics. In particular, several properties of the Spearman index are illustrated emphasizing the importance of having a consistent estimator of the index of the original processes. Then, we use the notion of Spearman index to define the Spearman Matrix, a new mathematical object expressing the pattern of dependence among the components of a multivariate functional dataset. A simulation study aimed at testing the performance of the Spearman index in different scenario in correctly detecting the pattern of dependence between the components of bivariate functional datasets is also provided. Finally, the notion of Spearman Matrix is exploit to analyze two different populations of multivariate curves (specifically, Electrocardiographic signals of healthy and unhealthy people), in order to check if the pattern of dependence between the components is different in the two cases. Thus, we provide four tests of hypothesis verifying the equality between the Spearman matrices of the two populations. The first one is an adaptation, to the functional case, of existing permutation-based testing procedure proposed in literature to compare the correlation matrices of different populations of multivariate data, based on the notion of the generalized cosine measure between two symmetric matrices. The other three tests exploit the bootstrap approach and the notion of distance between two matrices.
PAGANONI , ANNA MARIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
In questo lavoro viene presentata la nozione di indice di Spearman per quantificare la dipendenza tra due famiglie di dati funzionali generalizzando il classico concetto di dati bivariati a situazioni in cui le osservazioni sono punti appartenenti a curve generate da un processo stocastico. Lo strumento, basato sulla nozione di grado di un’osservazione in una popolazione campione, viene presentato come generalizzazione, al caso dimensionale infinito, dell’analogo indice della statistica multivariata. In particolare, vengono illustrate diverse proprietà dell’indice di Spearman sottolineando l’importanza di avere uno stimatore consistente dell’indice statistico dei processi originali. Quindi, utilizziamo la nozione di indice di Spearman per definire la matrice di Spearman, un nuovo oggetto matematico che esprime il modello di dipendenza tra le componenti di un dataset funzionale multivariato. Viene inoltre fornito uno studio di simulazione volto a testare le prestazioni dell’indice di Spearman in differenti scenari nel rilevare correttamente il pattern di dipendenza tra le componenti di dataset funzionali bivariati. Infine, la nozione di matrice di Spearman viene sfruttata per analizzare due diverse popolazioni di curve multivariate (nello specifico, segnali elettrocardiografici di persone sane e malate), al fine di verificare se il modello di dipendenza tra le componenti è diverso nei due casi. Pertanto, forniamo quattro test di ipotesi che verificano l’uguaglianza tra le matrici di Spearman delle due popolazioni. Il primo test è un adattamento, al caso funzionale, della procedura di test basata sulle permutazioni già esistente e proposta in letteratura per confrontare le matrici di correlazione di diverse popolazioni di dati multivariati, sulla base della nozione di misura del coseno generalizzato tra due matrici simmetriche. Gli altri tre test sfruttano l’approccio bootstrap e la nozione di distanza tra due matrici.
File allegati
File Dimensione Formato  
Thesis.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Master's degree thesis
Dimensione 58.04 MB
Formato Adobe PDF
58.04 MB Adobe PDF   Visualizza/Apri
Executive_Summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive summary of the thesis
Dimensione 392.21 kB
Formato Adobe PDF
392.21 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/195815