Uncertainty quantification is one of the main foci of several statistical studies that have been conducted over the last decades. Conformal Prediction (CP) is a set of algorithms that allow to assess the reliability of the output of a Statistical Learning predictive model. When multiple correlated random variables are involved, a proper extension to the multivariate setting is required. Such extension can be achieved through copulae. In statistics, copulae are multivariate distribution functions that are able to provide insights on a random phenomenon, isolating and modelling the dependence structure between random variables. To the best of our knowledge, the flexibility of the copula-based Conformal Prediction approach has not been entirely investigated, especially with respect to the intrinsic properties of the underlying process, such as dimensionality and intercorrelation. In this work, several simulation studies involving popular copula estimators within a range of different scenarios have been performed and validated using Monte Carlo simulations. Finally, based on the results obtained on synthetic data, copula-based Conformal Prediction has been applied to a set of ground deformation estimates, relevant to the volcanic area of Campi Flegrei (Napoli), detected by the SAR satellite constellation Sentinel-1 and processed via the recent SBAS procedure.

La quantificazione dell'incertezza è uno dei principali foci di svariati studi statistici recentemente condotti. La Conformal Prediction (CP) è un insieme di algoritmi che permettono di valutare l'affidabilità delle stime di predizione generate dai modelli di Statistical Learning. In presenza di molteplici variabili aleatorie correlate tra loro, è necessaria un'appropriata estensione dell'algoritmo di CP al caso multivariato. Una simile estensione può essere ottenuta sfruttando le copulae. In statistica, le copulae sono funzioni di distribuzione multivariata in grado di fornire utili informazioni riguardo ad un fenomeno casuale, isolando e modellando la struttura di dipendenza tra le variabili aleatorie. Riteniamo che la flessibilità della Conformal Prediction basata sulla copula non sia ancora stata propriamente investigata, specialmente in relazione ad alcune proprietà intrinsiche del fenomeno aleatorio, quali dimensionalità e interdipendenza. In questo lavoro, vengono condotti diversi studi di simulazione, utilizzando comuni stimatori di copula in un range di scenari differenti e validando i risultati tramite simulazioni Monte Carlo. Infine, sulla base dell'esito degli esperimenti su dati sintetici, applichiamo la copula-based Conformal Prediction a un dataset di stime di deformazione del suolo terrestre, relative all'area vulcanica dei Campi Flegrei, Napoli: tali stime sono state rilevate da una costellazione di satelliti SAR, Sentinel-1, e processate tramite la recente tecnica SBAS.

Anomaly detection via copula-based conformal prediction for high dimensional data : theory, simulations, and an application to natural hazards satellite monitoring

Ciceri, Federico
2021/2022

Abstract

Uncertainty quantification is one of the main foci of several statistical studies that have been conducted over the last decades. Conformal Prediction (CP) is a set of algorithms that allow to assess the reliability of the output of a Statistical Learning predictive model. When multiple correlated random variables are involved, a proper extension to the multivariate setting is required. Such extension can be achieved through copulae. In statistics, copulae are multivariate distribution functions that are able to provide insights on a random phenomenon, isolating and modelling the dependence structure between random variables. To the best of our knowledge, the flexibility of the copula-based Conformal Prediction approach has not been entirely investigated, especially with respect to the intrinsic properties of the underlying process, such as dimensionality and intercorrelation. In this work, several simulation studies involving popular copula estimators within a range of different scenarios have been performed and validated using Monte Carlo simulations. Finally, based on the results obtained on synthetic data, copula-based Conformal Prediction has been applied to a set of ground deformation estimates, relevant to the volcanic area of Campi Flegrei (Napoli), detected by the SAR satellite constellation Sentinel-1 and processed via the recent SBAS procedure.
BORTOLOTTI, TERESA
MENAFOGLIO, ALESSANDRA
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
La quantificazione dell'incertezza è uno dei principali foci di svariati studi statistici recentemente condotti. La Conformal Prediction (CP) è un insieme di algoritmi che permettono di valutare l'affidabilità delle stime di predizione generate dai modelli di Statistical Learning. In presenza di molteplici variabili aleatorie correlate tra loro, è necessaria un'appropriata estensione dell'algoritmo di CP al caso multivariato. Una simile estensione può essere ottenuta sfruttando le copulae. In statistica, le copulae sono funzioni di distribuzione multivariata in grado di fornire utili informazioni riguardo ad un fenomeno casuale, isolando e modellando la struttura di dipendenza tra le variabili aleatorie. Riteniamo che la flessibilità della Conformal Prediction basata sulla copula non sia ancora stata propriamente investigata, specialmente in relazione ad alcune proprietà intrinsiche del fenomeno aleatorio, quali dimensionalità e interdipendenza. In questo lavoro, vengono condotti diversi studi di simulazione, utilizzando comuni stimatori di copula in un range di scenari differenti e validando i risultati tramite simulazioni Monte Carlo. Infine, sulla base dell'esito degli esperimenti su dati sintetici, applichiamo la copula-based Conformal Prediction a un dataset di stime di deformazione del suolo terrestre, relative all'area vulcanica dei Campi Flegrei, Napoli: tali stime sono state rilevate da una costellazione di satelliti SAR, Sentinel-1, e processate tramite la recente tecnica SBAS.
File allegati
File Dimensione Formato  
Thesis_Ciceri_Anomaly_Detection.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 1.96 MB
Formato Adobe PDF
1.96 MB Adobe PDF   Visualizza/Apri
Executive_Summary_Ciceri_Anomaly_Detection.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 500.04 kB
Formato Adobe PDF
500.04 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192156