In recent years, due to the extended service life of structural redundant infrastructure systems, it is essential to assess damages early on, which requires accurate knowledge of the loads acting on the structure. In modern approaches, this requirement is connected to the acquisition and exploitation of data. However, a common challenge is data sparsity, which may arise from transmission issues and sensor failures. Along these lines, this work employs Gaussian process regression (GPR) models for monitoring an airframe structure under data sparsity. Specifically, an uncertainty aware, SHM driven virtual load monitoring framework is developed that reconstructs strain histories at hot spots from standard flight data. To address data sparsity, the study extends conventional GPRs into multi-task GPRs, enabling information sharing between correlated strain sensors. GPR models were chosen because they adopt a flexible, non-parametric approach to modeling the data, avoiding the need to assume a predefined parametric form. Also, they provide probabilistic predictions with credible uncertainty estimates, while sparse variational approximations ensure computational efficiency in large-scale problems. However, in their standard form, they can only handle single outputs. Multi-task extensions reformulate the problem as vector-valued regression, exploiting cross-task covariance to transfer statistical strength from densely observed tasks to sparsely measured ones. This framework is demonstrated using experimental data obtained from the flight of a UAV platform. The correlations between flight parameters and strain measurements were analyzed to build a data-driven mapping, which allowed prediction of strain responses at critical hot spots in the wings. To evaluate the intrinsic capacity of the models employed in the absence of data sparsity, single task Gaussian process regression was used as a reference in this analysis. Then, some parts of the time window were hidden from training, in order to test the robustness of multitask learning models in imbalanced dataset settings to simulate realistic situations. In the second phase, a systematic analysis of two scenarios showed that multi–task GPRs surpass single–task GPRs under sparsity by leveraging inter–channel correlations. This was reflected by error–based metrics (nRMSE, nMAE, NMSE, $R^2$) and probabilistic scores (NLPD, MSLL), with visual diagnostics that made the gains transparent. Essentially, the thesis has framed strain reconstruction as a calibrated probabilistic inference problem and shown that multi–task Gaussian processes can recover much of the fidelity lost under sparse sensing by exploiting cross–sensor structure while remaining computationally scalable. The analyzed scenarios highlight the value of the multi-task learning approach. This lies in its ability to leverage data from different mission profiles of the drone (and, potentially, of a homogeneous fleet of drones) to reconstruct the full structural response under sparse sensing.

Negli ultimi anni, a causa della prolungata vita utile dei sistemi infrastrutturali ridondanti, è diventato essenziale valutare tempestivamente i danni, il che richiede una conoscenza accurata dei carichi agenti sulla struttura. Negli approcci moderni, questo requisito è legato all'acquisizione e all'utilizzo dei dati. Tuttavia, una sfida comune è la scarsità di dati, che può derivare da problemi di trasmissione e guasti dei sensori. In quest'ottica, questo lavoro utilizza modelli di regressione di processo gaussiana (GPR) per il monitoraggio della struttura di una cellula in condizioni di scarsità di dati. In particolare, viene sviluppato un framework di monitoraggio del carico virtuale basato su SHM e basato sull'incertezza, che ricostruisce le storie di deformazione nei punti critici a partire da dati di volo standard. Per affrontare la scarsità di dati, lo studio estende i GPR convenzionali in GPR multi-task, consentendo la condivisione delle informazioni tra sensori di deformazione correlati. I modelli GPR sono stati scelti perché adottano un approccio flessibile e non parametrico alla modellazione dei dati, evitando la necessità di assumere una forma parametrica predefinita. Inoltre, forniscono previsioni probabilistiche con stime di incertezza credibili, mentre le approssimazioni variazionali sparse garantiscono l'efficienza computazionale in problemi su larga scala. Tuttavia, nella loro forma standard, possono gestire solo output singoli. Le estensioni multi-task riformulano il problema come regressione a valori vettoriali, sfruttando la covarianza tra task per trasferire la forza statistica da task densamente osservati a quelli scarsamente misurati. Questo framework è dimostrato utilizzando dati sperimentali ottenuti dal volo di una piattaforma UAV. Le correlazioni tra i parametri di volo e le misurazioni della deformazione sono state analizzate per costruire una mappatura basata sui dati, che ha permesso di prevedere le risposte alla deformazione in punti critici delle ali. Per valutare la capacità intrinseca dei modelli impiegati in assenza di sparsità di dati, la regressione gaussiana a singolo task è stata utilizzata come riferimento in questa analisi. Inoltre, alcune parti della finestra temporale sono state nascoste all'addestramento, al fine di testare la robustezza dei modelli di apprendimento multi-task in contesti di dataset sbilanciati per simulare situazioni realistiche. Nella seconda fase, un'analisi sistematica di due scenari ha mostrato che i GPR multi-task superano i GPR mono-task in condizioni di sparsità sfruttando le correlazioni inter-canale. Ciò è stato confermato da metriche basate sugli errori (nRMSE, nMAE, NMSE, $R^2$) e punteggi probabilistici (NLPD, MSLL), con una diagnostica visiva che ha reso trasparenti i guadagni. In sostanza, la tesi ha inquadrato la ricostruzione della deformazione come un problema di inferenza probabilistica calibrata e ha dimostrato che i processi gaussiani multi-task possono recuperare gran parte della fedeltà persa in condizioni di sparsità sfruttando la struttura multi-sensore, pur rimanendo computazionalmente scalabili. Gli scenari analizzati evidenziano il valore dell'approccio di apprendimento multi-task. Questo risiede nella sua capacità di sfruttare i dati provenienti da diversi profili di missione del drone (e, potenzialmente, di una flotta omogenea di droni) per ricostruire la risposta strutturale completa in condizioni di sparsità.

Load monitoring under data sparsity via multi-task Gaussian Process regression models

Tempestilli, Francesco
2024/2025

Abstract

In recent years, due to the extended service life of structural redundant infrastructure systems, it is essential to assess damages early on, which requires accurate knowledge of the loads acting on the structure. In modern approaches, this requirement is connected to the acquisition and exploitation of data. However, a common challenge is data sparsity, which may arise from transmission issues and sensor failures. Along these lines, this work employs Gaussian process regression (GPR) models for monitoring an airframe structure under data sparsity. Specifically, an uncertainty aware, SHM driven virtual load monitoring framework is developed that reconstructs strain histories at hot spots from standard flight data. To address data sparsity, the study extends conventional GPRs into multi-task GPRs, enabling information sharing between correlated strain sensors. GPR models were chosen because they adopt a flexible, non-parametric approach to modeling the data, avoiding the need to assume a predefined parametric form. Also, they provide probabilistic predictions with credible uncertainty estimates, while sparse variational approximations ensure computational efficiency in large-scale problems. However, in their standard form, they can only handle single outputs. Multi-task extensions reformulate the problem as vector-valued regression, exploiting cross-task covariance to transfer statistical strength from densely observed tasks to sparsely measured ones. This framework is demonstrated using experimental data obtained from the flight of a UAV platform. The correlations between flight parameters and strain measurements were analyzed to build a data-driven mapping, which allowed prediction of strain responses at critical hot spots in the wings. To evaluate the intrinsic capacity of the models employed in the absence of data sparsity, single task Gaussian process regression was used as a reference in this analysis. Then, some parts of the time window were hidden from training, in order to test the robustness of multitask learning models in imbalanced dataset settings to simulate realistic situations. In the second phase, a systematic analysis of two scenarios showed that multi–task GPRs surpass single–task GPRs under sparsity by leveraging inter–channel correlations. This was reflected by error–based metrics (nRMSE, nMAE, NMSE, $R^2$) and probabilistic scores (NLPD, MSLL), with visual diagnostics that made the gains transparent. Essentially, the thesis has framed strain reconstruction as a calibrated probabilistic inference problem and shown that multi–task Gaussian processes can recover much of the fidelity lost under sparse sensing by exploiting cross–sensor structure while remaining computationally scalable. The analyzed scenarios highlight the value of the multi-task learning approach. This lies in its ability to leverage data from different mission profiles of the drone (and, potentially, of a homogeneous fleet of drones) to reconstruct the full structural response under sparse sensing.
ARAVANIS, GEORGIOS
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2024/2025
Negli ultimi anni, a causa della prolungata vita utile dei sistemi infrastrutturali ridondanti, è diventato essenziale valutare tempestivamente i danni, il che richiede una conoscenza accurata dei carichi agenti sulla struttura. Negli approcci moderni, questo requisito è legato all'acquisizione e all'utilizzo dei dati. Tuttavia, una sfida comune è la scarsità di dati, che può derivare da problemi di trasmissione e guasti dei sensori. In quest'ottica, questo lavoro utilizza modelli di regressione di processo gaussiana (GPR) per il monitoraggio della struttura di una cellula in condizioni di scarsità di dati. In particolare, viene sviluppato un framework di monitoraggio del carico virtuale basato su SHM e basato sull'incertezza, che ricostruisce le storie di deformazione nei punti critici a partire da dati di volo standard. Per affrontare la scarsità di dati, lo studio estende i GPR convenzionali in GPR multi-task, consentendo la condivisione delle informazioni tra sensori di deformazione correlati. I modelli GPR sono stati scelti perché adottano un approccio flessibile e non parametrico alla modellazione dei dati, evitando la necessità di assumere una forma parametrica predefinita. Inoltre, forniscono previsioni probabilistiche con stime di incertezza credibili, mentre le approssimazioni variazionali sparse garantiscono l'efficienza computazionale in problemi su larga scala. Tuttavia, nella loro forma standard, possono gestire solo output singoli. Le estensioni multi-task riformulano il problema come regressione a valori vettoriali, sfruttando la covarianza tra task per trasferire la forza statistica da task densamente osservati a quelli scarsamente misurati. Questo framework è dimostrato utilizzando dati sperimentali ottenuti dal volo di una piattaforma UAV. Le correlazioni tra i parametri di volo e le misurazioni della deformazione sono state analizzate per costruire una mappatura basata sui dati, che ha permesso di prevedere le risposte alla deformazione in punti critici delle ali. Per valutare la capacità intrinseca dei modelli impiegati in assenza di sparsità di dati, la regressione gaussiana a singolo task è stata utilizzata come riferimento in questa analisi. Inoltre, alcune parti della finestra temporale sono state nascoste all'addestramento, al fine di testare la robustezza dei modelli di apprendimento multi-task in contesti di dataset sbilanciati per simulare situazioni realistiche. Nella seconda fase, un'analisi sistematica di due scenari ha mostrato che i GPR multi-task superano i GPR mono-task in condizioni di sparsità sfruttando le correlazioni inter-canale. Ciò è stato confermato da metriche basate sugli errori (nRMSE, nMAE, NMSE, $R^2$) e punteggi probabilistici (NLPD, MSLL), con una diagnostica visiva che ha reso trasparenti i guadagni. In sostanza, la tesi ha inquadrato la ricostruzione della deformazione come un problema di inferenza probabilistica calibrata e ha dimostrato che i processi gaussiani multi-task possono recuperare gran parte della fedeltà persa in condizioni di sparsità sfruttando la struttura multi-sensore, pur rimanendo computazionalmente scalabili. Gli scenari analizzati evidenziano il valore dell'approccio di apprendimento multi-task. Questo risiede nella sua capacità di sfruttare i dati provenienti da diversi profili di missione del drone (e, potenzialmente, di una flotta omogenea di droni) per ricostruire la risposta strutturale completa in condizioni di sparsità.
File allegati
File Dimensione Formato  
2025_10_Tempestilli_Tesi_01.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 34.85 MB
Formato Adobe PDF
34.85 MB Adobe PDF   Visualizza/Apri
2025_10_Tempestilli_Executive_Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 13.36 MB
Formato Adobe PDF
13.36 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/243903