Existing clustering methods for functional data often prioritize partitioning accuracy over interpretability, making it challenging to extract meaningful insights when the data-generating process follows a specific underlying structure and an ordinal relationship among clusters is suspected. This thesis introduces K-Models, a novel framework that integrates ordinal constraints and estimates key underlying elements of the random process generating the observed curves, improving both interpretability and structure identification. Two versions of K-Models are proposed and evaluated through simulations and real-world applications. In particular, the method is tested on Region of Interest (ROI) curves, which represent reaction profiles from a reflectometric sensor monitoring biological interactions, such as antigen-antibody binding. These curves capture temporal variations in light intensity observed in a 3D bioprinting experimental setup, reflecting the evolution of reactions over time. The goal is to identify intrinsic signal patterns solely from the observed dynamics, making this dataset an ideal benchmark for assessing the added interpretability of the proposed approach. By incorporating structural assumptions into the clustering process, K-Models enhances interpretability while maintaining performance comparable to state-of-the-art techniques, providing a valuable tool for analyzing functional data with an underlying ordinal structure.
I metodi di clustering per dati funzionali tendono spesso a privilegiare l'accuratezza della partizione a scapito dell'interpretabilità, rendendo difficile estrarre informazioni significative quando il processo generativo dei dati segue una struttura sottostante specifica e si sospetta una relazione ordinale tra i gruppi. Questa tesi introduce il K-Models, un nuovo metodo che integra vincoli ordinali e stima gli elementi chiave del processo che genera le curve osservate, migliorando sia l'interpretabilità che l'identificazione della struttura dei dati. Vengono proposte due varianti del K-Models, valutate attraverso simulazioni e applicazioni su dati reali. In particolare, il metodo viene testato su curve di Region of Interest (ROI), che rappresentano profili di reazione acquisiti da un sensore reflectometrico utilizzato per monitorare interazioni biologiche, di tipo antigene-anticorpo. Queste curve catturano le variazioni temporali nell'intensità luminosa in un esperimento di bioprinting 3D, riflettendo l'evoluzione delle reazioni nel tempo. L'obiettivo è identificare pattern intrinseci nei segnali esclusivamente a partire dalla loro dinamica osservata, rendendo questo dataset un caso di studio ideale per valutare il contributo interpretativo del nuovo metodo proposto. Incorporando assunzioni strutturali nel processo di clustering, il K-Models migliora l’interpretabilità dei risultati, mantenendo al contempo prestazioni comparabili alle tecniche già esistenti in letteratura ed offrendo uno strumento utile per l'analisi di dati funzionali con una struttura ordinale sottostante.
An interpretable ordinal clustering for functional data with an application to antigen reaction profiles
GANELLI, ALESSANDRO
2023/2024
Abstract
Existing clustering methods for functional data often prioritize partitioning accuracy over interpretability, making it challenging to extract meaningful insights when the data-generating process follows a specific underlying structure and an ordinal relationship among clusters is suspected. This thesis introduces K-Models, a novel framework that integrates ordinal constraints and estimates key underlying elements of the random process generating the observed curves, improving both interpretability and structure identification. Two versions of K-Models are proposed and evaluated through simulations and real-world applications. In particular, the method is tested on Region of Interest (ROI) curves, which represent reaction profiles from a reflectometric sensor monitoring biological interactions, such as antigen-antibody binding. These curves capture temporal variations in light intensity observed in a 3D bioprinting experimental setup, reflecting the evolution of reactions over time. The goal is to identify intrinsic signal patterns solely from the observed dynamics, making this dataset an ideal benchmark for assessing the added interpretability of the proposed approach. By incorporating structural assumptions into the clustering process, K-Models enhances interpretability while maintaining performance comparable to state-of-the-art techniques, providing a valuable tool for analyzing functional data with an underlying ordinal structure.File | Dimensione | Formato | |
---|---|---|---|
2025_4_Ganelli_Tesi.pdf
accessibile in internet per tutti
Descrizione: Testo della tesi
Dimensione
14.67 MB
Formato
Adobe PDF
|
14.67 MB | Adobe PDF | Visualizza/Apri |
2025_4_Ganelli_Executive Summary.pdf
accessibile in internet per tutti
Descrizione: Testo dell'Executive Summary
Dimensione
2.57 MB
Formato
Adobe PDF
|
2.57 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/236026