The need to simplify, structure, and operationally characterize complex biological processes is essential for a deeper understanding of these systems. While machine learning has seen increasing applications in various biological domains, lipidomics remains relatively under-explored. In this study, we introduce LipiMap, a Variational Autoencoder tailored specifically for the analysis of lipidomic data. LipiMap learns a probabilistic mapping into a biologically informed latent space by leveraging Lipid Programs (LPs), elementary units designed to reflect the behaviour of biological modules that govern lipid metabolism, a process known for its remarkable complexity. The model’s ability to infer the activity of these programs is guided by integrating domain knowledge from well-established lipid databases and metabolic network tools, ensuring that the results are firmly grounded in biological foundations. After presenting the model's architecture and the technical strategies employed to enhance its performance, LipiMap shows favourable results when compared to traditional benchmarking methods, while introducing a crucial layer of interpretability specific to neuronal lipid metabolism. Finally, we explore the potential applications of LipiMap and propose technical refinements that promise to further improve its functionality.

La necessità di semplificare, strutturare e caratterizzare operativamente i processi biologici complessi è essenziale per una comprensione più approfondita di questi sistemi. Sebbene il machine learning abbia visto applicazioni sempre più diffuse in vari ambiti biologici, la lipidomica rimane relativamente poco esplorata. In questo studio, introduciamo LipiMap, un Autoencoder Variazionale progettato specificamente per l'analisi dei dati lipidomici. LipiMap apprende una mappatura probabilistica in uno spazio latente biologicamente informato sfruttando i Programmi Lipidici (LPs), unità elementari progettate per riflettere il comportamento dei moduli biologici che regolano il metabolismo lipidico, un processo noto per la sua straordinaria complessità. La capacità del modello di inferire l'attività di questi programmi è guidata dall'integrazione di conoscenze provenienti da database lipidici ben consolidati e strumenti di network metabolici, garantendo che i risultati siano saldamente radicati nelle basi biologiche. Dopo aver presentato l'architettura del modello e le strategie tecniche impiegate per migliorarne le prestazioni, LipiMap mostra risultati favorevoli rispetto ai metodi di benchmarking tradizionali, introducendo al contempo un importante livello di interpretabilità specifico per il metabolismo lipidico neuronale. Infine, esploriamo le potenziali applicazioni di LipiMap e proponiamo affinamenti tecnici che promettono di migliorarne ulteriormente la funzionalità.

LipiMap: Biologically-Informed Variational Autoencoder Reveals Lipid Metabolic Modules in the Brain

VENTURI, FRANCESCA
2023/2024

Abstract

The need to simplify, structure, and operationally characterize complex biological processes is essential for a deeper understanding of these systems. While machine learning has seen increasing applications in various biological domains, lipidomics remains relatively under-explored. In this study, we introduce LipiMap, a Variational Autoencoder tailored specifically for the analysis of lipidomic data. LipiMap learns a probabilistic mapping into a biologically informed latent space by leveraging Lipid Programs (LPs), elementary units designed to reflect the behaviour of biological modules that govern lipid metabolism, a process known for its remarkable complexity. The model’s ability to infer the activity of these programs is guided by integrating domain knowledge from well-established lipid databases and metabolic network tools, ensuring that the results are firmly grounded in biological foundations. After presenting the model's architecture and the technical strategies employed to enhance its performance, LipiMap shows favourable results when compared to traditional benchmarking methods, while introducing a crucial layer of interpretability specific to neuronal lipid metabolism. Finally, we explore the potential applications of LipiMap and propose technical refinements that promise to further improve its functionality.
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-ott-2024
2023/2024
La necessità di semplificare, strutturare e caratterizzare operativamente i processi biologici complessi è essenziale per una comprensione più approfondita di questi sistemi. Sebbene il machine learning abbia visto applicazioni sempre più diffuse in vari ambiti biologici, la lipidomica rimane relativamente poco esplorata. In questo studio, introduciamo LipiMap, un Autoencoder Variazionale progettato specificamente per l'analisi dei dati lipidomici. LipiMap apprende una mappatura probabilistica in uno spazio latente biologicamente informato sfruttando i Programmi Lipidici (LPs), unità elementari progettate per riflettere il comportamento dei moduli biologici che regolano il metabolismo lipidico, un processo noto per la sua straordinaria complessità. La capacità del modello di inferire l'attività di questi programmi è guidata dall'integrazione di conoscenze provenienti da database lipidici ben consolidati e strumenti di network metabolici, garantendo che i risultati siano saldamente radicati nelle basi biologiche. Dopo aver presentato l'architettura del modello e le strategie tecniche impiegate per migliorarne le prestazioni, LipiMap mostra risultati favorevoli rispetto ai metodi di benchmarking tradizionali, introducendo al contempo un importante livello di interpretabilità specifico per il metabolismo lipidico neuronale. Infine, esploriamo le potenziali applicazioni di LipiMap e proponiamo affinamenti tecnici che promettono di migliorarne ulteriormente la funzionalità.
File allegati
File Dimensione Formato  
2024_10_Venturi_Tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Final Thesis
Dimensione 48.73 MB
Formato Adobe PDF
48.73 MB Adobe PDF   Visualizza/Apri
2024_10_Venturi_ExecutiveSummary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Final Executive Summary
Dimensione 10.22 MB
Formato Adobe PDF
10.22 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/226393