Acute myeloid leukemia (AML) is the most common leukemia in the adult population and accounts for around 30% of all cases and almost 50% of all leukemia-related deaths. Around 30% of newly diagnosed cases present a mutation in the FLT3 gene, which is associated with a poorer prognosis, but also with targeted therapies. However, identification of the FLT3 mutation sometimes occurs after the treatment has started, thereby impeding a more informed therapeutic decision. In this thesis, we aim to develop learning-based methods to handle flow cytometry data obtained at diagnosis and to predict the presence of the FLT3 mutation from them. Flow cytometry consists of profiling immune cells individually by their size, complexity, and expression in some surface markers. However, the heterogeneity and high dimensionality of these data make their analysis challenging. Existing approaches aim at either identifying cell populations or predicting a leukemia diagnosis. They require robust data preparation and sometimes dimensionality reduction. In this thesis, we address two main issues. First, we implement a semi-automated method for cleaning flow cytometry data based on self-organizing maps. It improves the efficiency and robustness of the process, beyond the manual cleaning usually performed by the clinicians. Then, we propose a deep convolutional neural network for predicting the presence of the FLT3 mutation. We also study how some settings like the number of cells or the cleaning can affect the performance of the network. Our pipeline has the potential to serve as a starting point for the development of a fully automated algorithm for flow cytometry data cleaning and could be the beginning of the development of a fast and automated tool to detect FLT3 mutations directly from routine on the day of diagnosis.

La leucemia mieloide acuta (AML) è la leucemia più comune nella popolazione adulta e rappresenta circa l’30% di tutti i casi e quasi il 50% di tutte le morti di leucemia. Circa il 30% dei nuovi casi diagnosticati presenta una mutazione nel gene FLT3, che è associata a una prognosi peggiore, ma anche a terapie mirate. Rilevare questa mutazione è quindi cruciale per le decisioni di trattamento precoci nell’AML. Tuttavia, l’identificazione della mutazione FLT3 avviene talvolta dopo l’inizio del trattamento, impedendo così una decisione terapeutica più consapevole. In questa tesi, ci proponiamo di sviluppare metodi basati sull’apprendimento automatico per gestire i dati della citometria a flusso ottenuti al momento della diagnosi e per prevedere la presenza della mutazione FLT3. La citometria a flusso consiste nel profilare le cellule immunitarie singolarmente in base alle loro dimensioni, alla loro complessità e all’espressione di alcuni marcatori di superficie. Tuttavia, l’eterogeneità e l’alta dimensionalità di questi dati rendono la loro analisi impegnativa. Gli approcci esistenti mirano all’identificazione delle popolazioni cellulari o alla previsione di una diagnosi di leucemia. Richiedono una robusta preparazione dei dati e talvolta una riduzione della dimensionalità. In questo lavoro affrontiamo due question principali. In primo luogo, implementiamo un metodo semi-automatico per la pulizia dei dati di citometria a flusso basato su mappe auto-organizzanti. Questo migliora l’efficienza e la robustezza del processo, oltre alla pulizia manuale solitamente eseguita dai clinici. Successivamente, proponiamo una rete neurale convoluzionale profonda per prevedere la presenza della mutazione FLT3. Studiamo anche come alcune impostazioni, come il numero di cellule o la pulizia dei dati, possano influenzare le prestazioni della rete. Questo lavoro ha il potenziale per servire come punto di partenza per lo sviluppo di un algoritmo completamente automatizzato per la pulizia dei dati di citometria a flusso e potrebbe essere l’inizio dello sviluppo di uno strumento rapido e automatico per rilevare le mutazioni FLT3 direttamente il giorno della diagnosi.

Deep learning approaches for FLT3 gene mutation prediction in Acute Myeloid Leukemia

Paleari, Camilla
2022/2023

Abstract

Acute myeloid leukemia (AML) is the most common leukemia in the adult population and accounts for around 30% of all cases and almost 50% of all leukemia-related deaths. Around 30% of newly diagnosed cases present a mutation in the FLT3 gene, which is associated with a poorer prognosis, but also with targeted therapies. However, identification of the FLT3 mutation sometimes occurs after the treatment has started, thereby impeding a more informed therapeutic decision. In this thesis, we aim to develop learning-based methods to handle flow cytometry data obtained at diagnosis and to predict the presence of the FLT3 mutation from them. Flow cytometry consists of profiling immune cells individually by their size, complexity, and expression in some surface markers. However, the heterogeneity and high dimensionality of these data make their analysis challenging. Existing approaches aim at either identifying cell populations or predicting a leukemia diagnosis. They require robust data preparation and sometimes dimensionality reduction. In this thesis, we address two main issues. First, we implement a semi-automated method for cleaning flow cytometry data based on self-organizing maps. It improves the efficiency and robustness of the process, beyond the manual cleaning usually performed by the clinicians. Then, we propose a deep convolutional neural network for predicting the presence of the FLT3 mutation. We also study how some settings like the number of cells or the cleaning can affect the performance of the network. Our pipeline has the potential to serve as a starting point for the development of a fully automated algorithm for flow cytometry data cleaning and could be the beginning of the development of a fast and automated tool to detect FLT3 mutations directly from routine on the day of diagnosis.
DENIS DE SENNEVILLE, BAUDOUIN
ETCHGARAY, CHRISTÈLE
PAPADAKIS, NICOLAS
ING - Scuola di Ingegneria Industriale e dell'Informazione
9-apr-2024
2022/2023
La leucemia mieloide acuta (AML) è la leucemia più comune nella popolazione adulta e rappresenta circa l’30% di tutti i casi e quasi il 50% di tutte le morti di leucemia. Circa il 30% dei nuovi casi diagnosticati presenta una mutazione nel gene FLT3, che è associata a una prognosi peggiore, ma anche a terapie mirate. Rilevare questa mutazione è quindi cruciale per le decisioni di trattamento precoci nell’AML. Tuttavia, l’identificazione della mutazione FLT3 avviene talvolta dopo l’inizio del trattamento, impedendo così una decisione terapeutica più consapevole. In questa tesi, ci proponiamo di sviluppare metodi basati sull’apprendimento automatico per gestire i dati della citometria a flusso ottenuti al momento della diagnosi e per prevedere la presenza della mutazione FLT3. La citometria a flusso consiste nel profilare le cellule immunitarie singolarmente in base alle loro dimensioni, alla loro complessità e all’espressione di alcuni marcatori di superficie. Tuttavia, l’eterogeneità e l’alta dimensionalità di questi dati rendono la loro analisi impegnativa. Gli approcci esistenti mirano all’identificazione delle popolazioni cellulari o alla previsione di una diagnosi di leucemia. Richiedono una robusta preparazione dei dati e talvolta una riduzione della dimensionalità. In questo lavoro affrontiamo due question principali. In primo luogo, implementiamo un metodo semi-automatico per la pulizia dei dati di citometria a flusso basato su mappe auto-organizzanti. Questo migliora l’efficienza e la robustezza del processo, oltre alla pulizia manuale solitamente eseguita dai clinici. Successivamente, proponiamo una rete neurale convoluzionale profonda per prevedere la presenza della mutazione FLT3. Studiamo anche come alcune impostazioni, come il numero di cellule o la pulizia dei dati, possano influenzare le prestazioni della rete. Questo lavoro ha il potenziale per servire come punto di partenza per lo sviluppo di un algoritmo completamente automatizzato per la pulizia dei dati di citometria a flusso e potrebbe essere l’inizio dello sviluppo di uno strumento rapido e automatico per rilevare le mutazioni FLT3 direttamente il giorno della diagnosi.
File allegati
File Dimensione Formato  
2024_04_Paleari_Tesi_01.pdf

non accessibile

Dimensione 19.2 MB
Formato Adobe PDF
19.2 MB Adobe PDF   Visualizza/Apri
2024_04_Paleari_Executive_Summary_02.pdf

non accessibile

Dimensione 7.48 MB
Formato Adobe PDF
7.48 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/219221