The purpose of this dissertation is to investigate MALDI-MSI (Matrix Assisted Laser Desorption Ionization Mass Spectrometry Imaging) data from benign and malignant nodule thyroid samples. The project establishes a collaboration amongs Politecnico di Milano (PoliMi), Università degli Studi di Milano-Bicocca (UniMiB), San Gerardo Hospital in Monza (MB) and Conservatoire National des Arts et Métiers (CNAM) in Paris. First data have been collected under suitable experimental conditions and setting. Consequently a pre-processing step has been carried out to obtain tabular data from raw spectra. Exploratory data analysis involving unsupervised learning and dimensionality reduction has been performed to find out hidden patterns and features to keep in mind in the following analysis. In a second stage microarray game theory analysis has been performed. The overall modelling problem deals with the discovery of strategically important proteins responsibie for the onset of tumour. Throughout this work ad-hoc voting mechanisms in game theory has been introduced to overcome some issues. To check the reliability of such game-theoretic techniques, some statistical tests have been employed and compared to the previous methods. The final task of the dissertation consists of developing machine learning and deep-learning algorithms available in literature to classify benign and malignant samples. In particular models and methods have been adapted to the available data by including information retrieved in the first steps of the thesis. Finally to support a decision-making process in the medical domain some explainability techniques in AI have been treated.

Lo scopo di questa tesi è quello di analizzare dati ottenuti da esperimenti di tipo MALDI-MSI (Matrix Assisted Laser Desorption Ionization Mass Spectrometry Imaging) su campioni di noduli tiroidei benigni e maligni. Il progetto è il frutto di una sinergica collaborazione tra il Politecnico di Milano (PoliMi), l'Università degli Studi di Milano-Bicocca (UniMiB), l'Ospedale San Gerardo di Monza (MB) e il Conservatoire National des Arts et Métiers (CNAM) di Parigi. Nella prima parte di questo lavoro si è studiato l'apparato strumentale che ha permesso la raccolta dei dati. Successivamente attraverso tecniche di pre-processing si è passati da dati "grezzi" di natura spettrale a dati tabulari. E' stata poi fatta un'analisi esplorativa che ha coinvolto apprendimento non supervisionato e riduzione dimensionale per capire se potevano emergere in questa prima fase aspetti interessanti da tenere in considerazione. Nella seconda parte si modellizza invece l'esperimento con i cosiddetti giochi di microarray cercando di individuare le proteine strategicamente importanti nell'attivazione del tumore. E' stato poi esteso il modello a un metodo di voto costruito ad-hoc per far fronte a limiti di natura sperimentale. Per completezza sono stati fatti dei test statistici per valutare l'affidabilità delle tecniche di teoria dei giochi cooperativa. Infine vengo applicati algoritmi di machine learning e deep-learning per classificare correttamente pazienti con tumore benigno e maligno. In particolare i modelli e le architetture usate sono adattati ai dati sottostanti tenendo conto delle informazioni ottenute nelle fasi precedenti della tesi. Per concludere fornendo un supporto decisionale nel dominio medico-biologico sono discusse tecniche di spiegabilità nell'intelligenza artificiale.

Game-theoretic modelling in MALDI-MSI data analysis

LAVATORI, FEDERICO
2018/2019

Abstract

The purpose of this dissertation is to investigate MALDI-MSI (Matrix Assisted Laser Desorption Ionization Mass Spectrometry Imaging) data from benign and malignant nodule thyroid samples. The project establishes a collaboration amongs Politecnico di Milano (PoliMi), Università degli Studi di Milano-Bicocca (UniMiB), San Gerardo Hospital in Monza (MB) and Conservatoire National des Arts et Métiers (CNAM) in Paris. First data have been collected under suitable experimental conditions and setting. Consequently a pre-processing step has been carried out to obtain tabular data from raw spectra. Exploratory data analysis involving unsupervised learning and dimensionality reduction has been performed to find out hidden patterns and features to keep in mind in the following analysis. In a second stage microarray game theory analysis has been performed. The overall modelling problem deals with the discovery of strategically important proteins responsibie for the onset of tumour. Throughout this work ad-hoc voting mechanisms in game theory has been introduced to overcome some issues. To check the reliability of such game-theoretic techniques, some statistical tests have been employed and compared to the previous methods. The final task of the dissertation consists of developing machine learning and deep-learning algorithms available in literature to classify benign and malignant samples. In particular models and methods have been adapted to the available data by including information retrieved in the first steps of the thesis. Finally to support a decision-making process in the medical domain some explainability techniques in AI have been treated.
SECCI, STEFANO
MORETTI, STEFANO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2019
2018/2019
Lo scopo di questa tesi è quello di analizzare dati ottenuti da esperimenti di tipo MALDI-MSI (Matrix Assisted Laser Desorption Ionization Mass Spectrometry Imaging) su campioni di noduli tiroidei benigni e maligni. Il progetto è il frutto di una sinergica collaborazione tra il Politecnico di Milano (PoliMi), l'Università degli Studi di Milano-Bicocca (UniMiB), l'Ospedale San Gerardo di Monza (MB) e il Conservatoire National des Arts et Métiers (CNAM) di Parigi. Nella prima parte di questo lavoro si è studiato l'apparato strumentale che ha permesso la raccolta dei dati. Successivamente attraverso tecniche di pre-processing si è passati da dati "grezzi" di natura spettrale a dati tabulari. E' stata poi fatta un'analisi esplorativa che ha coinvolto apprendimento non supervisionato e riduzione dimensionale per capire se potevano emergere in questa prima fase aspetti interessanti da tenere in considerazione. Nella seconda parte si modellizza invece l'esperimento con i cosiddetti giochi di microarray cercando di individuare le proteine strategicamente importanti nell'attivazione del tumore. E' stato poi esteso il modello a un metodo di voto costruito ad-hoc per far fronte a limiti di natura sperimentale. Per completezza sono stati fatti dei test statistici per valutare l'affidabilità delle tecniche di teoria dei giochi cooperativa. Infine vengo applicati algoritmi di machine learning e deep-learning per classificare correttamente pazienti con tumore benigno e maligno. In particolare i modelli e le architetture usate sono adattati ai dati sottostanti tenendo conto delle informazioni ottenute nelle fasi precedenti della tesi. Per concludere fornendo un supporto decisionale nel dominio medico-biologico sono discusse tecniche di spiegabilità nell'intelligenza artificiale.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
main_dir.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 2.11 MB
Formato Adobe PDF
2.11 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152423