A controllable and flexible multiple instance learning framework for explainable digital pathology using cell-level features

Computational pathology using artificial intelligence has transformed histopathological analysis, yet the dominant patch-based Multiple Instance Learning (MIL) paradigm faces critical limitations: black-box predictions lack clinical interpretability, foundation models offer limited controllability for incorporating domain knowledge, and opacity challenges validation in high-stakes medical decisions. This thesis addresses these limitations by proposing a controllable and flexible MIL framework operating at the cell level. Leveraging instance segmentation, we extract morphological, radiomic, and topological features from individual cell nuclei in H&E-stained tissue, providing biological interpretability, controllability through explicit feature selection, and explainability by tracing predictions to specific cells and morphological patterns. We validate the framework on immunotherapy response and survival prediction for non-small cell lung cancer (NSCLC) patients using the I3LUNG dataset. Cell-based models in the INT dataset (343 WSIs) achieve competitive performance compared to patch-based baselines using foundation models (Prov-GigaPath and UNI2-h), with cell-based CLAM achieving the best F1 scores for disease control rate (0.614±0.049) and 24-month overall survival (0.629±0.048). External validation on an independent cohort from the University of Chicago reveals that, despite underperforming internally, topological features generalise substantially better for certain tasks, achieving balanced accuracies of 0.694 for 6-month survival and 0.625 for disease control rate, substantially outperforming patch-based methods. Explainability analysis using attention heatmaps and SHAP values reveals that texture-based features drive histological subtyping, while morphological characteristics dominate survival prediction, enabling domain expert validation. These results demonstrate that interpretable cell-based approaches match foundation models' performance while providing equivalent or even superior generalisation alongside the clinical transparency necessary for deployment.

Negli ultimi anni, la patologia computazionale combinata con metodi di intelligenza artificiale ha trasformato l’analisi delle immagini istopatologiche. Tuttavia, ad oggi, il paradigma dominante di Multiple Instance Learning (MIL) basato su patch presenta limitazioni rilevanti: le predizioni risultano essere black-box, con scarsa interpretabilità clinica; i modelli fondazionali sono poco adatti ad integrare la conoscenza di dominio; vi sono evidenti difficoltà di validazione in contesti medici ad alto rischio. Questa tesi affronta tali limiti proponendo un framework MIL controllabile e flessibile che sfrutta le informazioni istopatologiche a livello cellulare. Tale approccio, attraverso la segmentazione delle cellule presenti nell'immagine, estrae caratteristiche morfologiche, radiomiche e topologiche dai nuclei cellulari in tessuti H&E, garantendo interpretabilità biologica, selezione esplicita delle feature ed un'interpretazione facilitata mediante il tracciamento delle predizioni a cellule e pattern morfologici specifici. Il framework è stato validato su task di predizione della risposta all’immunoterapia e della sopravvivenza in pazienti con Non-Small-Cell Lung Cancer (NSCLC) utilizzando un dataset proveniente dal progetto I3LUNG. I modelli cell-based sul dataset dell'Istituto Nazionale Tumori (INT, 343 slide) ottengono prestazioni competitive rispetto ai baseline patch-based basati su modelli fondazionali (i.e., Prov-GigaPath e UNI2-h). L'approccio proposto, abbinato al modello di predizione CLAM, raggiunge il miglior F1 score per il task di predizione del disease control rate (0.614±0.049) e quello di sopravvivenza globale a 24 mesi (0.629±0.048). La validazione esterna su una coorte indipendente dell’University Of Chicago (UOC) mostra che le feature topologiche generalizzano meglio per determinati compiti, ottenendo accuratezze bilanciate di 0.694 per la sopravvivenza a 6 mesi e 0.625 per il disease control rate, superando i metodi patch-based. L’analisi di interpretabilità tramite attention map e valori SHAP evidenzia il ruolo delle feature di texture nella sottotipizzazione istologica e delle caratteristiche morfologiche nella predizione della sopravvivenza, a supporto della validazione da parte di esperti.