Modeling HCPAP therapy outcome prediction in ARDS patients via large language models

Acute Respiratory Distress Syndrome (ARDS) is one of the main causes of respiratory failure in intensive care patients, requiring targeted ventilatory strategies to optimize oxygenation and reduce the risk of intubation. Among these, non-invasive ventilation using the helmet interface (Helmet-CPAP) represents an effective and widely adopted approach, though not without the risk of failure, often associated with heterogeneous clinical and physiological conditions. This study, based on clinical data from Vimercate Hospital, aimed to develop and compare predictive models to estimate the probability of Helmet-CPAP therapy failure in patients affected by ARDS. The analyzed dataset, consisting of 685 patients and 32 clinical variables, integrates demographic, physiological, laboratory, and clinical information. All data underwent a thorough cleaning, harmonization, and normalization process, followed by a stratified split into a training set (70\%) and a test set (30\%), preserving the class distribution. The analysis confirmed the imbalanced nature of the dataset, with a predominance of successful outcomes (72.99\%) compared to therapy failures (27.01\%). Among supervised Machine Learning models, XGBoost achieved the best performance, with an F1-score of 97.39\%, demonstrating high stability and generalization capability. In parallel, among Large Language Models (LLMs), GPT-OSS-20B (ReHigh) emerged as the most effective in the few-shot configuration, reaching an F1-score of 79.77\% and showing strong clinical consistency in text-based predictions. Overall, this work confirms the effectiveness of the proposed predictive models and includes an interpretative analysis of the most influential clinical features, identified as key determinants of Helmet-CPAP therapy outcomes.

La sindrome da distress respiratorio acuto (ARDS) rappresenta una delle principali cause di insufficienza respiratoria nei pazienti ricoverati in terapia intensiva, richiedendo strategie ventilatorie mirate per ottimizzare l’ossigenazione e ridurre il rischio di intubazione. Tra queste, la ventilazione non invasiva con casco (Helmet-CPAP) costituisce un approccio efficace e ampiamente utilizzato, ma non privo di rischio di fallimento, spesso associato a condizioni cliniche e fisiologiche eterogenee. Il presente studio, condotto su dati clinici provenienti dall’Ospedale di Vimercate, si propone di sviluppare e confrontare modelli predittivi per stimare la probabilità di fallimento della terapia Helmet-CPAP nei pazienti affetti da ARDS. Il dataset analizzato, composto da 685 pazienti e 32 variabili cliniche, integra informazioni anagrafiche, fisiologiche, laboratoristiche e cliniche. Tutti i dati sono stati sottoposti a un accurato processo di pulizia, armonizzazione e normalizzazione, quindi suddivisi in modo stratificato in un training set (70\%) e un test set (30\%), preservando la distribuzione delle classi. L’analisi ha confermato uno sbilanciamento del campione, con una prevalenza di successi terapeutici (72,99\%) rispetto ai fallimenti (27,01\%) della Helmet-CPAP. Tra i modelli di Machine Learning supervisionato, XGBoost ha mostrato le migliori prestazioni, con un F1-score del 97,39\%, dimostrando un’elevata stabilità e capacità di generalizzazione. Parallelamente, tra i modelli linguistici di grandi dimensioni (LLM), GPT-OSS-20B (ReHigh) si è distinto come il più performante nella configurazione few-shot, raggiungendo un F1-score del 79,77\% e mostrando un’elevata coerenza clinica nelle predizioni testuali. Nel complesso, il lavoro conferma l’efficacia dei modelli predittivi proposti e include un’analisi interpretativa delle variabili cliniche più rilevanti, individuate come maggiormente determinanti per l’esito della terapia Helmet-CPAP.