Preterm infants comprise about 11% of newborns, and the reduced mortality rate makes the optimization of their clinical management a priority. These infants are at high risk of postnatal growth failure during hospitalization, which leads to extrauterine growth restriction (EUGR). This condition is caused by the complex interaction of many antenatal, neonatal, and clinical factors, including periods of suboptimal nutrition. The transitional nutrition (TN) phase, which involves weaning from parenteral nutrition (i.e., intravenous administration of nutrients), is particularly critical, as it lacks specific guidelines and is associated with nutrient deficits. Since the interplay and relative importance of variables affecting growth is still unclear, the aim of this work is to identify the main factors affecting EUGR applying supervised learning and explanability techniques to the data of a neonatal intensive care unit (NICU) database. Clinical data, including daily actual nutrient intakes and anonymized patient information, were extracted from San Gerardo hospital for 1165 preterm infants. The raw data was cleaned and processed to obtain a dataset that included prenatal, perinatal, and clinical factors, as well as variables describing patients' early nutrition and TN phase. Binary classification models were built to predict EUGR, using different subsets of features and patients. First, the performance of three models using (1) all features, (2) nutrition features only, and (3) prenatal and perinatal features only was compared to assess the predictive quality of nutrition variables. The accuracy of these models on the test set was 77%, 72%, and 59%, respectively. Then, models using all predictors and nutrition features only were trained on four subsets of the patients, namely moderate to late preterm (MLP), very preterm (VPT), extremely preterm (EPT), and small for gestational age (SGA) infants, achieving comparable performances to the models with all patients. The SHapley Additive exPlanations (SHAP) technique was used to identify the most important factors contributing to EUGR for all models. For all the patients datasets, high predictive power was observed for growth velocity during the first week and nutrition variables related to the first week and the first 24 hours of life, highlighting the importance of early interventions for preterm infants. Conversely, TN phase-related variables were more frequently observed in EPT and SGA infants, suggesting that the TN phase may have a greater impact on these patients. Differences in relative importance were observed for some risk factors, including gender and sepsis, across different subsets of patients. This study shows the significant role of the selected nutrition variables in predicting EUGR. Better insights into the most important TN practices and risk factors in EUGR could be obtained by building classification models on different subsets of infants separately. To this purpose, the use of supervised learning on NICU databases containing actual nutrient intakes holds promise for advancing understanding of EUGR and optimizing clinical management strategies.

I neonati prematuri costituiscono circa l'11% dei nati, e la riduzione del tasso di mortalità rende l'ottimizzazione della loro gestione clinica una priorità. Questi neonati sono ad alto rischio di insufficienza di crescita postnatale durante l'ospedalizzazione, che porta ad un ritardo di crescita extrauterina. Questa condizione è causata dall'interazione complessa di molti fattori prenatali, neonatali e clinici, compresi periodi di nutrizione non ottimale. La fase di nutrizione transitoria, che coincide con lo svezzamento dalla nutrizione parenterale (cioè la somministrazione di nutrienti per via endovenosa), è particolarmente critica, ed è associata a carenze nutrizionali, poiché non esistono delle linee guida specifiche. Dato che l'interazione e l'importanza relativa delle variabili che influenzano la crescita non sono ancora chiare, lo scopo di questo lavoro è identificare i principali fattori che si associano al ritardo di crescita extrauterina applicando tecniche di apprendimento supervisionato e di interpretabilità a dati di un database di terapia intensiva neonatale. I dati clinici anonimizzati di 1165 neonati prematuri sono stati estratti dall'ospedale San Gerardo, incluse le quantità effettive giornaliere di nutrienti somministrati. I dati grezzi sono stati puliti e processati per ottenere una matrice predittiva che includeva fattori prenatali, perinatali e clinici, insieme a variabili che descrivevano la nutrizione precoce dei pazienti e la fase TN. Sono stati costruiti modelli di classificazione binaria per prevedere il ritardo di crescita extrauterina, utilizzando diversi sottoinsiemi di variabili e pazienti. Inizialmente, per valutare la qualità predittiva delle variabili nutrizionali, sono state confrontate le prestazioni di tre modelli che utilizzavano rispettivamente (1) tutte le variabili, (2) solo quelle relative alla nutrizione, e (3) solo quelle relative a fattori prenatali e perinatali. L'accuratezza ottenuta da questi modelli sul set di testing era del 77%, 72% e 59%, rispettivamente. Successivamente, sono stati allenati modelli che utilizzavano tutte le variabili e solo quelle relative alla nutrizione su quattro sottoinsiemi di pazienti, ovvero neonati con prematurità moderata o tardiva (MLP), neonati molto prematuri (VPT), neonati estremamente prematuri (EPT) e neonati piccoli per età gestazionale (SGA). Questi modelli hanno ottenuto prestazioni comparabili a quelli con tutti i pazienti. La tecnica SHapley Additive exPlanations (SHAP) è stata utilizzata su tutti i modelli per identificare i fattori più importanti che contribuiscono il ritardo di crescita extrauterina. La velocità di crescita durante la prima settimana e le variabili nutrizionali relative alla prima settimana e alle prime 24 ore di vita hanno mostrato un'alta capacità predittiva per tutti i gruppi di pazienti, evidenziando l'importanza del trattamento precoce dei neonati prematuri. Al contrario, le variabili relative alla fase TN sono state osservate più frequentemente nei sottogruppi, in particolare nei neonati EPT e SGA. Questo suggerisce che la fase TN abbia un impatto maggiore su questi pazienti. Sono state osservate differenze tra i diversi sottoinsiemi di pazienti nell'importanza relativa di alcuni fattori di rischio, inclusi il sesso e la sepsi. Questo studio mostra che le variabili nutrizionali selezionate hanno un ruolo significativo nella predizione del ritardo di crescita extrauterina. Allenare separatamente modelli di classificazione su sottoinsiemi diversi di neonati potrebbe permettere di migliorare la conoscenza sulle pratiche nutrizionali nella fase TN e sui fattori di rischio del ritardo di crescita extrauterina. A questo scopo, l'utilizzo dell'apprendimento supervisionato sui database di terapia intensiva neonatale, che contengono informazioni sulle quantità effettive di nutrienti somministrati, potrebbe contribuire ad approfondire la conoscenza sul ritardo di crescita extrauterina e a ottimizzare le strategie di gestione clinica.

Identification of the factors affecting growth during weaning from parenteral nutrition of preterm infants: a retrospective study based on a NICU database

Riccò, Silvia
2021/2022

Abstract

Preterm infants comprise about 11% of newborns, and the reduced mortality rate makes the optimization of their clinical management a priority. These infants are at high risk of postnatal growth failure during hospitalization, which leads to extrauterine growth restriction (EUGR). This condition is caused by the complex interaction of many antenatal, neonatal, and clinical factors, including periods of suboptimal nutrition. The transitional nutrition (TN) phase, which involves weaning from parenteral nutrition (i.e., intravenous administration of nutrients), is particularly critical, as it lacks specific guidelines and is associated with nutrient deficits. Since the interplay and relative importance of variables affecting growth is still unclear, the aim of this work is to identify the main factors affecting EUGR applying supervised learning and explanability techniques to the data of a neonatal intensive care unit (NICU) database. Clinical data, including daily actual nutrient intakes and anonymized patient information, were extracted from San Gerardo hospital for 1165 preterm infants. The raw data was cleaned and processed to obtain a dataset that included prenatal, perinatal, and clinical factors, as well as variables describing patients' early nutrition and TN phase. Binary classification models were built to predict EUGR, using different subsets of features and patients. First, the performance of three models using (1) all features, (2) nutrition features only, and (3) prenatal and perinatal features only was compared to assess the predictive quality of nutrition variables. The accuracy of these models on the test set was 77%, 72%, and 59%, respectively. Then, models using all predictors and nutrition features only were trained on four subsets of the patients, namely moderate to late preterm (MLP), very preterm (VPT), extremely preterm (EPT), and small for gestational age (SGA) infants, achieving comparable performances to the models with all patients. The SHapley Additive exPlanations (SHAP) technique was used to identify the most important factors contributing to EUGR for all models. For all the patients datasets, high predictive power was observed for growth velocity during the first week and nutrition variables related to the first week and the first 24 hours of life, highlighting the importance of early interventions for preterm infants. Conversely, TN phase-related variables were more frequently observed in EPT and SGA infants, suggesting that the TN phase may have a greater impact on these patients. Differences in relative importance were observed for some risk factors, including gender and sepsis, across different subsets of patients. This study shows the significant role of the selected nutrition variables in predicting EUGR. Better insights into the most important TN practices and risk factors in EUGR could be obtained by building classification models on different subsets of infants separately. To this purpose, the use of supervised learning on NICU databases containing actual nutrient intakes holds promise for advancing understanding of EUGR and optimizing clinical management strategies.
BOZZETTI, VALENTINA
DUI, LINDA GRETA
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-mag-2023
2021/2022
I neonati prematuri costituiscono circa l'11% dei nati, e la riduzione del tasso di mortalità rende l'ottimizzazione della loro gestione clinica una priorità. Questi neonati sono ad alto rischio di insufficienza di crescita postnatale durante l'ospedalizzazione, che porta ad un ritardo di crescita extrauterina. Questa condizione è causata dall'interazione complessa di molti fattori prenatali, neonatali e clinici, compresi periodi di nutrizione non ottimale. La fase di nutrizione transitoria, che coincide con lo svezzamento dalla nutrizione parenterale (cioè la somministrazione di nutrienti per via endovenosa), è particolarmente critica, ed è associata a carenze nutrizionali, poiché non esistono delle linee guida specifiche. Dato che l'interazione e l'importanza relativa delle variabili che influenzano la crescita non sono ancora chiare, lo scopo di questo lavoro è identificare i principali fattori che si associano al ritardo di crescita extrauterina applicando tecniche di apprendimento supervisionato e di interpretabilità a dati di un database di terapia intensiva neonatale. I dati clinici anonimizzati di 1165 neonati prematuri sono stati estratti dall'ospedale San Gerardo, incluse le quantità effettive giornaliere di nutrienti somministrati. I dati grezzi sono stati puliti e processati per ottenere una matrice predittiva che includeva fattori prenatali, perinatali e clinici, insieme a variabili che descrivevano la nutrizione precoce dei pazienti e la fase TN. Sono stati costruiti modelli di classificazione binaria per prevedere il ritardo di crescita extrauterina, utilizzando diversi sottoinsiemi di variabili e pazienti. Inizialmente, per valutare la qualità predittiva delle variabili nutrizionali, sono state confrontate le prestazioni di tre modelli che utilizzavano rispettivamente (1) tutte le variabili, (2) solo quelle relative alla nutrizione, e (3) solo quelle relative a fattori prenatali e perinatali. L'accuratezza ottenuta da questi modelli sul set di testing era del 77%, 72% e 59%, rispettivamente. Successivamente, sono stati allenati modelli che utilizzavano tutte le variabili e solo quelle relative alla nutrizione su quattro sottoinsiemi di pazienti, ovvero neonati con prematurità moderata o tardiva (MLP), neonati molto prematuri (VPT), neonati estremamente prematuri (EPT) e neonati piccoli per età gestazionale (SGA). Questi modelli hanno ottenuto prestazioni comparabili a quelli con tutti i pazienti. La tecnica SHapley Additive exPlanations (SHAP) è stata utilizzata su tutti i modelli per identificare i fattori più importanti che contribuiscono il ritardo di crescita extrauterina. La velocità di crescita durante la prima settimana e le variabili nutrizionali relative alla prima settimana e alle prime 24 ore di vita hanno mostrato un'alta capacità predittiva per tutti i gruppi di pazienti, evidenziando l'importanza del trattamento precoce dei neonati prematuri. Al contrario, le variabili relative alla fase TN sono state osservate più frequentemente nei sottogruppi, in particolare nei neonati EPT e SGA. Questo suggerisce che la fase TN abbia un impatto maggiore su questi pazienti. Sono state osservate differenze tra i diversi sottoinsiemi di pazienti nell'importanza relativa di alcuni fattori di rischio, inclusi il sesso e la sepsi. Questo studio mostra che le variabili nutrizionali selezionate hanno un ruolo significativo nella predizione del ritardo di crescita extrauterina. Allenare separatamente modelli di classificazione su sottoinsiemi diversi di neonati potrebbe permettere di migliorare la conoscenza sulle pratiche nutrizionali nella fase TN e sui fattori di rischio del ritardo di crescita extrauterina. A questo scopo, l'utilizzo dell'apprendimento supervisionato sui database di terapia intensiva neonatale, che contengono informazioni sulle quantità effettive di nutrienti somministrati, potrebbe contribuire ad approfondire la conoscenza sul ritardo di crescita extrauterina e a ottimizzare le strategie di gestione clinica.
File allegati
File Dimensione Formato  
2023_5_Riccò_01.pdf

solo utenti autorizzati a partire dal 17/04/2026

Descrizione: Testo della tesi
Dimensione 2.3 MB
Formato Adobe PDF
2.3 MB Adobe PDF   Visualizza/Apri
2023_5_Riccò_02.pdf

solo utenti autorizzati a partire dal 17/04/2026

Descrizione: Executive summary
Dimensione 840.95 kB
Formato Adobe PDF
840.95 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/203432