This thesis explores the application of machine learning (ML) and data science to analyze the nutraceutical effects of probiotics and specific nutrients on lipid profiles and gastrointestinal health, leveraging data from the National Health and Nutrition Examination Survey (NHANES). The healthcare and pharmaceutical sectors' shift toward data-driven approaches and ML highlights the potential of these techniques in revealing nutrient-health interactions, particularly relevant to nutraceutical research and personalized wellness strategies. The study reveals that probiotic intake positively impacts total cholesterol levels, though no significant effects were observed on LDL cholesterol, HDL, or triglycerides. A small sample size limited the analysis of probiotic impacts across age and gender, suggesting the need for an expanded dataset with direct probiotic consumption data for future studies. Given that traditional equations for calculating LDL often having a absolute percentage error around 25%, this study focused on machine learning approaches. The Random Forest model achieved the highest LDL prediction accuracy, reducing the absolute error to 8.53%, highlighting the value of ML models in improving clinical data interpretation. Additionally, through principal component analysis, nutrient combinations such as selenium, phosphorous, and magnesium were identified as beneficial for gastrointestinal health, offering new directions for nutraceutical product development. Overall, the findings demonstrate the potential of combining ML and nutraceutical research to improve health outcomes and advance personalized nutrition. This work lays a foundation for integrating predictive data models into healthcare, promoting proactive health strategies in response to the increasing demand for tailored nutraceutical products.

Questa tesi esplora l'applicazione del machine learning (ML) e di data science per analizzare gli effetti nutraceutici dei probiotici e di nutrienti specifici sui profili lipidici e sulla salute gastrointestinale, sfruttando i dati del National Health and Nutrition Examination Survey (NHANES). L’orientamento dei settori sanitario e farmaceutico verso approcci basati sui dati e il ML evidenzia il potenziale di queste tecniche nel rivelare interazioni tra nutrienti e salute, particolarmente rilevanti per la ricerca nutraceutica e per le strategie di benessere personalizzate. Lo studio mostra che l'assunzione di probiotici ha un impatto positivo sui livelli di colesterolo totale, anche se non sono stati osservati effetti significativi sul colesterolo LDL, HDL o sui trigliceridi. La limitata dimensione del campione ha ridotto la possibilità di analizzare l'impatto dei probiotici per età e genere, suggerendo la necessità di un dataset ampliato con dati diretti sul consumo di probiotici per studi futuri. Considerando che le equazioni tradizionali per calcolare il colesterolo LDL presentano spesso un errore percentuale assoluto di circa il 25%, questo studio si è concentrato su approcci di machine learning. Il modello Random Forest ha raggiunto la massima accuratezza nella previsione del LDL, riducendo l'errore assoluto all'8,53% e mettendo in evidenza il valore dei modelli ML per migliorare l'interpretazione dei dati clinici. Inoltre, attraverso l'analisi delle componenti principali, sono state identificate combinazioni di nutrienti come selenio, fosforo e magnesio, che risultano benefici per la salute gastrointestinale, offrendo nuove direzioni per lo sviluppo di prodotti nutraceutici. Nel complesso, i risultati dimostrano il potenziale di combinare ML e ricerca nutraceutica per migliorare i risultati di salute e promuovere una nutrizione personalizzata. Questo lavoro pone le basi per l'integrazione di modelli predittivi basati sui dati nella sanità, promuovendo strategie di salute proattive in risposta alla crescente domanda di prodotti nutraceutici personalizzati.

A Big Data and machine learning approach to cholesterol control and nutraceutical identification using NHANES insights

IDRIZI, GERALD;RIVA, LETIZIA
2023/2024

Abstract

This thesis explores the application of machine learning (ML) and data science to analyze the nutraceutical effects of probiotics and specific nutrients on lipid profiles and gastrointestinal health, leveraging data from the National Health and Nutrition Examination Survey (NHANES). The healthcare and pharmaceutical sectors' shift toward data-driven approaches and ML highlights the potential of these techniques in revealing nutrient-health interactions, particularly relevant to nutraceutical research and personalized wellness strategies. The study reveals that probiotic intake positively impacts total cholesterol levels, though no significant effects were observed on LDL cholesterol, HDL, or triglycerides. A small sample size limited the analysis of probiotic impacts across age and gender, suggesting the need for an expanded dataset with direct probiotic consumption data for future studies. Given that traditional equations for calculating LDL often having a absolute percentage error around 25%, this study focused on machine learning approaches. The Random Forest model achieved the highest LDL prediction accuracy, reducing the absolute error to 8.53%, highlighting the value of ML models in improving clinical data interpretation. Additionally, through principal component analysis, nutrient combinations such as selenium, phosphorous, and magnesium were identified as beneficial for gastrointestinal health, offering new directions for nutraceutical product development. Overall, the findings demonstrate the potential of combining ML and nutraceutical research to improve health outcomes and advance personalized nutrition. This work lays a foundation for integrating predictive data models into healthcare, promoting proactive health strategies in response to the increasing demand for tailored nutraceutical products.
ING - Scuola di Ingegneria Industriale e dell'Informazione
11-dic-2024
2023/2024
Questa tesi esplora l'applicazione del machine learning (ML) e di data science per analizzare gli effetti nutraceutici dei probiotici e di nutrienti specifici sui profili lipidici e sulla salute gastrointestinale, sfruttando i dati del National Health and Nutrition Examination Survey (NHANES). L’orientamento dei settori sanitario e farmaceutico verso approcci basati sui dati e il ML evidenzia il potenziale di queste tecniche nel rivelare interazioni tra nutrienti e salute, particolarmente rilevanti per la ricerca nutraceutica e per le strategie di benessere personalizzate. Lo studio mostra che l'assunzione di probiotici ha un impatto positivo sui livelli di colesterolo totale, anche se non sono stati osservati effetti significativi sul colesterolo LDL, HDL o sui trigliceridi. La limitata dimensione del campione ha ridotto la possibilità di analizzare l'impatto dei probiotici per età e genere, suggerendo la necessità di un dataset ampliato con dati diretti sul consumo di probiotici per studi futuri. Considerando che le equazioni tradizionali per calcolare il colesterolo LDL presentano spesso un errore percentuale assoluto di circa il 25%, questo studio si è concentrato su approcci di machine learning. Il modello Random Forest ha raggiunto la massima accuratezza nella previsione del LDL, riducendo l'errore assoluto all'8,53% e mettendo in evidenza il valore dei modelli ML per migliorare l'interpretazione dei dati clinici. Inoltre, attraverso l'analisi delle componenti principali, sono state identificate combinazioni di nutrienti come selenio, fosforo e magnesio, che risultano benefici per la salute gastrointestinale, offrendo nuove direzioni per lo sviluppo di prodotti nutraceutici. Nel complesso, i risultati dimostrano il potenziale di combinare ML e ricerca nutraceutica per migliorare i risultati di salute e promuovere una nutrizione personalizzata. Questo lavoro pone le basi per l'integrazione di modelli predittivi basati sui dati nella sanità, promuovendo strategie di salute proattive in risposta alla crescente domanda di prodotti nutraceutici personalizzati.
File allegati
File Dimensione Formato  
2024_12_Idrizi_Riva_Executive Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 647.85 kB
Formato Adobe PDF
647.85 kB Adobe PDF   Visualizza/Apri
2024_12_Idrizi_Riva_Tesi_01.pdf

non accessibile

Descrizione: Thesis
Dimensione 3.86 MB
Formato Adobe PDF
3.86 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/230931