Lung cancer, particularly Non-Small Cell Lung Cancer (NSCLC), continues to be one of the leading causes of cancer-related deaths globally. Early diagnosis is critical to improving patient outcomes, especially as immunotherapy has emerged as a promising treatment for NSCLC. However, only a subset of patients respond effectively to immunotherapy, highlighting the urgent need for new reliable biomarkers to predict treatment responses. This thesis explores whether cough audio can serve as a novel digital biomarker for distinguishing between NSCLC patients and healthy individuals, potentially enhancing diagnostic tools for personalized treatment. Building on the I3LUNG project, which aims to personalize treatment for lung cancer patients using artificial intelligence, this work investigates the potential of using AI models to classify cough audio patterns. By applying machine learning (ML) and deep learning (DL) techniques, including Convolutional Neural Networks (CNNs) and Transfer Learning (TL) with VGG16, this study investigates the potential of cough audio analysis in NSCLC diagnosis. The approach involves extracting both acoustic and spectrogram-based features to assess differences in cough patterns between NSCLC patients and healthy individuals. The study demonstrates promising results, with the Support Vector Machine (SVM) model achieving a weighted-average F1-score of 96% and 96% accuracy, effectively distinguishing between the two groups. The model showed an impressive 98% F1-score for the cancer class with a recall of 100%, but it struggled a bit with the healthy class, achieving a lower F1-score of 76%, likely due to the limited number of healthy samples in that category. This thesis provides an initial exploration into AI-driven health diagnostics, suggesting that cough audio as a digital biomarkers, could complement traditional lung cancer detection methods. Although the results are promising, further research, including larger and more balanced datasets, is necessary to validate this approach before clinical application.

Il cancro ai polmoni, in particolare il carcinoma polmonare non a piccole cellule (NSCLC), continua a essere una delle principali cause di morte correlata al cancro a livello globale. La diagnosi precoce è fondamentale per migliorare i risultati per i pazienti, soprattutto poiché l'immunoterapia è emersa come un trattamento promettente per l'NSCLC. Tuttavia, solo una parte dei pazienti risponde efficacemente all'immunoterapia, evidenziando la necessità urgente di nuovi biomarcatori affidabili per predire le risposte al trattamento. Questa tesi esplora l'utilizzo delle registrazioni audio della tosse come possibile nuovo biomarcatore digitale per distinguere tra pazienti NSCLC e individui sani, migliorando potenzialmente gli strumenti diagnostici per trattamenti personalizzati. Basandosi sul progetto I3LUNG, che mira a personalizzare il trattamento dei pazienti affetti da cancro ai polmoni utilizzando l'intelligenza artificiale (IA), questo lavoro indaga il potenziale dell'uso di modelli di IA per classificare le registrazioni audio della tosse. Applicando tecniche di machine learning (ML) e deep learning (DL), tra cui reti neurali convoluzionali (CNN) e il transfer learning (TL) con VGG16, questo studio esplora il potenziale dell'analisi dell'audio della tosse per la diagnosi di NSCLC. L'approccio prevede l'estrazione di caratteristiche sia acustiche che basate su spettrogrammi per valutare le differenze nei modelli di tosse tra pazienti NSCLC e individui sani. Lo studio ha ottenuto risultati incoraggianti, con il modello Support Vector Machine (SVM) che ha raggiunto un F1-score medio ponderato del 96% e un'accuratezza del 96%, distinguendo efficacemente i due gruppi. Il modello ha mostrato un F1-score del 98% per la classe dei pazienti con cancro e un recall del 100%, mentre ha riscontrato qualche difficoltà nella classificazione degli individui sani, con un F1-score inferiore del 76%, probabilmente a causa del numero limitato di campioni in quella categoria. Questa tesi rappresenta un'esplorazione iniziale delle possibilità diagnostiche basate sull'intelligenza artificiale, suggerendo che le registrazioni audio della tosse, come biomarcatore digitale, potrebbero affiancare i metodi tradizionali nella diagnosi precoce del cancro ai polmoni. Sebbene i risultati siano promettenti, è necessaria una ricerca più approfondita, con set di dati più ampi e bilanciati, per convalidare questo approccio prima di un'applicazione clinica.

Can the cough audio become a biomarker for Non-Small Cell Lung Cancer Patients classifications?

Licciardello, Cristina Maria
2023/2024

Abstract

Lung cancer, particularly Non-Small Cell Lung Cancer (NSCLC), continues to be one of the leading causes of cancer-related deaths globally. Early diagnosis is critical to improving patient outcomes, especially as immunotherapy has emerged as a promising treatment for NSCLC. However, only a subset of patients respond effectively to immunotherapy, highlighting the urgent need for new reliable biomarkers to predict treatment responses. This thesis explores whether cough audio can serve as a novel digital biomarker for distinguishing between NSCLC patients and healthy individuals, potentially enhancing diagnostic tools for personalized treatment. Building on the I3LUNG project, which aims to personalize treatment for lung cancer patients using artificial intelligence, this work investigates the potential of using AI models to classify cough audio patterns. By applying machine learning (ML) and deep learning (DL) techniques, including Convolutional Neural Networks (CNNs) and Transfer Learning (TL) with VGG16, this study investigates the potential of cough audio analysis in NSCLC diagnosis. The approach involves extracting both acoustic and spectrogram-based features to assess differences in cough patterns between NSCLC patients and healthy individuals. The study demonstrates promising results, with the Support Vector Machine (SVM) model achieving a weighted-average F1-score of 96% and 96% accuracy, effectively distinguishing between the two groups. The model showed an impressive 98% F1-score for the cancer class with a recall of 100%, but it struggled a bit with the healthy class, achieving a lower F1-score of 76%, likely due to the limited number of healthy samples in that category. This thesis provides an initial exploration into AI-driven health diagnostics, suggesting that cough audio as a digital biomarkers, could complement traditional lung cancer detection methods. Although the results are promising, further research, including larger and more balanced datasets, is necessary to validate this approach before clinical application.
GIANGREGORIO, CHIARA
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-ott-2024
2023/2024
Il cancro ai polmoni, in particolare il carcinoma polmonare non a piccole cellule (NSCLC), continua a essere una delle principali cause di morte correlata al cancro a livello globale. La diagnosi precoce è fondamentale per migliorare i risultati per i pazienti, soprattutto poiché l'immunoterapia è emersa come un trattamento promettente per l'NSCLC. Tuttavia, solo una parte dei pazienti risponde efficacemente all'immunoterapia, evidenziando la necessità urgente di nuovi biomarcatori affidabili per predire le risposte al trattamento. Questa tesi esplora l'utilizzo delle registrazioni audio della tosse come possibile nuovo biomarcatore digitale per distinguere tra pazienti NSCLC e individui sani, migliorando potenzialmente gli strumenti diagnostici per trattamenti personalizzati. Basandosi sul progetto I3LUNG, che mira a personalizzare il trattamento dei pazienti affetti da cancro ai polmoni utilizzando l'intelligenza artificiale (IA), questo lavoro indaga il potenziale dell'uso di modelli di IA per classificare le registrazioni audio della tosse. Applicando tecniche di machine learning (ML) e deep learning (DL), tra cui reti neurali convoluzionali (CNN) e il transfer learning (TL) con VGG16, questo studio esplora il potenziale dell'analisi dell'audio della tosse per la diagnosi di NSCLC. L'approccio prevede l'estrazione di caratteristiche sia acustiche che basate su spettrogrammi per valutare le differenze nei modelli di tosse tra pazienti NSCLC e individui sani. Lo studio ha ottenuto risultati incoraggianti, con il modello Support Vector Machine (SVM) che ha raggiunto un F1-score medio ponderato del 96% e un'accuratezza del 96%, distinguendo efficacemente i due gruppi. Il modello ha mostrato un F1-score del 98% per la classe dei pazienti con cancro e un recall del 100%, mentre ha riscontrato qualche difficoltà nella classificazione degli individui sani, con un F1-score inferiore del 76%, probabilmente a causa del numero limitato di campioni in quella categoria. Questa tesi rappresenta un'esplorazione iniziale delle possibilità diagnostiche basate sull'intelligenza artificiale, suggerendo che le registrazioni audio della tosse, come biomarcatore digitale, potrebbero affiancare i metodi tradizionali nella diagnosi precoce del cancro ai polmoni. Sebbene i risultati siano promettenti, è necessaria una ricerca più approfondita, con set di dati più ampi e bilanciati, per convalidare questo approccio prima di un'applicazione clinica.
File allegati
File Dimensione Formato  
2024_10_Licciardello_Tesi.pdf

accessibile in internet per tutti a partire dal 18/09/2027

Descrizione: tesi
Dimensione 4.48 MB
Formato Adobe PDF
4.48 MB Adobe PDF   Visualizza/Apri
2024_10_Licciardello_Executive_Summary.pdf

accessibile in internet per tutti a partire dal 18/09/2027

Descrizione: Executive Summary
Dimensione 1.56 MB
Formato Adobe PDF
1.56 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/227640