CFD-driven Machine Learning (ML) represents a powerful and promising approach to assist in medical assessment of nasal breathing difficulties. In the context, previous works have proposed a procedure for an automatic classification of nasal pathologies by leveraging CFD-data in a ML framework. For training the classifier, fluid-dynamic data are gathered by running simulations on a database of pathological noses. The database has been constructed by virtual surgeries on healthy anatomical noses extracted from CT scans. This Thesis study presents a revised version of the pipeline, with modifications introduced to enhance computational efficiency and result accuracy. In particular, the procedure for the construction of the database has been modified, reducing the computational cost. Moreover, the new procedure has been leveraged for enriching the database with new pathological noses (from 270 to 784). From a methodological and operational perspective, a comparative evaluation was conducted: a classifier trained on data generated by a reduced-order model was compared with a classifier trained on data obtained from Large Eddy Simulations (LES). The analysis covers two tasks: a binary classification (distinguishing between septal deviations and turbinate hypertrophies) and a four-class classification (discriminating among anterior/posterior septal deviation and inferior/middle turbinate hypertrophy). In terms of accuracy, the reduced-order model data outscored (0.98) the LES-data (0.85) for the binary classification. The multi-class problem results, instead, showed similar performance. This is a key finding, since the computational cost and the time requested for a simulation with the reduced-order model are incredibly low (few seconds), thus making it particularly suitable for a real-time type of analysis. A new type of classification has been carried out by leveraging the new database, distinguishing among three classes - septal deviation, turbinate hypertrophy and both combined. Eventually, it was shown that the adoption of a feature selection technique has the potential to greatly improve the scores of the classification (e.g. accuracy from 0.65 to 0.86 for the four-class problem).

Il Machine Learning (ML) guidato dalla fluidodinamica computazionale (CFD) rappresenta un promettente strumento di supporto per le valutazioni cliniche delle difficoltà respiratorie nasali. In questo contesto, lavori precedenti hanno utilizzato una procedura per la classificazione automatica delle patologie nasali sfruttando i dati prodotti dalla CFD in ambito ML. Correntemente, per allenare il classificatore, vengono raccolti i dati da simulazioni su un database di nasi patologici costruito inserendo virtualmente le deformazioni corrispondenti alle malattie su nasi sani, estratti via TAC. Il presente lavoro di Tesi rivisita questa procedura con l’obiettivo di ridurre il costo computazionale e migliorare l’accuratezza nei risultati. In particolare, il metodo per la creazione del database è stato reso più efficiente da un punto di vista computazionale; lo stesso metodo è stato, inoltre, utilizzato per la creazione di nuovi nasi patologici (da 270 a 784). Dal punto di vista metodologico-operativo, si è operato una valutazione comparativa: un classificatore, allenato su dati provenienti da un modello di ordine ridotto, è stato messo a confronto con il classificatore allenato su dati provenienti da Large Eddy Simulations (LES). L’analisi ha osservato due casi: una classificazione binaria (che distingue la deviazione del setto dall’ipertrofia del turbinato) e una classificazione a quattro classi (per deviazione del setto anteriore e posteriore e ipertrofia del turbinato inferiore e medio). In termini di accuratezza la classificazione binaria ha fornito risultati migliori (0.98) utilizzando i dati del modello ridotto rispetto ai dati LES (0.85). Per il problema multi classe invece, i risultati sono simili. Il risultato è particolarmente rilevante se si considera che una simulazione col modello ridotto richiede meno tempo e risorse computazionali (pochi secondi), rendendolo estremamente adeguato a situazioni in cui è necessario fare delle valutazioni speditive. Un nuovo tipo di classificazione a tre classi è stato poi testato grazie all’utilizzo del nuovo database, distinguendo tra deviazione del setto, ipertrofia del turbinato e le due combinate. Infine, il lavoro di Tesi dimostra come l’adozione di una tecnica di feature selection può concretamente migliorare i risultati delle classificazioni (e.g. portando l’accuratezza da 0.65 a 0.86 per il problema a quattro classi).

CFD-driven machine learning for the classification of nasal breathing difficulties

Di Venosa, Carlantonio
2024/2025

Abstract

CFD-driven Machine Learning (ML) represents a powerful and promising approach to assist in medical assessment of nasal breathing difficulties. In the context, previous works have proposed a procedure for an automatic classification of nasal pathologies by leveraging CFD-data in a ML framework. For training the classifier, fluid-dynamic data are gathered by running simulations on a database of pathological noses. The database has been constructed by virtual surgeries on healthy anatomical noses extracted from CT scans. This Thesis study presents a revised version of the pipeline, with modifications introduced to enhance computational efficiency and result accuracy. In particular, the procedure for the construction of the database has been modified, reducing the computational cost. Moreover, the new procedure has been leveraged for enriching the database with new pathological noses (from 270 to 784). From a methodological and operational perspective, a comparative evaluation was conducted: a classifier trained on data generated by a reduced-order model was compared with a classifier trained on data obtained from Large Eddy Simulations (LES). The analysis covers two tasks: a binary classification (distinguishing between septal deviations and turbinate hypertrophies) and a four-class classification (discriminating among anterior/posterior septal deviation and inferior/middle turbinate hypertrophy). In terms of accuracy, the reduced-order model data outscored (0.98) the LES-data (0.85) for the binary classification. The multi-class problem results, instead, showed similar performance. This is a key finding, since the computational cost and the time requested for a simulation with the reduced-order model are incredibly low (few seconds), thus making it particularly suitable for a real-time type of analysis. A new type of classification has been carried out by leveraging the new database, distinguishing among three classes - septal deviation, turbinate hypertrophy and both combined. Eventually, it was shown that the adoption of a feature selection technique has the potential to greatly improve the scores of the classification (e.g. accuracy from 0.65 to 0.86 for the four-class problem).
BERIZZI , NICCOLO'
FAVERO, ANGELO RAIMONDO
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2025
2024/2025
Il Machine Learning (ML) guidato dalla fluidodinamica computazionale (CFD) rappresenta un promettente strumento di supporto per le valutazioni cliniche delle difficoltà respiratorie nasali. In questo contesto, lavori precedenti hanno utilizzato una procedura per la classificazione automatica delle patologie nasali sfruttando i dati prodotti dalla CFD in ambito ML. Correntemente, per allenare il classificatore, vengono raccolti i dati da simulazioni su un database di nasi patologici costruito inserendo virtualmente le deformazioni corrispondenti alle malattie su nasi sani, estratti via TAC. Il presente lavoro di Tesi rivisita questa procedura con l’obiettivo di ridurre il costo computazionale e migliorare l’accuratezza nei risultati. In particolare, il metodo per la creazione del database è stato reso più efficiente da un punto di vista computazionale; lo stesso metodo è stato, inoltre, utilizzato per la creazione di nuovi nasi patologici (da 270 a 784). Dal punto di vista metodologico-operativo, si è operato una valutazione comparativa: un classificatore, allenato su dati provenienti da un modello di ordine ridotto, è stato messo a confronto con il classificatore allenato su dati provenienti da Large Eddy Simulations (LES). L’analisi ha osservato due casi: una classificazione binaria (che distingue la deviazione del setto dall’ipertrofia del turbinato) e una classificazione a quattro classi (per deviazione del setto anteriore e posteriore e ipertrofia del turbinato inferiore e medio). In termini di accuratezza la classificazione binaria ha fornito risultati migliori (0.98) utilizzando i dati del modello ridotto rispetto ai dati LES (0.85). Per il problema multi classe invece, i risultati sono simili. Il risultato è particolarmente rilevante se si considera che una simulazione col modello ridotto richiede meno tempo e risorse computazionali (pochi secondi), rendendolo estremamente adeguato a situazioni in cui è necessario fare delle valutazioni speditive. Un nuovo tipo di classificazione a tre classi è stato poi testato grazie all’utilizzo del nuovo database, distinguendo tra deviazione del setto, ipertrofia del turbinato e le due combinate. Infine, il lavoro di Tesi dimostra come l’adozione di una tecnica di feature selection può concretamente migliorare i risultati delle classificazioni (e.g. portando l’accuratezza da 0.65 a 0.86 per il problema a quattro classi).
File allegati
File Dimensione Formato  
2025-07-di_Venosa-Executive_Summary.pdf

accessibile in internet per tutti

Descrizione: executive summary
Dimensione 1.04 MB
Formato Adobe PDF
1.04 MB Adobe PDF Visualizza/Apri
2025-07-di_Venosa.pdf

accessibile in internet per tutti

Descrizione: tesi
Dimensione 16.23 MB
Formato Adobe PDF
16.23 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/240597