Cardiovascular diseases are one of the leading causes of mortality worldwide and early diagnosis becomes more and more important. Usually, general practitioners make an initial diagnosis and lead patients to cardiology experts. However, as they have no standardized complementary tools that helps deciding whether a patient has an abnormality or not, wrong diagnosis or overlooked signs can occur especially at the first stage of diseases. Not only adults but also pediatric groups suffer from cardiac diseases and in this thesis, a study on a dataset taken from pediatric patients is conducted. There have been many studies on cardiac abnormality detection; some studies have focused on extracting many features from phonocardiogram or electrocardiogram signals and making classification based on them. Recent studies have employed deep neural networks for classification, which analyzes either heart signal itself, or extracted features. However, such classifiers have increased complexity and strong dependency on the dataset that they are trained on. In this thesis, a feature-extraction-based approach is introduced; spectral-, cepstral- and time-domain features of phonocardiogram records are extracted and fed into relatively simpler classifiers. Feature selection is done such that only the features that show a separation among normal and abnormal heart signals are accumulated for classification. Logistic regression and ensemble learning based classifiers (Random Forest and AdaBoost) are trained and tested. Random Forest classifier has shown the best performance with the highest training and test accuracy of 100% and 79.9%, respectively. This study has shown that heart abnormality classification can also be done with few features and simpler classifiers if features are picked carefully.

Le malattie cardiovascolari sono una delle principali cause di mortalità a livello mondiale e la diagnosi precoce diventa sempre più importante. Di solito, i medici di base effettuano la diagnosi iniziale e conducono i pazienti da esperti in cardiologia. Tuttavia, non disponendo di strumenti complementari standardizzati che aiutino a decidere se un paziente presenta o meno un'anomalia, possono verificarsi diagnosi errate o segni trascurati, soprattutto nella prima fase della malattia. Non solo gli adulti ma anche i gruppi pediatrici soffrono di malattie cardiache e in questa tesi viene condotto uno studio su un set di dati presi da pazienti pediatrici. Ci sono stati molti studi sul rilevamento delle anomalie cardiache; alcuni studi si sono concentrati sull'estrazione di molte caratteristiche dai segnali del fonocardiogramma o dell'elettrocardiogramma e sulla classificazione basata su di esse. Studi recenti hanno impiegato reti neurali profonde per la classificazione, che analizzano il segnale cardiaco stesso o le caratteristiche estratte. Tuttavia, tali classificatori presentano una maggiore complessità e una forte dipendenza dal set di dati su cui vengono addestrati. In questa tesi, viene introdotto un approccio basato sull'estrazione di caratteristiche; le caratteristiche spettrali, cepstrali e del dominio del tempo delle registrazioni del fonocardiogramma vengono estratte e inserite in classificatori relativamente più semplici. La selezione delle caratteristiche viene effettuata in modo da accumulare per la classificazione solo le caratteristiche che mostrano una separazione tra segnali cardiaci normali e anormali. Vengono addestrati e testati i classificatori basati sulla regressione logistica e sull'apprendimento collettivo (Random Forest e AdaBoost). Il classificatore Random Forest ha mostrato le migliori prestazioni con un'accuratezza di addestramento e di test rispettivamente del 100% e del 79,9%. Questo studio ha dimostrato che la classificazione delle anomalie cardiache può essere effettuata anche con poche caratteristiche e con classificatori più semplici se le caratteristiche sono scelte con cura.

Feature extraction based binary classification of cardiovascular anomalies

Zorlubas, Gamze
2021/2022

Abstract

Cardiovascular diseases are one of the leading causes of mortality worldwide and early diagnosis becomes more and more important. Usually, general practitioners make an initial diagnosis and lead patients to cardiology experts. However, as they have no standardized complementary tools that helps deciding whether a patient has an abnormality or not, wrong diagnosis or overlooked signs can occur especially at the first stage of diseases. Not only adults but also pediatric groups suffer from cardiac diseases and in this thesis, a study on a dataset taken from pediatric patients is conducted. There have been many studies on cardiac abnormality detection; some studies have focused on extracting many features from phonocardiogram or electrocardiogram signals and making classification based on them. Recent studies have employed deep neural networks for classification, which analyzes either heart signal itself, or extracted features. However, such classifiers have increased complexity and strong dependency on the dataset that they are trained on. In this thesis, a feature-extraction-based approach is introduced; spectral-, cepstral- and time-domain features of phonocardiogram records are extracted and fed into relatively simpler classifiers. Feature selection is done such that only the features that show a separation among normal and abnormal heart signals are accumulated for classification. Logistic regression and ensemble learning based classifiers (Random Forest and AdaBoost) are trained and tested. Random Forest classifier has shown the best performance with the highest training and test accuracy of 100% and 79.9%, respectively. This study has shown that heart abnormality classification can also be done with few features and simpler classifiers if features are picked carefully.
MATTEUCCI, MATTEO
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
Le malattie cardiovascolari sono una delle principali cause di mortalità a livello mondiale e la diagnosi precoce diventa sempre più importante. Di solito, i medici di base effettuano la diagnosi iniziale e conducono i pazienti da esperti in cardiologia. Tuttavia, non disponendo di strumenti complementari standardizzati che aiutino a decidere se un paziente presenta o meno un'anomalia, possono verificarsi diagnosi errate o segni trascurati, soprattutto nella prima fase della malattia. Non solo gli adulti ma anche i gruppi pediatrici soffrono di malattie cardiache e in questa tesi viene condotto uno studio su un set di dati presi da pazienti pediatrici. Ci sono stati molti studi sul rilevamento delle anomalie cardiache; alcuni studi si sono concentrati sull'estrazione di molte caratteristiche dai segnali del fonocardiogramma o dell'elettrocardiogramma e sulla classificazione basata su di esse. Studi recenti hanno impiegato reti neurali profonde per la classificazione, che analizzano il segnale cardiaco stesso o le caratteristiche estratte. Tuttavia, tali classificatori presentano una maggiore complessità e una forte dipendenza dal set di dati su cui vengono addestrati. In questa tesi, viene introdotto un approccio basato sull'estrazione di caratteristiche; le caratteristiche spettrali, cepstrali e del dominio del tempo delle registrazioni del fonocardiogramma vengono estratte e inserite in classificatori relativamente più semplici. La selezione delle caratteristiche viene effettuata in modo da accumulare per la classificazione solo le caratteristiche che mostrano una separazione tra segnali cardiaci normali e anormali. Vengono addestrati e testati i classificatori basati sulla regressione logistica e sull'apprendimento collettivo (Random Forest e AdaBoost). Il classificatore Random Forest ha mostrato le migliori prestazioni con un'accuratezza di addestramento e di test rispettivamente del 100% e del 79,9%. Questo studio ha dimostrato che la classificazione delle anomalie cardiache può essere effettuata anche con poche caratteristiche e con classificatori più semplici se le caratteristiche sono scelte con cura.
File allegati
File Dimensione Formato  
2022_10_ZORLUBAS_GAMZE.pdf

accessibile in internet solo dagli utenti autorizzati

Dimensione 1.93 MB
Formato Adobe PDF
1.93 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/192080