Cerebral palsy (CP) is a disorder usually caused by brain damage occurring at or before birth up to the age of two years (Kamruzzaman and Begg, 2006), (Dobson et al., 2007). Spastic CP is the most common subtype of this disorder, often shown as muscle stiffness that causes movement difficulties in a hand, arm, foot, or leg on one or both sides of the body, affecting the majority (>85%) of children with CP (Reid et al., 2011). Gait analysis is routinely used in clinical settings for the assessment of walking performance. One such important application of gait analysis is in the evaluation of CP patients. Accurate identification of the gait patterns from CP patients has many potential applications, for example, assistance in the diagnosis, clinical decision-making, and communication among the clinical professionals (Zhang et al., 2009) Although gait analysis can provide quantitative data, gait classification is still based on a clinician's subjective judgment and personal experience, which may increase the variability between different clinicians. As a result, an automatic diagnosis method can offer significant advantages such as objectivity and reproducibility in the diagnosis process, a possible decrease in labor costs in the long run, and fast analysis of massive datasets. Even though several supervised machine learning algorithms have been proposed for gait classification, to our knowledge, there is a lack of studies for the classification of diplegic from hemiplegic CP children by using different supervised learning approaches. Therefore, this study aims to evaluate these supervised machine learning algorithms to determine the most suitable algorithm for this task. In addition, almost all of the gait parameters are utilized in this study, including Spatio-Temporal parameters, Kinematics, Kinetics, and Ground Reaction Forces. Meanwhile, in recent studies, a limited number of these variables were used to train machine learning models, with most of them utilizing Spatio-Temporal parameters only. Various hold-out and cross-validation testing show that K-Nearest Neighbor (KNN) and Support Vector Machine (SVM) models offer excellent classification performances compared with other popular classifiers. By looking at the results of machine learning algorithms, the seven proposed models' classification performance demonstrated that SVM and KNN obtain the best accuracy of 92.94% on the test set. Logistic regression, Naïve Bayes, Bagged Tree Ensembles, Decision Trees, and Discriminant analysis models show an accuracy of 84.71%, 81.18%, 80.00%, 78.82%, and 78.82% on the test set, respectively.

La paralisi cerebrale (PC) è una malattia solitamente causata da un danno cerebrale che si verifica durante o prima della nascita fino all'età di due anni (Kamruzzaman e Begg, 2006), (Dobson et al., 2007). La PC spastica è il sottotipo più comune di questo disturbo, spesso mostrato come rigidità muscolare che causa difficoltà di movimento a una mano, un braccio, un piede o una gamba su uno o entrambi i lati del corpo, interessando la maggior parte (> 85%) dei bambini con CP (Reid et al., 2011). L'analisi del cammino viene abitualmente utilizzata in contesti clinici per la valutazione delle prestazioni di deambulazione. Una di queste importanti applicazioni dell'analisi del cammino è nella valutazione dei pazienti con CP. L'identificazione accurata dei modelli di deambulazione dei pazienti con CP ha molte potenziali applicazioni, ad esempio, l'assistenza nella diagnosi, il processo decisionale clinico e la comunicazione tra i professionisti clinici (Zhang et al., 2009) Sebbene l'analisi dell'andatura possa fornire dati quantitativi, la classificazione dell'andatura è ancora basata sul giudizio soggettivo del medico e sull'esperienza personale, il che può aumentare la variabilità tra i diversi medici. Di conseguenza, un metodo di diagnosi automatica può offrire vantaggi significativi come l'obiettività e la riproducibilità nel processo diagnostico, una possibile diminuzione del costo del lavoro a lungo termine e un'analisi rapida di enormi set di dati. Anche se diversi algoritmi di apprendimento automatico supervisionato sono stati proposti per la classificazione del cammino, a nostra conoscenza, mancano studi per la classificazione dei bambini con CP diplegici da emiplegici utilizzando diversi approcci di apprendimento supervisionato. Pertanto, questo studio mira a valutare questi algoritmi di apprendimento automatico supervisionato per determinare l'algoritmo più adatto per questo compito. Inoltre, in questo studio vengono utilizzati quasi tutti i parametri dell'andatura, inclusi i parametri spazio-temporali, cinematica, cinetica e forze di reazione al suolo. Nel frattempo, in studi recenti, un numero limitato di queste variabili è stato utilizzato per addestrare modelli di apprendimento automatico, la maggior parte di essi utilizza solo parametri spazio-temporali. Vari test di hold-out e di convalida incrociata mostrano che i modelli K-Nearest Neighbor (KNN) e Support Vector Machine (SVM) offrono eccellenti prestazioni di classificazione rispetto ad altri classificatori popolari. Osservando i risultati degli algoritmi di apprendimento automatico, le prestazioni di classificazione dei sette modelli proposti hanno dimostrato che SVM e KNN ottengono la migliore precisione del 92,94% sul set di test. Regressione logistica, Naïve Bayes, Insiemi di alberi insaccati, Alberi decisionali e I modelli di analisi discriminante mostrano un'accuratezza dell'84,71%, 81,18%, 80,00%, 78,82% e 78,82% sul set di test, rispettivamente.

A classification model based on a machine learning approach to identify diplegic and hemiplegic gait patterns in subjects with cerebral palsy

Rahimi, Hamidreza
2019/2020

Abstract

Cerebral palsy (CP) is a disorder usually caused by brain damage occurring at or before birth up to the age of two years (Kamruzzaman and Begg, 2006), (Dobson et al., 2007). Spastic CP is the most common subtype of this disorder, often shown as muscle stiffness that causes movement difficulties in a hand, arm, foot, or leg on one or both sides of the body, affecting the majority (>85%) of children with CP (Reid et al., 2011). Gait analysis is routinely used in clinical settings for the assessment of walking performance. One such important application of gait analysis is in the evaluation of CP patients. Accurate identification of the gait patterns from CP patients has many potential applications, for example, assistance in the diagnosis, clinical decision-making, and communication among the clinical professionals (Zhang et al., 2009) Although gait analysis can provide quantitative data, gait classification is still based on a clinician's subjective judgment and personal experience, which may increase the variability between different clinicians. As a result, an automatic diagnosis method can offer significant advantages such as objectivity and reproducibility in the diagnosis process, a possible decrease in labor costs in the long run, and fast analysis of massive datasets. Even though several supervised machine learning algorithms have been proposed for gait classification, to our knowledge, there is a lack of studies for the classification of diplegic from hemiplegic CP children by using different supervised learning approaches. Therefore, this study aims to evaluate these supervised machine learning algorithms to determine the most suitable algorithm for this task. In addition, almost all of the gait parameters are utilized in this study, including Spatio-Temporal parameters, Kinematics, Kinetics, and Ground Reaction Forces. Meanwhile, in recent studies, a limited number of these variables were used to train machine learning models, with most of them utilizing Spatio-Temporal parameters only. Various hold-out and cross-validation testing show that K-Nearest Neighbor (KNN) and Support Vector Machine (SVM) models offer excellent classification performances compared with other popular classifiers. By looking at the results of machine learning algorithms, the seven proposed models' classification performance demonstrated that SVM and KNN obtain the best accuracy of 92.94% on the test set. Logistic regression, Naïve Bayes, Bagged Tree Ensembles, Decision Trees, and Discriminant analysis models show an accuracy of 84.71%, 81.18%, 80.00%, 78.82%, and 78.82% on the test set, respectively.
CAMUCOLI, FEDERICA
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2019/2020
La paralisi cerebrale (PC) è una malattia solitamente causata da un danno cerebrale che si verifica durante o prima della nascita fino all'età di due anni (Kamruzzaman e Begg, 2006), (Dobson et al., 2007). La PC spastica è il sottotipo più comune di questo disturbo, spesso mostrato come rigidità muscolare che causa difficoltà di movimento a una mano, un braccio, un piede o una gamba su uno o entrambi i lati del corpo, interessando la maggior parte (> 85%) dei bambini con CP (Reid et al., 2011). L'analisi del cammino viene abitualmente utilizzata in contesti clinici per la valutazione delle prestazioni di deambulazione. Una di queste importanti applicazioni dell'analisi del cammino è nella valutazione dei pazienti con CP. L'identificazione accurata dei modelli di deambulazione dei pazienti con CP ha molte potenziali applicazioni, ad esempio, l'assistenza nella diagnosi, il processo decisionale clinico e la comunicazione tra i professionisti clinici (Zhang et al., 2009) Sebbene l'analisi dell'andatura possa fornire dati quantitativi, la classificazione dell'andatura è ancora basata sul giudizio soggettivo del medico e sull'esperienza personale, il che può aumentare la variabilità tra i diversi medici. Di conseguenza, un metodo di diagnosi automatica può offrire vantaggi significativi come l'obiettività e la riproducibilità nel processo diagnostico, una possibile diminuzione del costo del lavoro a lungo termine e un'analisi rapida di enormi set di dati. Anche se diversi algoritmi di apprendimento automatico supervisionato sono stati proposti per la classificazione del cammino, a nostra conoscenza, mancano studi per la classificazione dei bambini con CP diplegici da emiplegici utilizzando diversi approcci di apprendimento supervisionato. Pertanto, questo studio mira a valutare questi algoritmi di apprendimento automatico supervisionato per determinare l'algoritmo più adatto per questo compito. Inoltre, in questo studio vengono utilizzati quasi tutti i parametri dell'andatura, inclusi i parametri spazio-temporali, cinematica, cinetica e forze di reazione al suolo. Nel frattempo, in studi recenti, un numero limitato di queste variabili è stato utilizzato per addestrare modelli di apprendimento automatico, la maggior parte di essi utilizza solo parametri spazio-temporali. Vari test di hold-out e di convalida incrociata mostrano che i modelli K-Nearest Neighbor (KNN) e Support Vector Machine (SVM) offrono eccellenti prestazioni di classificazione rispetto ad altri classificatori popolari. Osservando i risultati degli algoritmi di apprendimento automatico, le prestazioni di classificazione dei sette modelli proposti hanno dimostrato che SVM e KNN ottengono la migliore precisione del 92,94% sul set di test. Regressione logistica, Naïve Bayes, Insiemi di alberi insaccati, Alberi decisionali e I modelli di analisi discriminante mostrano un'accuratezza dell'84,71%, 81,18%, 80,00%, 78,82% e 78,82% sul set di test, rispettivamente.
File allegati
File Dimensione Formato  
Thesis_Hamidreza_Rahimi_Final.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis Final Report
Dimensione 4.74 MB
Formato Adobe PDF
4.74 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/174279