Epilepsy is a neurological disorder of the Central Nervous System (CNS) accounting for fifty millions people worldwide and with an incidence of five million of newly diagnosed individuals per year. This disease encompasses a broad and heterogeneous set of possible origins, ictogenesis mechanisms, manifestations and symptoms. Ill subjects can lead relatively normal lives when they are not experiencing seizures, however, for many the uncertainty of seizure occurrence intrudes into every aspect of day life. Moreover, symptoms and manifestations appearing during an ictal event may sometimes lead to dangerous and harmful situations. In order to improve epileptic people lives and thanks to the advancements obtained in both technological resources and knowledge regarding ictogenis mechanisms (and epilepsy in general) in the last years researchers boosted studies aiming at the implementation of a seizure-prediction system. The most of these researches are based on Electroencephalography (EEG) registrations and on the distinction within them of tracts related to different epileptic stata. Indeed, the EEG is capable to record neurons electrical activity and experienced clinicians are able to use it to discriminate between normal (or inter-ictal) and ictal conditions through visual inspection. In the literature, the more traditional approaches exploit one or more features selected and extracted from EEGs on purpose and classification algorithms to recognize the various ictal stages. Thus, these methods imply the generation of hypothesis and the selection of those features from several domains which are considered to be the most relevant ones. Instead, more recently, efforts focused on the development of neural network-based methodologies usually performing the same classification task than before but with the advantage of using directly raw EEGs or signals submitted to few pre-elaborations. The most used Neural Networks architectures include Recurrent Neural Networks, Convolutional Neural Networks (CNNs), Deep Belief Neural Networks and Denoising Sparse Auto-encoder Networks. It is common practice to classify EEG segments into inter-ictal and pre-ictal under the assumption that the latters, being by definition closer to seizures in time, may show pathology-specific biomarkers. This study aimed at the realization of a CNN for the classification of pre-ictal and inter-ictal stages, considering the first one as composed by four smaller classes. This to try to provide the patient also with information about the time before the seizure onset. Although in the used dataset are not reported the recording conditions, this study assumed that the seizures acquired in it were all spontaneous and endogenous. Actually, three different elaborations of input data and two CNN have been developed and examined. The first Artificial Intelligence (AI) was a bidimensional CNN taking in input 2D images, the second one was a 3D CNN fed by 3D tensors. The first type of data pre-elaboration regarded the Azimuthal projection (AEP) of the EEG spectral content onto a 2D map of electrode positions over the scalp. This resulted in RGB images where each channel corresponded to a different frequency band and, therefore, they preserved spectral and spatial information. The 2D CNN was alternatively fed by time-frequency images which have been obtained with the second type of pre-elaboration performed. It involved spectrogram computation, and led to data conversion into an image-like format i.e. matrices. Instead, the 3D CNN was trained and tested with volumes maintaining data time, frequency and space information. These were obtained by stacking spectrograms corresponding to the different 18 channels. The last kind of data together with the 3D CNN provided results much higher than those reached with the other two attempted approaches. In this case the performance of the architecture trained with the last pre-ictal class, which probably learned more information related to the occurrence of the subsequent ictal event, reached an accuracy of 99.16%, a recall of 99.44% and a specificity of 98.88%. These results were obtained on the test set, but, despite there was no overfitting happening, the implemented network was not able to generalize well when elaborating EEGs not included in the considered dataset. It was hypothesized here as the bad generalization capabilities might be heavily and negatively influenced by the intra- and inter-variability inherent to epilepsy disorder. Training the network with a cohort of patients experiencing different type of the same disease could have resulted in learning lots of uncommon features which in turn constituted noise when working on a single subject. Hence, the proposed methodology found a configuration of connections, weights and kernels so that it was possible to classify input data as pre- or inter-ictal. Therefore, the seizure prediction task was conducted by discriminating between a normal and a seizure-preceding tracts. However, it is still far from an actual implementation due to the generalization abilities. Improvements of this work and in general in the field of seizure prediction require the collection and use of datasets holding data from subjects with the same epilepsy condition or where there are a lot of continuous acquisitions with lots of spontaneous seizures for each patient. In conclusion, the main result obtained in this thesis work regards the developed 3D CNN and its capacity to correctly distinguish between properly elaborated EEG signals corresponding to events at different time delays from an ictal event i.e. pre- and inter-ictal tracts.

L'epilessia è un disturbo neurologico del Sistema Nervoso Centrale che colpisce circa 50 milioni di persone nel mondo e con un'incidenza annua nell'intorno di 5 milioni di nuove diagnosi. Tale malattia è caratterizzata da un ampio spettro di possibili origini, meccanismi di ictogenesi, sintomi e manifestazioni. I soggetti affetti da epilessia trascorrono una vita relativamente normale quando non sono effettivamente colpiti da una crisi, tuttavia, l'incertezza su quando potrebbe verificarsi un attacco epilettico pone per molti dei limiti nella vita di tutti i giorni. Inoltre, alcuni sintomi e alcune manifestazioni potrebbero sfociare in situazioni pericolose e possibilimente dannose per le persone soggette a questa malattia. Con l'obiettivo principale di migliorare la vita dei pazienti epilettici e grazie ai recenti sviluppi ottenuti sia dal punto di vista delle risorse tecnologiche sia delle conoscenze relative all'epilessia e ad i meccanisci di ictogenesi, negli ultimi anni molti ricercatori hanno promosso studi finalizzati alla realizzazione di un sistema per la predizione delle crisi epilettiche. La maggior parte di tali ricerche si basa sull'utilizzo di registrazioni elettroencefalografiche (EEG) e sulla detezione all'interno di essi dei tratti corrispondenti ai vari stati dell'epilessia. Infatti, l'EEG registra l'attività elettrica dei neuroni ed esperti nel campo sono in grado di riconoscere, ispezionando ad occhio la traccia registrata, condizioni normali (inter-ictaliche) o di crisi epilettica. Nella letteratura corrente, gli approcci più tradizionali ricorrono alla selezione ed estrazione di una o più features di interesse dagli EEG e ad algoritmi di classificazione che sulla base di esse possano distinguere le varie fasi ictaliche. Quindi, questi metodi si basano su molteplici ipotesi e richiedono sforzi per la selezione e l'estrazione delle features supposte più significative da differenti aree. Invece, più recentemente gli sforzi si sono concentrati sull'implementazione di metodologie basate su reti neurali in grado classificare i diversi stati ictalici partendo, però, da segnali EEG grezzi o sottoposti a poche pre-elaborazioni. Le architetture di reti neurali utilizzate includono le reti neurali ricorsive , le reti neurali convoluzionali, le deep belief neural networks e le sparse denoising auto-encoder networks. Le sempre maggiori sicurezze riguardo l'esistenza di markers o features negli EEG pre-ictalici, carattetizzanti la transizione da uno stato normale ad uno patologico, hanno favorito lo sviluppo di approcci che discriminano tra classi inter- o pre-ictaliche. Lo scopo di questo studio ha riguardato la realizzazione di una rete neurale convoluzionale per la classificazione in stadi pre- e inter-ictalici, considerando come se il primo fosse composto da quattro ulteriori sottoclassi. Questo nel tentativo di dare ai soggetti anche un'informazione relativa al tempo rimanente prima dell'insorgere della crisi. Nel pratico sono state sviluppate tre diverse metodologie di pre-elaborazione dei dati e due tipologie di CNN. La prima AI prodotta era una CNN bidimensionale con immagini 2D in input, la seconda era una CNN 3D con tensori tridimensionali come input. La prima possibile pre-elabborazione dei dati prevedere la proiezione Azimutale del contenuto spettrale dell'EEG su una mappa 2D delle posizioni degli elettrodi sullo scalpo. Questo processo ha portato alla generazione di immagini RGB in cui ciascun canale corrisponde ad una diversa banda di frequenza e che, dunque, preservano informazioni di tipo spettrale e spaziale. In alternativa, la rete 2D è stata alimentata con immagini tempo-frequenza risultanti dal secondo tipo di pre-elaborazione possibile. Quest'ultimo ha coinvolto il calcolo dello spettrogramma per la conversione dei dati in una formato simile ad immagini i.e. matrici. Invece, la CNN 3D è stata addestrata e testata utilizzando volumi in cui sono state mantenute informazioni nel tempo, nelle frequenze e nello spazio. Questi tensori sono stati ottenuti impilando gli spettrogrammi relativi ai diversi 18 canali. I risultati migliori ottenuti in questo studio derivano dalla rete 3D che ha mostrato performance nettamente più alte rispetto agli altri due approcci tentati. In questo caso, l'architettura risultante dal training con l'ultima classe pre-ictalica, che, probabilmente, ha imparato più informazioni relative all'imminente crisi, ha raggiunto il 99.16% di accuratezza, il 99.44% di recall e il 98.88% di specificità. Questi risultati sono quelli relativi alla fase di test, ma, nonostante non si sia verificato overfitting, la rete sviluppata non è stata in grado di generalizzare bene su segnali EEG che non erano stati inclusi nei dataset iniziali. L'ipotesi avanzata è che sia l'inter-variabilità sia l'intra-variabilità che caratterizzano l'epilessia possano avere influenzato pesantemente e in modo negativo le capacità di generalizzazione. In effetti, la rete addestrata su un gruppo di soggetti con diverse tipologie di epilessia ha imparato un insieme eterogeneo di features che potrebbe risultare in rumore in applicazioni sul singolo individuo. Quindi, la metodologia qui proposta è riuscita ad imparare una configurazione di connessioni, pesi e filtri tale da permettere la classificazione dei dati in classi pre- ed inter-ictaliche. Tuttavia, questo approccio non può essere effettivamente utilizzato a causa delle sue capacità di generalizzazione. I possibili miglioramenti di questo lavoro, ed in generale nel campo della predizione delle crisi epilettiche, necessitano la generazione e l'uso di database che contengano segnali relativi a più pazienti ma con stessa tipoligia di epilessia oppure molteplici registrazioni continue con molte crisi endogene per ciascun paziente. In conclusione, il principale risultato raggiunto in questo progetto di tesi consiste nella rete 3D implementata che è stata addestrata per distinguere correttamente segnali EEG, opportunamente elaborati, corrispondenti a momenti con differente distanza temporale da una crisi epilettica i.e. pre- ed inter-ictaliche.

Deep learning-based classification of EEG segments toward epileptic seizure prediction

CONTRINO, PAOLO ANDREA
2018/2019

Abstract

Epilepsy is a neurological disorder of the Central Nervous System (CNS) accounting for fifty millions people worldwide and with an incidence of five million of newly diagnosed individuals per year. This disease encompasses a broad and heterogeneous set of possible origins, ictogenesis mechanisms, manifestations and symptoms. Ill subjects can lead relatively normal lives when they are not experiencing seizures, however, for many the uncertainty of seizure occurrence intrudes into every aspect of day life. Moreover, symptoms and manifestations appearing during an ictal event may sometimes lead to dangerous and harmful situations. In order to improve epileptic people lives and thanks to the advancements obtained in both technological resources and knowledge regarding ictogenis mechanisms (and epilepsy in general) in the last years researchers boosted studies aiming at the implementation of a seizure-prediction system. The most of these researches are based on Electroencephalography (EEG) registrations and on the distinction within them of tracts related to different epileptic stata. Indeed, the EEG is capable to record neurons electrical activity and experienced clinicians are able to use it to discriminate between normal (or inter-ictal) and ictal conditions through visual inspection. In the literature, the more traditional approaches exploit one or more features selected and extracted from EEGs on purpose and classification algorithms to recognize the various ictal stages. Thus, these methods imply the generation of hypothesis and the selection of those features from several domains which are considered to be the most relevant ones. Instead, more recently, efforts focused on the development of neural network-based methodologies usually performing the same classification task than before but with the advantage of using directly raw EEGs or signals submitted to few pre-elaborations. The most used Neural Networks architectures include Recurrent Neural Networks, Convolutional Neural Networks (CNNs), Deep Belief Neural Networks and Denoising Sparse Auto-encoder Networks. It is common practice to classify EEG segments into inter-ictal and pre-ictal under the assumption that the latters, being by definition closer to seizures in time, may show pathology-specific biomarkers. This study aimed at the realization of a CNN for the classification of pre-ictal and inter-ictal stages, considering the first one as composed by four smaller classes. This to try to provide the patient also with information about the time before the seizure onset. Although in the used dataset are not reported the recording conditions, this study assumed that the seizures acquired in it were all spontaneous and endogenous. Actually, three different elaborations of input data and two CNN have been developed and examined. The first Artificial Intelligence (AI) was a bidimensional CNN taking in input 2D images, the second one was a 3D CNN fed by 3D tensors. The first type of data pre-elaboration regarded the Azimuthal projection (AEP) of the EEG spectral content onto a 2D map of electrode positions over the scalp. This resulted in RGB images where each channel corresponded to a different frequency band and, therefore, they preserved spectral and spatial information. The 2D CNN was alternatively fed by time-frequency images which have been obtained with the second type of pre-elaboration performed. It involved spectrogram computation, and led to data conversion into an image-like format i.e. matrices. Instead, the 3D CNN was trained and tested with volumes maintaining data time, frequency and space information. These were obtained by stacking spectrograms corresponding to the different 18 channels. The last kind of data together with the 3D CNN provided results much higher than those reached with the other two attempted approaches. In this case the performance of the architecture trained with the last pre-ictal class, which probably learned more information related to the occurrence of the subsequent ictal event, reached an accuracy of 99.16%, a recall of 99.44% and a specificity of 98.88%. These results were obtained on the test set, but, despite there was no overfitting happening, the implemented network was not able to generalize well when elaborating EEGs not included in the considered dataset. It was hypothesized here as the bad generalization capabilities might be heavily and negatively influenced by the intra- and inter-variability inherent to epilepsy disorder. Training the network with a cohort of patients experiencing different type of the same disease could have resulted in learning lots of uncommon features which in turn constituted noise when working on a single subject. Hence, the proposed methodology found a configuration of connections, weights and kernels so that it was possible to classify input data as pre- or inter-ictal. Therefore, the seizure prediction task was conducted by discriminating between a normal and a seizure-preceding tracts. However, it is still far from an actual implementation due to the generalization abilities. Improvements of this work and in general in the field of seizure prediction require the collection and use of datasets holding data from subjects with the same epilepsy condition or where there are a lot of continuous acquisitions with lots of spontaneous seizures for each patient. In conclusion, the main result obtained in this thesis work regards the developed 3D CNN and its capacity to correctly distinguish between properly elaborated EEG signals corresponding to events at different time delays from an ictal event i.e. pre- and inter-ictal tracts.
BELFATTO, ANTONELLA
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2019
2018/2019
L'epilessia è un disturbo neurologico del Sistema Nervoso Centrale che colpisce circa 50 milioni di persone nel mondo e con un'incidenza annua nell'intorno di 5 milioni di nuove diagnosi. Tale malattia è caratterizzata da un ampio spettro di possibili origini, meccanismi di ictogenesi, sintomi e manifestazioni. I soggetti affetti da epilessia trascorrono una vita relativamente normale quando non sono effettivamente colpiti da una crisi, tuttavia, l'incertezza su quando potrebbe verificarsi un attacco epilettico pone per molti dei limiti nella vita di tutti i giorni. Inoltre, alcuni sintomi e alcune manifestazioni potrebbero sfociare in situazioni pericolose e possibilimente dannose per le persone soggette a questa malattia. Con l'obiettivo principale di migliorare la vita dei pazienti epilettici e grazie ai recenti sviluppi ottenuti sia dal punto di vista delle risorse tecnologiche sia delle conoscenze relative all'epilessia e ad i meccanisci di ictogenesi, negli ultimi anni molti ricercatori hanno promosso studi finalizzati alla realizzazione di un sistema per la predizione delle crisi epilettiche. La maggior parte di tali ricerche si basa sull'utilizzo di registrazioni elettroencefalografiche (EEG) e sulla detezione all'interno di essi dei tratti corrispondenti ai vari stati dell'epilessia. Infatti, l'EEG registra l'attività elettrica dei neuroni ed esperti nel campo sono in grado di riconoscere, ispezionando ad occhio la traccia registrata, condizioni normali (inter-ictaliche) o di crisi epilettica. Nella letteratura corrente, gli approcci più tradizionali ricorrono alla selezione ed estrazione di una o più features di interesse dagli EEG e ad algoritmi di classificazione che sulla base di esse possano distinguere le varie fasi ictaliche. Quindi, questi metodi si basano su molteplici ipotesi e richiedono sforzi per la selezione e l'estrazione delle features supposte più significative da differenti aree. Invece, più recentemente gli sforzi si sono concentrati sull'implementazione di metodologie basate su reti neurali in grado classificare i diversi stati ictalici partendo, però, da segnali EEG grezzi o sottoposti a poche pre-elaborazioni. Le architetture di reti neurali utilizzate includono le reti neurali ricorsive , le reti neurali convoluzionali, le deep belief neural networks e le sparse denoising auto-encoder networks. Le sempre maggiori sicurezze riguardo l'esistenza di markers o features negli EEG pre-ictalici, carattetizzanti la transizione da uno stato normale ad uno patologico, hanno favorito lo sviluppo di approcci che discriminano tra classi inter- o pre-ictaliche. Lo scopo di questo studio ha riguardato la realizzazione di una rete neurale convoluzionale per la classificazione in stadi pre- e inter-ictalici, considerando come se il primo fosse composto da quattro ulteriori sottoclassi. Questo nel tentativo di dare ai soggetti anche un'informazione relativa al tempo rimanente prima dell'insorgere della crisi. Nel pratico sono state sviluppate tre diverse metodologie di pre-elaborazione dei dati e due tipologie di CNN. La prima AI prodotta era una CNN bidimensionale con immagini 2D in input, la seconda era una CNN 3D con tensori tridimensionali come input. La prima possibile pre-elabborazione dei dati prevedere la proiezione Azimutale del contenuto spettrale dell'EEG su una mappa 2D delle posizioni degli elettrodi sullo scalpo. Questo processo ha portato alla generazione di immagini RGB in cui ciascun canale corrisponde ad una diversa banda di frequenza e che, dunque, preservano informazioni di tipo spettrale e spaziale. In alternativa, la rete 2D è stata alimentata con immagini tempo-frequenza risultanti dal secondo tipo di pre-elaborazione possibile. Quest'ultimo ha coinvolto il calcolo dello spettrogramma per la conversione dei dati in una formato simile ad immagini i.e. matrici. Invece, la CNN 3D è stata addestrata e testata utilizzando volumi in cui sono state mantenute informazioni nel tempo, nelle frequenze e nello spazio. Questi tensori sono stati ottenuti impilando gli spettrogrammi relativi ai diversi 18 canali. I risultati migliori ottenuti in questo studio derivano dalla rete 3D che ha mostrato performance nettamente più alte rispetto agli altri due approcci tentati. In questo caso, l'architettura risultante dal training con l'ultima classe pre-ictalica, che, probabilmente, ha imparato più informazioni relative all'imminente crisi, ha raggiunto il 99.16% di accuratezza, il 99.44% di recall e il 98.88% di specificità. Questi risultati sono quelli relativi alla fase di test, ma, nonostante non si sia verificato overfitting, la rete sviluppata non è stata in grado di generalizzare bene su segnali EEG che non erano stati inclusi nei dataset iniziali. L'ipotesi avanzata è che sia l'inter-variabilità sia l'intra-variabilità che caratterizzano l'epilessia possano avere influenzato pesantemente e in modo negativo le capacità di generalizzazione. In effetti, la rete addestrata su un gruppo di soggetti con diverse tipologie di epilessia ha imparato un insieme eterogeneo di features che potrebbe risultare in rumore in applicazioni sul singolo individuo. Quindi, la metodologia qui proposta è riuscita ad imparare una configurazione di connessioni, pesi e filtri tale da permettere la classificazione dei dati in classi pre- ed inter-ictaliche. Tuttavia, questo approccio non può essere effettivamente utilizzato a causa delle sue capacità di generalizzazione. I possibili miglioramenti di questo lavoro, ed in generale nel campo della predizione delle crisi epilettiche, necessitano la generazione e l'uso di database che contengano segnali relativi a più pazienti ma con stessa tipoligia di epilessia oppure molteplici registrazioni continue con molte crisi endogene per ciascun paziente. In conclusione, il principale risultato raggiunto in questo progetto di tesi consiste nella rete 3D implementata che è stata addestrata per distinguere correttamente segnali EEG, opportunamente elaborati, corrispondenti a momenti con differente distanza temporale da una crisi epilettica i.e. pre- ed inter-ictaliche.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_12_Contrino.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 4.39 MB
Formato Adobe PDF
4.39 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/150978