Electroencephalogram (EEG) represents a recording of the brain’s electrical activity, mainly originating from the cortex. EEG is very important for investigating the functioning of the human brain, but it is affected greatly by undesired signals that mainly physiological phenomena can generate (e.g., eye blinks, head movement, muscle activity). In literature, many methods have been proposed to handle artifacts by removing, rejecting or detecting them from the neural recording. In this context, the application of Machine Learning (ML) techniques for distinguishing artifact-free EEG sequences from contaminated ones has been increasingly used in recent years. However, ML methods have a major limitation due to the requirement of a priori selection of EEG features. Deep Learning (DL) models represent an alternative to ML methods, thanks to automatic feature extraction. Here, Convolutional Neural Networks (CNNs) architectures exhibit a strong potential to be used in biological signal processing. However, the performance of a DL network depends on the size of the training and testing dataset. Therefore, to fulfil the requirements of a big dataset, the DL models were trained and tested on a reliable and coherent manually generated dataset, fully addressing the different characteristics of EEG signals and artifacts. This thesis aims to create DL models based on CNN, to classify EEG signal epochs in ‘clean’, affected by "muscular artifacts’, or ‘ocular artifacts’, without needing external reference inputs. This work considers two different architectures: 1. A CNN based on a state-of-the-art model designed for time series classification, named "3-layer CNN", fed by univariate time series (i.e., preprocessed EEG signals). This model is used for binary (‘clean’, ‘noisy’) and multi-label (‘clean’, ‘muscular artifacts’, ‘ocular artifacts’) classification tasks. 2. A simple implemented CNN architecture, named "1-layer CNN", is used for multilabel classification. This model takes the time series autocorrelation function as input. The binary and multi-label classification were performed on the manually generated datasets and tested on three experimentally acquired data (i.e., D1, D2 and D3). A five-fold validation training strategy was used to assess the performance of the obtained models. The generated data specialized model (i.e., "3-layers CNN") achieved the best classification performance with an accuracy and global average F1-score equal to 0.955. However, this model was unable to make predictions about the experimental data. In contrast, the simple generalized model (i.e., 1-layer CNN), which uses the autocorrelation function of the EEG signals as input instead of the EEG directly, obtained a lower score of 0.904 for accuracy and F1-score. This latter model could make predictions on the three test datasets, achieving accuracy and F1-score equal to 0.808, 0.855 and 0.860 for D1, D2 and D3 respectively, after applying a corrective algorithm, consistently with results obtained by other similar studies in the literature.

L’elettroencefalogramma (EEG) consiste nella registrazione dell’attività elettrica del cervello, proveniente principalmente dalla corteccia cerebrale. L’EEG è uno strumento molto utile per studiare il funzionamento del cervello umano, ma risulta essere fortemente influenzato da segnali indesiderati generati principalmente da attività fisiologiche (ad esempio battito delle ciglia, movimenti della testa, attività muscolari). In letteratura sono stati proposti diversi metodi per gestire gli artefatti rimuovendoli, scartando le epoche corrotte dal segnale rumoroso oppure identificando i periodi contenenti l’artefatto. In merito a questo, l’applicazione di tecniche di Machine Learning (ML) per distinguere le sequenze di segnale EEG prive di artefatti da quelle contaminate, risulta essere sempre più utilizzata negli ultimi anni. Tuttavia, i metodi di ML presentano un grande limite dovuto alla necessità di selezionare a priori delle feature del segnale EEG. I metodi di Deep Learning (DL) rappresentano una valida alternativa ai metodi di ML, grazie alla capacità di estrarre automaticamente le feature desiderate. A questo proposito, le reti convoluzionali (CNNs) mostrano un forte potenziale nell’elaborazione dei segnali biologici. Le prestazioni di una rete di DL, però, dipendono fortemente dalle dimensioni del dataset utilizzato in fase di training e in fase di test. Per soddisfare i requisiti di un grande dataset i modelli di DL sono stati addestrati e testati su un dataset generato manualmente in modo coerente e robusto, tenendo conto delle diverse caratteristiche dei segnali EEG e degli artefatti. Questa tesi ha lo scopo di creare dei modelli di DL basati su CNN per la classificazione di epoche di segnale EEG in "pulite", affette da "artefatto muscolare" oppure "artefatto oculare" , senza la necessità di avere input esterni. Sono state considerate due diverse strutture di reti: 1. Una CNN la cui struttura si basa su un modello esistente per la classificazione di time series, chiamata “3-layers CNN”, che riceve in input serie temporali univariate (i.e., il segnale EEG pre-processato). Questo modello è stato usato per la classificazione binaria ("pulito", "rumoroso") e multiclasse ("pulito", "artefatto muscolare", "artefatto oculare"). 2. Una rete convoluzionale con una struttura semplificata, chiamata “1-layer CNN”, usata per la classificazione multiclasse. Questo modello riceve in input la funzione di autocorrelazione calcolata per la corrispondente time series. La classificazione binaria e multiclasse è stata poi effettuata sui dataset generati manualmente e testata su tre diversi dataset acquisiti sperimentalmente. Per valutare le performance dei modelli ottenuti è stata usata la validazione five-fold. Il modello specializzato sui dati generati (i.e., “3-layers CNN”), ha ottenuto i risultati migliori nella classificazione con un valore di accuratezza e F1-score pari a 0.955 rispettivamente. Tuttavia questo modello non è stato in grado di effettuare predizioni sui dati sperimentali. Per quanto riguarda il modello generalizzato (i.e., “1-layer CNN”), che utilizza come input la funzione di autocorrelazione dei segnali EEG a differenza del segnale puro, sono stati ottenuti dei valori inferiori di accuratezza e F1-score pari a 0.904. Quest’ultimo modello è stato in grado di effettuare predizioni sui tre dataset acquisiti sperimentalmente, ottenendo, dopo aver applicato un algoritmo correttivo, valori di accuratezza e F1-score pari a 0.808, 0.855 e 0.860 per D1, D2 e D3, rispettivamente. I risultati sono coerenti con quanto ottenuto da altri studi presenti in letteratura.

Eeg artifacts detection using convolutional neural networks

TREVISANELLO, NICOLÒ
2021/2022

Abstract

Electroencephalogram (EEG) represents a recording of the brain’s electrical activity, mainly originating from the cortex. EEG is very important for investigating the functioning of the human brain, but it is affected greatly by undesired signals that mainly physiological phenomena can generate (e.g., eye blinks, head movement, muscle activity). In literature, many methods have been proposed to handle artifacts by removing, rejecting or detecting them from the neural recording. In this context, the application of Machine Learning (ML) techniques for distinguishing artifact-free EEG sequences from contaminated ones has been increasingly used in recent years. However, ML methods have a major limitation due to the requirement of a priori selection of EEG features. Deep Learning (DL) models represent an alternative to ML methods, thanks to automatic feature extraction. Here, Convolutional Neural Networks (CNNs) architectures exhibit a strong potential to be used in biological signal processing. However, the performance of a DL network depends on the size of the training and testing dataset. Therefore, to fulfil the requirements of a big dataset, the DL models were trained and tested on a reliable and coherent manually generated dataset, fully addressing the different characteristics of EEG signals and artifacts. This thesis aims to create DL models based on CNN, to classify EEG signal epochs in ‘clean’, affected by "muscular artifacts’, or ‘ocular artifacts’, without needing external reference inputs. This work considers two different architectures: 1. A CNN based on a state-of-the-art model designed for time series classification, named "3-layer CNN", fed by univariate time series (i.e., preprocessed EEG signals). This model is used for binary (‘clean’, ‘noisy’) and multi-label (‘clean’, ‘muscular artifacts’, ‘ocular artifacts’) classification tasks. 2. A simple implemented CNN architecture, named "1-layer CNN", is used for multilabel classification. This model takes the time series autocorrelation function as input. The binary and multi-label classification were performed on the manually generated datasets and tested on three experimentally acquired data (i.e., D1, D2 and D3). A five-fold validation training strategy was used to assess the performance of the obtained models. The generated data specialized model (i.e., "3-layers CNN") achieved the best classification performance with an accuracy and global average F1-score equal to 0.955. However, this model was unable to make predictions about the experimental data. In contrast, the simple generalized model (i.e., 1-layer CNN), which uses the autocorrelation function of the EEG signals as input instead of the EEG directly, obtained a lower score of 0.904 for accuracy and F1-score. This latter model could make predictions on the three test datasets, achieving accuracy and F1-score equal to 0.808, 0.855 and 0.860 for D1, D2 and D3 respectively, after applying a corrective algorithm, consistently with results obtained by other similar studies in the literature.
REALI, PIERLUIGI
ING - Scuola di Ingegneria Industriale e dell'Informazione
6-ott-2022
2021/2022
L’elettroencefalogramma (EEG) consiste nella registrazione dell’attività elettrica del cervello, proveniente principalmente dalla corteccia cerebrale. L’EEG è uno strumento molto utile per studiare il funzionamento del cervello umano, ma risulta essere fortemente influenzato da segnali indesiderati generati principalmente da attività fisiologiche (ad esempio battito delle ciglia, movimenti della testa, attività muscolari). In letteratura sono stati proposti diversi metodi per gestire gli artefatti rimuovendoli, scartando le epoche corrotte dal segnale rumoroso oppure identificando i periodi contenenti l’artefatto. In merito a questo, l’applicazione di tecniche di Machine Learning (ML) per distinguere le sequenze di segnale EEG prive di artefatti da quelle contaminate, risulta essere sempre più utilizzata negli ultimi anni. Tuttavia, i metodi di ML presentano un grande limite dovuto alla necessità di selezionare a priori delle feature del segnale EEG. I metodi di Deep Learning (DL) rappresentano una valida alternativa ai metodi di ML, grazie alla capacità di estrarre automaticamente le feature desiderate. A questo proposito, le reti convoluzionali (CNNs) mostrano un forte potenziale nell’elaborazione dei segnali biologici. Le prestazioni di una rete di DL, però, dipendono fortemente dalle dimensioni del dataset utilizzato in fase di training e in fase di test. Per soddisfare i requisiti di un grande dataset i modelli di DL sono stati addestrati e testati su un dataset generato manualmente in modo coerente e robusto, tenendo conto delle diverse caratteristiche dei segnali EEG e degli artefatti. Questa tesi ha lo scopo di creare dei modelli di DL basati su CNN per la classificazione di epoche di segnale EEG in "pulite", affette da "artefatto muscolare" oppure "artefatto oculare" , senza la necessità di avere input esterni. Sono state considerate due diverse strutture di reti: 1. Una CNN la cui struttura si basa su un modello esistente per la classificazione di time series, chiamata “3-layers CNN”, che riceve in input serie temporali univariate (i.e., il segnale EEG pre-processato). Questo modello è stato usato per la classificazione binaria ("pulito", "rumoroso") e multiclasse ("pulito", "artefatto muscolare", "artefatto oculare"). 2. Una rete convoluzionale con una struttura semplificata, chiamata “1-layer CNN”, usata per la classificazione multiclasse. Questo modello riceve in input la funzione di autocorrelazione calcolata per la corrispondente time series. La classificazione binaria e multiclasse è stata poi effettuata sui dataset generati manualmente e testata su tre diversi dataset acquisiti sperimentalmente. Per valutare le performance dei modelli ottenuti è stata usata la validazione five-fold. Il modello specializzato sui dati generati (i.e., “3-layers CNN”), ha ottenuto i risultati migliori nella classificazione con un valore di accuratezza e F1-score pari a 0.955 rispettivamente. Tuttavia questo modello non è stato in grado di effettuare predizioni sui dati sperimentali. Per quanto riguarda il modello generalizzato (i.e., “1-layer CNN”), che utilizza come input la funzione di autocorrelazione dei segnali EEG a differenza del segnale puro, sono stati ottenuti dei valori inferiori di accuratezza e F1-score pari a 0.904. Quest’ultimo modello è stato in grado di effettuare predizioni sui tre dataset acquisiti sperimentalmente, ottenendo, dopo aver applicato un algoritmo correttivo, valori di accuratezza e F1-score pari a 0.808, 0.855 e 0.860 per D1, D2 e D3, rispettivamente. I risultati sono coerenti con quanto ottenuto da altri studi presenti in letteratura.
File allegati
File Dimensione Formato  
2022_10_Trevisanello.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Dissertation text
Dimensione 10.16 MB
Formato Adobe PDF
10.16 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/195185