This study presents a novel approach to decode imagined speech based on EEG signals. The aim is to uncover the linguistic and grammatical properties of imagined words from brain activity patterns. The experimental protocol involves presenting subjects with words while recording EEG signals using a 64-channel cap connected to an amplifier. Each word is associated with specific linguistic properties, such as length, presence of doubles, and category of meaning. The protocol consists of several phases, including fixation, visual cue presentation, thinking, and rest periods. \\ The acquired EEG signals undergo meticulous preprocessing to eliminate noise and artifacts. The preprocessing involves filtering, channel selection, resampling, and noise removal using Independent Component Analysis (ICA). The resulting clean signals are then subjected to feature extraction, encompassing statistical, spectral, and fractal domain features. These features are selected using a stepwise process involving Kruskal-Wallis statistical tests, correlation analysis, and Maximum Relevance Minimum Redundancy (MRMR) technique. The MRMR method systematically reduces the dimensionality of features while enhancing classification performance. \\ \\ Classification models are trained and evaluated to predict the linguistic and grammatical properties of imagined words. The models encompass basic classifiers and more complex ones, such as MultiLayer Perceptron (MLP), K-Nearest Neighbors (KNN), Linear Discriminant Analysis (LDA), and Quadratic Linear Analysis (QDA). An ensemble approach involving a Linear Discriminant Analysis (LDA) model is employed to enhance classification accuracy. \\ Results indicate that the proposed methodology effectively extracts features from EEG signals to decode linguistic and grammatical properties of imagined words. The predictions from the three independent classification tasks are aggregated to recover the original word, opening avenues for future validation and integration with Large Language Models for comprehensive word decoding. \\ This research introduces a promising paradigm for the decoding of imagined speech, with potential applications in neurocognitive and brain-computer interface studies. The proposed methodology enhances our understanding of the neural correlates of linguistic and grammatical properties during imagined speech, contributing to advancements in language neuroscience and neurotechnology.

Questo studio presenta un approccio innovativo per decodificare l'Imagined Speech attraverso i segnali EEG. L'obiettivo è rivelare le proprietà linguistiche e grammaticali delle parole immaginate attraverso i modelli di attività cerebrale. Il protocollo sperimentale coinvolge soggetti ai quali vengono presentate parole mentre vengono registrati i segnali EEG utilizzando un cappuccio a 64 canali collegato a un amplificatore. Ogni parola è associata a proprietà linguistiche specifiche, come lunghezza, presenza di doppie consonanti e categoria di significato. Il protocollo comprende diverse fasi, tra cui fissazione, presentazione di segnali visivi, periodo di riflessione e di riposo. \\ I segnali EEG acquisiti vengono sottoposti a un'accurata pre-elaborazione per eliminare rumori e artefatti. La pre-elaborazione coinvolge filtraggio, selezione di canali, campionamento e rimozione del rumore utilizzando la Analisi delle Componenti Indipendenti (ICA). I segnali puliti risultanti sono quindi sottoposti all'estrazione di caratteristiche, che comprendono caratteristiche statistiche, spettrali e del dominio frattale. Queste caratteristiche vengono selezionate utilizzando un processo graduale che coinvolge test statistici di Kruskal-Wallis, analisi di correlazione e la tecnica Maximum Relevance Minimum Redundancy (MRMR). Il metodo MRMR riduce sistematicamente la dimensionalità delle caratteristiche migliorando al contempo le prestazioni di classificazione. \\ \\ I modelli di classificazione vengono addestrati e valutati per prevedere le proprietà linguistiche e grammaticali delle parole immaginate. I modelli comprendono classificatori di base e modelli più complessi, come il Perceptron Multi-Livello (MLP), i K-Nearest Neighbors (KNN), l'Analisi Discriminante Lineare (LDA) e l'Analisi Lineare Quadratica (QDA). Un approccio di ensemble che coinvolge un modello di Analisi Discriminante Lineare (LDA) viene utilizzato per migliorare l'accuratezza della classificazione. \\ I risultati indicano che la metodologia proposta estrae efficacemente le caratteristiche dai segnali EEG per decodificare le proprietà linguistiche e grammaticali delle parole immaginate. Le previsioni ottenute dalle tre attività di classificazione indipendenti vengono aggregate per recuperare la parola originale, aprendo vie per una futura validazione e integrazione con dei Large Language Models per una decodifica completa delle parole. \\ Questa ricerca introduce un paradigma promettente per la decodifica del Imagined Speech, con possibili applicazioni negli studi di neurocognizione e nelle interfacce cervello-computer. La metodologia proposta aumenta la nostra comprensione delle correlate neurali delle proprietà linguistiche e grammaticali durante il linguaggio immaginato, contribuendo agli avanzamenti nella neuroscienza del linguaggio e nelle neurotecnologie.

A Word Recognition Paradigm Through EEG Analysis: Imagined Speech Classification

IACOMI, FRANCESCO
2022/2023

Abstract

This study presents a novel approach to decode imagined speech based on EEG signals. The aim is to uncover the linguistic and grammatical properties of imagined words from brain activity patterns. The experimental protocol involves presenting subjects with words while recording EEG signals using a 64-channel cap connected to an amplifier. Each word is associated with specific linguistic properties, such as length, presence of doubles, and category of meaning. The protocol consists of several phases, including fixation, visual cue presentation, thinking, and rest periods. \\ The acquired EEG signals undergo meticulous preprocessing to eliminate noise and artifacts. The preprocessing involves filtering, channel selection, resampling, and noise removal using Independent Component Analysis (ICA). The resulting clean signals are then subjected to feature extraction, encompassing statistical, spectral, and fractal domain features. These features are selected using a stepwise process involving Kruskal-Wallis statistical tests, correlation analysis, and Maximum Relevance Minimum Redundancy (MRMR) technique. The MRMR method systematically reduces the dimensionality of features while enhancing classification performance. \\ \\ Classification models are trained and evaluated to predict the linguistic and grammatical properties of imagined words. The models encompass basic classifiers and more complex ones, such as MultiLayer Perceptron (MLP), K-Nearest Neighbors (KNN), Linear Discriminant Analysis (LDA), and Quadratic Linear Analysis (QDA). An ensemble approach involving a Linear Discriminant Analysis (LDA) model is employed to enhance classification accuracy. \\ Results indicate that the proposed methodology effectively extracts features from EEG signals to decode linguistic and grammatical properties of imagined words. The predictions from the three independent classification tasks are aggregated to recover the original word, opening avenues for future validation and integration with Large Language Models for comprehensive word decoding. \\ This research introduces a promising paradigm for the decoding of imagined speech, with potential applications in neurocognitive and brain-computer interface studies. The proposed methodology enhances our understanding of the neural correlates of linguistic and grammatical properties during imagined speech, contributing to advancements in language neuroscience and neurotechnology.
FARABBI, ANDREA
MAINARDI, LUCA
MOLLURA, MAXIMILIANO
POLO, EDOARDO MARIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
5-ott-2023
2022/2023
Questo studio presenta un approccio innovativo per decodificare l'Imagined Speech attraverso i segnali EEG. L'obiettivo è rivelare le proprietà linguistiche e grammaticali delle parole immaginate attraverso i modelli di attività cerebrale. Il protocollo sperimentale coinvolge soggetti ai quali vengono presentate parole mentre vengono registrati i segnali EEG utilizzando un cappuccio a 64 canali collegato a un amplificatore. Ogni parola è associata a proprietà linguistiche specifiche, come lunghezza, presenza di doppie consonanti e categoria di significato. Il protocollo comprende diverse fasi, tra cui fissazione, presentazione di segnali visivi, periodo di riflessione e di riposo. \\ I segnali EEG acquisiti vengono sottoposti a un'accurata pre-elaborazione per eliminare rumori e artefatti. La pre-elaborazione coinvolge filtraggio, selezione di canali, campionamento e rimozione del rumore utilizzando la Analisi delle Componenti Indipendenti (ICA). I segnali puliti risultanti sono quindi sottoposti all'estrazione di caratteristiche, che comprendono caratteristiche statistiche, spettrali e del dominio frattale. Queste caratteristiche vengono selezionate utilizzando un processo graduale che coinvolge test statistici di Kruskal-Wallis, analisi di correlazione e la tecnica Maximum Relevance Minimum Redundancy (MRMR). Il metodo MRMR riduce sistematicamente la dimensionalità delle caratteristiche migliorando al contempo le prestazioni di classificazione. \\ \\ I modelli di classificazione vengono addestrati e valutati per prevedere le proprietà linguistiche e grammaticali delle parole immaginate. I modelli comprendono classificatori di base e modelli più complessi, come il Perceptron Multi-Livello (MLP), i K-Nearest Neighbors (KNN), l'Analisi Discriminante Lineare (LDA) e l'Analisi Lineare Quadratica (QDA). Un approccio di ensemble che coinvolge un modello di Analisi Discriminante Lineare (LDA) viene utilizzato per migliorare l'accuratezza della classificazione. \\ I risultati indicano che la metodologia proposta estrae efficacemente le caratteristiche dai segnali EEG per decodificare le proprietà linguistiche e grammaticali delle parole immaginate. Le previsioni ottenute dalle tre attività di classificazione indipendenti vengono aggregate per recuperare la parola originale, aprendo vie per una futura validazione e integrazione con dei Large Language Models per una decodifica completa delle parole. \\ Questa ricerca introduce un paradigma promettente per la decodifica del Imagined Speech, con possibili applicazioni negli studi di neurocognizione e nelle interfacce cervello-computer. La metodologia proposta aumenta la nostra comprensione delle correlate neurali delle proprietà linguistiche e grammaticali durante il linguaggio immaginato, contribuendo agli avanzamenti nella neuroscienza del linguaggio e nelle neurotecnologie.
File allegati
File Dimensione Formato  
Tesi_final.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 7.33 MB
Formato Adobe PDF
7.33 MB Adobe PDF   Visualizza/Apri
Executive_Summary_final.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 1.26 MB
Formato Adobe PDF
1.26 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209595