Sound localization is a challenging problem with several applications in the Industrial Internet of Things (IIoT). In this work, we focus on the localization of sporadic events producing time-bounded, short sounds. Examples of industrial applications that could benefit from this capability include the automated detection and localization of exploding bottles in wine cellars. This thesis presents a complete system design, both from an algorithmic and architectural perspective, to efficiently perform single sound event detection and localization. Starting from the architectural design, an optimized sound classification and timestamping pipeline has been designed and implemented running atop a microcontroller-based embedded board and operating system. Several such boards are dispersed in the environment to monitor, making it possible to perform localization by means of Time Difference of Arrivals (TDoAs). From an algorithmic perspective, a neural network has been trained to classify ambient sounds to detect breaking bottles, and optimized to fit in the resource constraints of microcontrollers. Successively, four different localization algorithms have been studied in order to find a suitable solution to the localization problem with an acceptable degree of error for a real case scenario.

La localizzazione del suono è un problema impegnativo che presenta diverse applicazioni nell'Industrial Internet of Things (IIoT). In questo lavoro, ci concentriamo sulla localizzazione di eventi sporadici che producono brevi suoni limitati nel tempo. Esempi di applicazioni industriali che potrebbero trarre vantaggio da questa capacità includono il rilevamento automatico e la localizzazione di bottiglie che esplodono nelle cantine. Questa tesi presenta un progetto di sistema completo, sia dal punto di vista algoritmico che architetturale, per eseguire in modo efficiente il rilevamento e la localizzazione di singoli eventi sonori. A partire dalla progettazione dell'architettura, è stata progettata e implementata una pipeline ottimizzata per la classificazione del suono e il timestamp in esecuzione su una scheda e un sistema operativo embedded basati su microcontrollore. Diverse schede di questo tipo sono disperse nell'ambiente da monitorare, consentendo di eseguire la localizzazione mediante Time Difference of Arrivals (TDoAs). Da una prospettiva algoritmica, una rete neurale è stata addestrata per classificare i suoni ambientali per rilevare la rottura di bottiglie e ottimizzata per adattarsi ai vincoli di risorse dei microcontrollori. Successivamente, sono stati studiati quattro diversi algoritmi di localizzazione al fine di trovare una soluzione adeguata al problema di localizzazione con un grado di errore accettabile per uno scenario di caso reale.

Single event sound classification and localization

BRUGALI, GIORGIO
2022/2023

Abstract

Sound localization is a challenging problem with several applications in the Industrial Internet of Things (IIoT). In this work, we focus on the localization of sporadic events producing time-bounded, short sounds. Examples of industrial applications that could benefit from this capability include the automated detection and localization of exploding bottles in wine cellars. This thesis presents a complete system design, both from an algorithmic and architectural perspective, to efficiently perform single sound event detection and localization. Starting from the architectural design, an optimized sound classification and timestamping pipeline has been designed and implemented running atop a microcontroller-based embedded board and operating system. Several such boards are dispersed in the environment to monitor, making it possible to perform localization by means of Time Difference of Arrivals (TDoAs). From an algorithmic perspective, a neural network has been trained to classify ambient sounds to detect breaking bottles, and optimized to fit in the resource constraints of microcontrollers. Successively, four different localization algorithms have been studied in order to find a suitable solution to the localization problem with an acceptable degree of error for a real case scenario.
TERRANEO, FEDERICO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-lug-2023
2022/2023
La localizzazione del suono è un problema impegnativo che presenta diverse applicazioni nell'Industrial Internet of Things (IIoT). In questo lavoro, ci concentriamo sulla localizzazione di eventi sporadici che producono brevi suoni limitati nel tempo. Esempi di applicazioni industriali che potrebbero trarre vantaggio da questa capacità includono il rilevamento automatico e la localizzazione di bottiglie che esplodono nelle cantine. Questa tesi presenta un progetto di sistema completo, sia dal punto di vista algoritmico che architetturale, per eseguire in modo efficiente il rilevamento e la localizzazione di singoli eventi sonori. A partire dalla progettazione dell'architettura, è stata progettata e implementata una pipeline ottimizzata per la classificazione del suono e il timestamp in esecuzione su una scheda e un sistema operativo embedded basati su microcontrollore. Diverse schede di questo tipo sono disperse nell'ambiente da monitorare, consentendo di eseguire la localizzazione mediante Time Difference of Arrivals (TDoAs). Da una prospettiva algoritmica, una rete neurale è stata addestrata per classificare i suoni ambientali per rilevare la rottura di bottiglie e ottimizzata per adattarsi ai vincoli di risorse dei microcontrollori. Successivamente, sono stati studiati quattro diversi algoritmi di localizzazione al fine di trovare una soluzione adeguata al problema di localizzazione con un grado di errore accettabile per uno scenario di caso reale.
File allegati
File Dimensione Formato  
Thesis_Giorgio_Brugali.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: testo della tesi
Dimensione 2.95 MB
Formato Adobe PDF
2.95 MB Adobe PDF   Visualizza/Apri
executive_summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: testo dell'executive summary
Dimensione 334.05 kB
Formato Adobe PDF
334.05 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/209763