Verbal communication plays a crucial role in human life. Nowadays, with the evolution of information technologies, a lot of research effort focuses on how to code and transmit speech information through a telecommunication channel, from many different research fields such as linguistics, computer science, and engineering. The massive use of mobiles in our daily life has brought out a new need for a hands-free characteristic embedded in our devices that, whereas maintaining a good usability, can limit the wrong and potentially dangerous use. At the same time, especially in business, the need for an effective worldwide communication has led engineers to design more and more sophisticated teleconferencing systems. Among them, the ones that received an important interest are the multichannel systems, which, having more than one loudspeakers and microphones, can reproduce the acoustic environment in a more realistic way and thus allow, at a distance, the identification of the different speakers and the relative voice directionality. A full-duplex communication system is subject to various issues, including the generation of an acoustic effect analogous to an echo, which is a reflected sound returning to the origin environment. The latter has become a central research topic. The use of time-varying techniques, such as Adaptive Filtering, has made possible to obtain an optimum model of the acoustic diffusion and then an echo reduction. For the mono channel case, the research has come to the development of great performance systems, whereas maintaining the costs limited. However, in the multichannel case, the problem gets too much complex and it turns out to be almost impossible to directly generalise them from the monochannel systems. In this case, the research moves towards the of alternative solutions development to take full advantage of multichannel system potential, while maintaining a view at the trade-off between performance and costs. The goal of this thesis is then to analyse and the echo cancellation systems state of the art and implement an algorithm, independently from the application and setup, which aims to be robust and computationally non prohibitive.

La comunicazione verbale gioca un ruolo fondamentale nella vita quotidiana. Con l'evoluzione delle tecnologie informatiche, il modo in cui trasmettiamo e codifichiamo le informazioni di un segnale audio attraverso un canale di comunicazione è diventato un importante tema di ricerca, che coinvolge discipline come la linguistica, l'informatica e l'ingegneria. L'uso massivo dei cellulari ha generato il bisogno di avere caratteristiche viva-voce integrate nei dispositivi che, pur mantenendo una buona usabilità, possano limitarne l’utilizzo scorretto e potenzialmente pericoloso. Parallelamente, soprattutto in ambiti aziendali, la necessità di una comunicazione efficace su larga scala, ha portato gli studiosi a creare sistemi di teleconferenza sempre più sofisticati. Tra questi, di particolare interesse sono i sistemi multicanale, cioè quei sistemi che utilizzando più casse e microfoni riproducono in modo più realistico un ambiente acustico e permettono così, anche a distanza, l'identificazione dei diversi oratori e la relativa direzionalità della voce. Un sistema di comunicazione full-duplex è soggetto a diverse problematiche tra cui la generazione di un effetto assimilabile ad un'eco acustica, ossia un ritorno del suono all'ambiente di provenienza. Quest'ultima ha suscitato un maggiore interesse tra i ricercatori. L’uso di tecniche tempo varianti, come ad esempio l’Adaptive Filtering, ha permesso di ottenere una modellazione ottimale della diffusione acustica da riuscire a ridurne l’eco. Per il caso monocanale, la ricerca è giunta fino alla realizzazione di sistemi ben performanti, mantenendo però i costi limitati. Nel caso multicanale, invece, si presentano problematiche più complesse, dettate dalla difficoltà di generalizzare tali sistemi direttamente da quelli monocanale. La ricerca è orientata allo sviluppo di soluzioni alternative in modo da sfruttarne a pieno le potenzialità, cercando però di bilanciare performance e costi. Questa tesi si pone l’obiettivo di analizzare lo stato dell’arte esistente per la riduzione dell'eco e di implementare un algoritmo che, indipendentemente dall’applicazione e configurazione, risulti robusto e ad un costo non proibitivo.

Optimized implementation of a multichannel acoustic echo cancellation system based on the GFDAF algorithm

GABBRIELLI, MATTIA
2016/2017

Abstract

Verbal communication plays a crucial role in human life. Nowadays, with the evolution of information technologies, a lot of research effort focuses on how to code and transmit speech information through a telecommunication channel, from many different research fields such as linguistics, computer science, and engineering. The massive use of mobiles in our daily life has brought out a new need for a hands-free characteristic embedded in our devices that, whereas maintaining a good usability, can limit the wrong and potentially dangerous use. At the same time, especially in business, the need for an effective worldwide communication has led engineers to design more and more sophisticated teleconferencing systems. Among them, the ones that received an important interest are the multichannel systems, which, having more than one loudspeakers and microphones, can reproduce the acoustic environment in a more realistic way and thus allow, at a distance, the identification of the different speakers and the relative voice directionality. A full-duplex communication system is subject to various issues, including the generation of an acoustic effect analogous to an echo, which is a reflected sound returning to the origin environment. The latter has become a central research topic. The use of time-varying techniques, such as Adaptive Filtering, has made possible to obtain an optimum model of the acoustic diffusion and then an echo reduction. For the mono channel case, the research has come to the development of great performance systems, whereas maintaining the costs limited. However, in the multichannel case, the problem gets too much complex and it turns out to be almost impossible to directly generalise them from the monochannel systems. In this case, the research moves towards the of alternative solutions development to take full advantage of multichannel system potential, while maintaining a view at the trade-off between performance and costs. The goal of this thesis is then to analyse and the echo cancellation systems state of the art and implement an algorithm, independently from the application and setup, which aims to be robust and computationally non prohibitive.
SANNINO, ROBERTO
D'ARIA, MATTEO
ING - Scuola di Ingegneria Industriale e dell'Informazione
4-ott-2017
2016/2017
La comunicazione verbale gioca un ruolo fondamentale nella vita quotidiana. Con l'evoluzione delle tecnologie informatiche, il modo in cui trasmettiamo e codifichiamo le informazioni di un segnale audio attraverso un canale di comunicazione è diventato un importante tema di ricerca, che coinvolge discipline come la linguistica, l'informatica e l'ingegneria. L'uso massivo dei cellulari ha generato il bisogno di avere caratteristiche viva-voce integrate nei dispositivi che, pur mantenendo una buona usabilità, possano limitarne l’utilizzo scorretto e potenzialmente pericoloso. Parallelamente, soprattutto in ambiti aziendali, la necessità di una comunicazione efficace su larga scala, ha portato gli studiosi a creare sistemi di teleconferenza sempre più sofisticati. Tra questi, di particolare interesse sono i sistemi multicanale, cioè quei sistemi che utilizzando più casse e microfoni riproducono in modo più realistico un ambiente acustico e permettono così, anche a distanza, l'identificazione dei diversi oratori e la relativa direzionalità della voce. Un sistema di comunicazione full-duplex è soggetto a diverse problematiche tra cui la generazione di un effetto assimilabile ad un'eco acustica, ossia un ritorno del suono all'ambiente di provenienza. Quest'ultima ha suscitato un maggiore interesse tra i ricercatori. L’uso di tecniche tempo varianti, come ad esempio l’Adaptive Filtering, ha permesso di ottenere una modellazione ottimale della diffusione acustica da riuscire a ridurne l’eco. Per il caso monocanale, la ricerca è giunta fino alla realizzazione di sistemi ben performanti, mantenendo però i costi limitati. Nel caso multicanale, invece, si presentano problematiche più complesse, dettate dalla difficoltà di generalizzare tali sistemi direttamente da quelli monocanale. La ricerca è orientata allo sviluppo di soluzioni alternative in modo da sfruttarne a pieno le potenzialità, cercando però di bilanciare performance e costi. Questa tesi si pone l’obiettivo di analizzare lo stato dell’arte esistente per la riduzione dell'eco e di implementare un algoritmo che, indipendentemente dall’applicazione e configurazione, risulti robusto e ad un costo non proibitivo.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_10_Gabbrielli.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Thesis text
Dimensione 5.12 MB
Formato Adobe PDF
5.12 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/136443