Space-time audio processing has assumed great significance and importance for many applications such as source localization, tracking, beam-shaping, and many more. In this thesis we want to propose a different approach to acoustic source localization on a plane by measuring time differences of arrival (TDOA). We base our approach on a frame which uses three coordinates instead of only two, also for 2D localization. We could say that the third coordinate is to be interpreted as time or, vice-versa, that the three-coordinate system has a similar structure to projective geometry coordinates, where scaling factor now matters. In practice each point of this space identifies a point on the plane where source lies, in a specific time instant. In this framework we represent the signal emitted by the source as a cone the vertex coinciding with the source position, or a circle projected in the third dimension increasing its radius as third coordinate increases. In the 3D space, each pair of TDOA measurement and microphone position represents a point through which the cone is supposed to pass. Localization problem is thus turned into a cone fitting problem. The above cone fitting method can also be applied to multi-source case. In regard to this, a particular case is given when image sources are created by reflections on walls. Therefore, we show how to apply our localization method also to image sources. In doing so we can infer a reflector position based on real and image sources locations. For all the above problems, we provide simulations and experimental results as well as comparisons with other techniques proposed in the literature. These comparisons show that the proposed algorithms perform at least as well as the best ones we selected, but using the projective space and dealing with conics allows us to write constraints in a compact notation, more suitable when handling many constraints. One of our algorithms is also more robust when used with noisy measurements.

Lo space-time audio processing ha assunto notevole importanza per molte applicazioni come la localizzazione di sorgente, il tracking, il beam-shaping, e altre. In questa tesi vogliamo mostrare un approccio differente per la localizzazione di una sorgente acustica su un piano da misure di differenze di tempi d'arrivo (TDOA). Basiamo il nostro approccio su un sistema di coordinate che ne usa tre al posto di due, nonostante localizzi nel 2D. Diciamo che la terza coordinata va interpretata come tempo o, viceversa, che il sistema di tre coordinate ha una struttura simile a quelle della geometria proiettiva, in cui il fattore di scala ora conta. In pratica ogni punto di questo spazio identifica un punto del piano su cui giace la sorgente in uno specifico istante di tempo. In questo scenario rappresentiamo il segnale emesso come un cono col vertice nella posizione della sorgente, o un cerchio proiettato nella terza dimensione col raggio che aumenta all'aumentare della terza coordinata. Nello spazio 3D, ogni coppia di misure di TDOA e di posizione di un microfono rappresenta un punto attraverso il quale il cono dovrebbe passare. Il problema della localizzazione si trasforma dunque nel problema di ricerca di un cono passante per dei punti. Questo metodo di ricerca del cono può essere utilizzato anche nel caso di sorgenti multiple. Un caso particolare si ha quando delle sorgenti immagine sono create dalla presenza di riflettori. In questo caso, localizzando le sorgenti reali e immagine possiamo inferire anche la posizione di un riflettore. Per i problemi citati forniamo simulazioni e risultati sperimentali oltre ad un confronto con tecniche trovate in letteratura. Il confronto mostra che gli algoritmi proposti si comportano bene almeno quanto i migliori tra quelli testati, ma l'uso dello spazio proiettivo e l'avere a che fare con coniche permette di scrivere i vincoli in maniera compatta, preferibile quando si utilizzano molti vincoli. Uno dei nostri algoritmi è anche più robusto degli altri in presenza di misure rumorose.

A geometric approach to localization of acoustic sources and reflectors

BESTAGINI, PAOLO
2009/2010

Abstract

Space-time audio processing has assumed great significance and importance for many applications such as source localization, tracking, beam-shaping, and many more. In this thesis we want to propose a different approach to acoustic source localization on a plane by measuring time differences of arrival (TDOA). We base our approach on a frame which uses three coordinates instead of only two, also for 2D localization. We could say that the third coordinate is to be interpreted as time or, vice-versa, that the three-coordinate system has a similar structure to projective geometry coordinates, where scaling factor now matters. In practice each point of this space identifies a point on the plane where source lies, in a specific time instant. In this framework we represent the signal emitted by the source as a cone the vertex coinciding with the source position, or a circle projected in the third dimension increasing its radius as third coordinate increases. In the 3D space, each pair of TDOA measurement and microphone position represents a point through which the cone is supposed to pass. Localization problem is thus turned into a cone fitting problem. The above cone fitting method can also be applied to multi-source case. In regard to this, a particular case is given when image sources are created by reflections on walls. Therefore, we show how to apply our localization method also to image sources. In doing so we can infer a reflector position based on real and image sources locations. For all the above problems, we provide simulations and experimental results as well as comparisons with other techniques proposed in the literature. These comparisons show that the proposed algorithms perform at least as well as the best ones we selected, but using the projective space and dealing with conics allows us to write constraints in a compact notation, more suitable when handling many constraints. One of our algorithms is also more robust when used with noisy measurements.
ANTONACCI, FABIO
ING V - Facolta' di Ingegneria dell'Informazione
20-dic-2010
2009/2010
Lo space-time audio processing ha assunto notevole importanza per molte applicazioni come la localizzazione di sorgente, il tracking, il beam-shaping, e altre. In questa tesi vogliamo mostrare un approccio differente per la localizzazione di una sorgente acustica su un piano da misure di differenze di tempi d'arrivo (TDOA). Basiamo il nostro approccio su un sistema di coordinate che ne usa tre al posto di due, nonostante localizzi nel 2D. Diciamo che la terza coordinata va interpretata come tempo o, viceversa, che il sistema di tre coordinate ha una struttura simile a quelle della geometria proiettiva, in cui il fattore di scala ora conta. In pratica ogni punto di questo spazio identifica un punto del piano su cui giace la sorgente in uno specifico istante di tempo. In questo scenario rappresentiamo il segnale emesso come un cono col vertice nella posizione della sorgente, o un cerchio proiettato nella terza dimensione col raggio che aumenta all'aumentare della terza coordinata. Nello spazio 3D, ogni coppia di misure di TDOA e di posizione di un microfono rappresenta un punto attraverso il quale il cono dovrebbe passare. Il problema della localizzazione si trasforma dunque nel problema di ricerca di un cono passante per dei punti. Questo metodo di ricerca del cono può essere utilizzato anche nel caso di sorgenti multiple. Un caso particolare si ha quando delle sorgenti immagine sono create dalla presenza di riflettori. In questo caso, localizzando le sorgenti reali e immagine possiamo inferire anche la posizione di un riflettore. Per i problemi citati forniamo simulazioni e risultati sperimentali oltre ad un confronto con tecniche trovate in letteratura. Il confronto mostra che gli algoritmi proposti si comportano bene almeno quanto i migliori tra quelli testati, ma l'uso dello spazio proiettivo e l'avere a che fare con coniche permette di scrivere i vincoli in maniera compatta, preferibile quando si utilizzano molti vincoli. Uno dei nostri algoritmi è anche più robusto degli altri in presenza di misure rumorose.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2010_12_Bestagini.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 4.39 MB
Formato Adobe PDF
4.39 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/11981