The potential of the Internet of Things is leading in recent years to an increasing employment of complex applications in the wireless sensor networks, in which battery supplied sensors are capable of performing complex tasks previously limited to expensive and highly consuming devices. However, wireless sensor networks are still characterized by severe constraints in terms of computational complexity, bandwidth, storage and energy consumption. With the ambitious goal of creating a network of sensors empowered of sight and capable of visual analysis, the GreenEyes project will develop a set of methodologies and algorithms which allow to reduce the energy and computational requirements of the wireless sensor networks. This objective can be achieved by reversing the working paradigm of the actual visual sensor networks, in which visual nodes acquire an image, compress it, and then transmit it to a central controller where the visual analysis task is performed. With the use of the recently introduced binary visual descriptors and the adequate compression techniques, it is possible to design a visual sensor network in which the visual node captures the image, analyzes it locally employing binary descriptors, and then transmits a compact representation of the image, avoiding the redundancy of the pixel-domain representation. With these motivations, in this thesis, which is developed as a contribution to the GreenEyes project, a technique for the compression of location data for the descriptors will be employed. This technique will permit to obtain further bitrate savings, which is necessary to adapt the visual analysis to the constraints of a sensor network scenario. The compression gains will be evaluated and the impact of this lossy coding technique on a platform designed for object recognition using binary descriptors will be analyzed.

Il potenziale dell’internet of things ha condotto negli ultimi anni all’impiego di sempre più complesse applicazioni nelle reti di sensori, nelle quali dispositivi alimentati a batteria sono capaci di svolgere funzioni prima limitate a piattaforme fisse e costose dal punto di vista del consumo energetico, come per esempio il riconoscimento di oggetti o il rilevamento di oggetti. Difatti importante limite per le applicazioni nelle reti di sensori è dato dai forti vincoli energetici, di ampiezza di banda per la trasmissione e di capacità d’immagazzinamento. Con l’ambizioso obiettivo di progettare una rete di sensori dotati di telecamere e capaci di eseguire complesse analisi visuali, la riduzione drastica di complessità computazionale e di consumo energetico sono di primaria importanza. A questo scopo, il progetto GreenEyes mira a sviluppare un insieme di metodologie ed algoritmi che consentano la riduzione delle necessità computazionali ed energetiche tipiche delle reti di sensori visuali. Quest’obiettivo può essere raggiunto attraverso l’inversione del paradigma di funzionamento attualmente usato, in cui i sensori dotati di telecamera svolgono il compito di catturare l’immagine, comprimerla e quindi trasmetterla verso un nodo centrale, in cui viene eseguita l’analisi video dell’immagine. Con l’utilizzo di tecniche di compressione recentemente introdotte e l’utilizzo di descrittori visuali binari di ultima generazione, diventa possibile il progetto di un sensore capace di acquisire un immagine, eseguire analisi visuale localmente e quindi trasmettere solo una descrizione compatta dell’immagine, evitando l’ingombro della rappresentazione pixel-domain. Con questa motivazione, nel presente lavoro di tesi, sviluppata come contributo al progetto GreenEyes, s’impiegherà una tecnica per la compressione di dati relativi alla localizzazione dei descrittori binari, che permetterà un ulteriore risparmio di banda e di memoria richiesta per l’archiviazione di questi dati. Verranno esaminati i guadagni di compressione, nonché l’impatto di questa tecnica sulle prestazioni di una piattaforma sviluppata per il riconoscimento di oggetti attraverso l’utilizzo dei descrittori visuali binari.

Low bit rate representation of visual binary descriptors

PANTI, BERNER KIKE
2013/2014

Abstract

The potential of the Internet of Things is leading in recent years to an increasing employment of complex applications in the wireless sensor networks, in which battery supplied sensors are capable of performing complex tasks previously limited to expensive and highly consuming devices. However, wireless sensor networks are still characterized by severe constraints in terms of computational complexity, bandwidth, storage and energy consumption. With the ambitious goal of creating a network of sensors empowered of sight and capable of visual analysis, the GreenEyes project will develop a set of methodologies and algorithms which allow to reduce the energy and computational requirements of the wireless sensor networks. This objective can be achieved by reversing the working paradigm of the actual visual sensor networks, in which visual nodes acquire an image, compress it, and then transmit it to a central controller where the visual analysis task is performed. With the use of the recently introduced binary visual descriptors and the adequate compression techniques, it is possible to design a visual sensor network in which the visual node captures the image, analyzes it locally employing binary descriptors, and then transmits a compact representation of the image, avoiding the redundancy of the pixel-domain representation. With these motivations, in this thesis, which is developed as a contribution to the GreenEyes project, a technique for the compression of location data for the descriptors will be employed. This technique will permit to obtain further bitrate savings, which is necessary to adapt the visual analysis to the constraints of a sensor network scenario. The compression gains will be evaluated and the impact of this lossy coding technique on a platform designed for object recognition using binary descriptors will be analyzed.
ASCENSO, JOAO
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2014
2013/2014
Il potenziale dell’internet of things ha condotto negli ultimi anni all’impiego di sempre più complesse applicazioni nelle reti di sensori, nelle quali dispositivi alimentati a batteria sono capaci di svolgere funzioni prima limitate a piattaforme fisse e costose dal punto di vista del consumo energetico, come per esempio il riconoscimento di oggetti o il rilevamento di oggetti. Difatti importante limite per le applicazioni nelle reti di sensori è dato dai forti vincoli energetici, di ampiezza di banda per la trasmissione e di capacità d’immagazzinamento. Con l’ambizioso obiettivo di progettare una rete di sensori dotati di telecamere e capaci di eseguire complesse analisi visuali, la riduzione drastica di complessità computazionale e di consumo energetico sono di primaria importanza. A questo scopo, il progetto GreenEyes mira a sviluppare un insieme di metodologie ed algoritmi che consentano la riduzione delle necessità computazionali ed energetiche tipiche delle reti di sensori visuali. Quest’obiettivo può essere raggiunto attraverso l’inversione del paradigma di funzionamento attualmente usato, in cui i sensori dotati di telecamera svolgono il compito di catturare l’immagine, comprimerla e quindi trasmetterla verso un nodo centrale, in cui viene eseguita l’analisi video dell’immagine. Con l’utilizzo di tecniche di compressione recentemente introdotte e l’utilizzo di descrittori visuali binari di ultima generazione, diventa possibile il progetto di un sensore capace di acquisire un immagine, eseguire analisi visuale localmente e quindi trasmettere solo una descrizione compatta dell’immagine, evitando l’ingombro della rappresentazione pixel-domain. Con questa motivazione, nel presente lavoro di tesi, sviluppata come contributo al progetto GreenEyes, s’impiegherà una tecnica per la compressione di dati relativi alla localizzazione dei descrittori binari, che permetterà un ulteriore risparmio di banda e di memoria richiesta per l’archiviazione di questi dati. Verranno esaminati i guadagni di compressione, nonché l’impatto di questa tecnica sulle prestazioni di una piattaforma sviluppata per il riconoscimento di oggetti attraverso l’utilizzo dei descrittori visuali binari.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Thesis Berner Panti.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 2.67 MB
Formato Adobe PDF
2.67 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/94399