The need to bring artificial intelligence innovations into contexts, where the client-server paradigm has limitations, has directed interest towards new approaches that allow advanced models to be exploited even in inadequate environments. These approaches involve the use of TinyML, the running of AI models on micro-devices. Several benefits are introduced, including the possibility of processing information in place without the need for a network, security regarding data privacy and its ecological impact. The main objective is to achieve acceptable performance on devices with limited computational capabilities. In the following paper, a new deep learning architecture for object detection will be proposed that adapts to the limitations of micro-devices in order to compete with state-of-the-art models. The model aims at optimizing three measures: memory occupancy, execution time and accuracy. These goals were achieved by remodeling the state-of-the-art SSD in order to be performant on microdevices. In particular: • All the layers have been modified by moving from the classic CNNs to the Squeeze Next block architecture, multi-layer blocks with characteristics like separable convolution but with higher performance. • The Early Exit concept was introduced, which fits perfectly with the SSD structure. This approach allows the execution of the model to be interrupted as soon as a favorable condition is reached. The architecture of the SSD, divided into 6 macro blocks, allowed these conditional gates to be inserted between each of the blocks using support layers. The results of these approaches led to the achievement of the set objectives, resulting in a model suitable for operation on a micro-device.

La necessità di portare le innovazioni dell'intelligenza artificiale in contesti in cui il paradigma client server ha delle limitazioni ha direzionato l'interesse verso nuovi approcci che permettessero di sfruttare modelli avanzati anche in ambienti inadeguati. Questi approcci implicano l'utilizzo del TinyML ovvero il running di modelli di AI su microdispositivi. Vengono introdotti diversi benefici tra i quali la possibilità di elaborare le informazioni in loco senza la necessità di un network, la sicurezza in merito alla privacy dei dati e il suo impatto ecologico. L'obiettivo principale consiste nel raggiungimento di performance accettabili su dispositivi con capacità computazionali limitate. Nel seguente elaborato verrà proposta una nuova architettura di deep learning per l'object detection che si adatta ai limiti dei microdispositivi con il fine di competere con i modelli dello stato dell'arte. Il modello mira all'ottimizzazione di tre misure: occupazione di memoria, tempo di esecuzione e accuratezza. Questi obiettivi sono stati raggiunti rimodellando lo stato dell'arte SSD al fine di essere performante su microdispositivi. In particolare: • sono stati modificati tutti i layer attraverso un passaggio dai classici CNN all' architettura SqueezeNext block, blocchi multi strato che presentano caratteristiche simili ai separable convolution ma più performanti. • è stato introdotto il concetto di Early exit che si sposa perfettamente con la struttura dell'SSD. Questo approccio permette di interrompere l'esecuzione del modello non appena raggiunta una condizione favorevole. L'architettura dell'SSD, divisa in 6 macro blocchi, ha permesso di inserire questi gate condizionali tra ognuno dei blocchi attraverso l'utilizzo di strati di supporto. I risultati di questi approcci hanno portato al raggiungimento degli obiettivi prefissati, ottenendo un modello adatto al funzionamento su un microdispositivo.

Object-detection at the edge

Carratta, Francesco
2021/2022

Abstract

The need to bring artificial intelligence innovations into contexts, where the client-server paradigm has limitations, has directed interest towards new approaches that allow advanced models to be exploited even in inadequate environments. These approaches involve the use of TinyML, the running of AI models on micro-devices. Several benefits are introduced, including the possibility of processing information in place without the need for a network, security regarding data privacy and its ecological impact. The main objective is to achieve acceptable performance on devices with limited computational capabilities. In the following paper, a new deep learning architecture for object detection will be proposed that adapts to the limitations of micro-devices in order to compete with state-of-the-art models. The model aims at optimizing three measures: memory occupancy, execution time and accuracy. These goals were achieved by remodeling the state-of-the-art SSD in order to be performant on microdevices. In particular: • All the layers have been modified by moving from the classic CNNs to the Squeeze Next block architecture, multi-layer blocks with characteristics like separable convolution but with higher performance. • The Early Exit concept was introduced, which fits perfectly with the SSD structure. This approach allows the execution of the model to be interrupted as soon as a favorable condition is reached. The architecture of the SSD, divided into 6 macro blocks, allowed these conditional gates to be inserted between each of the blocks using support layers. The results of these approaches led to the achievement of the set objectives, resulting in a model suitable for operation on a micro-device.
PAVAN, MASSIMO
SCARDAPANE, SIMONE
ING - Scuola di Ingegneria Industriale e dell'Informazione
22-lug-2022
2021/2022
La necessità di portare le innovazioni dell'intelligenza artificiale in contesti in cui il paradigma client server ha delle limitazioni ha direzionato l'interesse verso nuovi approcci che permettessero di sfruttare modelli avanzati anche in ambienti inadeguati. Questi approcci implicano l'utilizzo del TinyML ovvero il running di modelli di AI su microdispositivi. Vengono introdotti diversi benefici tra i quali la possibilità di elaborare le informazioni in loco senza la necessità di un network, la sicurezza in merito alla privacy dei dati e il suo impatto ecologico. L'obiettivo principale consiste nel raggiungimento di performance accettabili su dispositivi con capacità computazionali limitate. Nel seguente elaborato verrà proposta una nuova architettura di deep learning per l'object detection che si adatta ai limiti dei microdispositivi con il fine di competere con i modelli dello stato dell'arte. Il modello mira all'ottimizzazione di tre misure: occupazione di memoria, tempo di esecuzione e accuratezza. Questi obiettivi sono stati raggiunti rimodellando lo stato dell'arte SSD al fine di essere performante su microdispositivi. In particolare: • sono stati modificati tutti i layer attraverso un passaggio dai classici CNN all' architettura SqueezeNext block, blocchi multi strato che presentano caratteristiche simili ai separable convolution ma più performanti. • è stato introdotto il concetto di Early exit che si sposa perfettamente con la struttura dell'SSD. Questo approccio permette di interrompere l'esecuzione del modello non appena raggiunta una condizione favorevole. L'architettura dell'SSD, divisa in 6 macro blocchi, ha permesso di inserire questi gate condizionali tra ognuno dei blocchi attraverso l'utilizzo di strati di supporto. I risultati di questi approcci hanno portato al raggiungimento degli obiettivi prefissati, ottenendo un modello adatto al funzionamento su un microdispositivo.
File allegati
File Dimensione Formato  
Object-Detection at the Edge.pdf

solo utenti autorizzati dal 18/06/2023

Dimensione 2.41 MB
Formato Adobe PDF
2.41 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/189912