In the last decade, Deep Learning has become a pervasive element in engineering. The spread of Convolutional Neural Networks in Computer Vision and Image Analysis is a major example. An aspect that has not been studied so far but which has gained increasing interest in the scientific community in recent years is the development of models designed for handling 3-dimensional data. An increasingly popular means of representing this kind of data is the so-called Point Cloud, a set of points distributed in 3D space and sampled directly from the surface of a 3-dimensional object or shape. The Point Cloud's peculiarity is its being `` unstructured '': inside it, the points do not have any intrinsic ordering, nor do they lie in a matrix-like structure, as happens instead for the pixels of an image. On the contrary, the elements belonging to a Point Cloud can assume any configuration in the space from which they are sampled. This work investigates the possibility of extending the paradigm of convolutional networks to this new type of data, defining a new convolutional operator, the Composite Convolution. In order to show the potential of this operator and its implementation, two experiments are also conducted. The first, concerning Multiclass Classification, allows to compare this work with others present in State-of-the-Art; The second, concerning One-Class Classification, refers to a problem not yet studied in the Point Clouds area. In such experiments, we show that our solution can achieve comparable performances with the State-of-the-Art. Moreover, we prove that OC classification can be addressed through the use of Composite Convolution, in a similar way to what is done in the field of images.

Nell'ultimo decennio il Deep Learning è divenuto un elemento pervasivo nell'ambito della tecnica e dell'ingegneria: di ciò è esempio lampante la diffusione delle Reti Neurali Convoluzionali in Computer Vision e Image Analysis. Un aspetto fin ora poco studiato, ma che negli ultimi anni ha guadagnato crescente interesse nella comunità scientifica, è lo sviluppo di modelli capaci di lavorare su dati 3-dimensionali. Un mezzo sempre più diffuso per rappresentare questo genere di dati è la così detta Point Cloud, un insieme di punti distribuiti nello spazio 3D e campionati direttamente dalla superficie di un oggetto o forma 3-dimensionale. La particolarità della Point Cloud è il suo essere ``non strutturata'': al suo interno, infatti, i punti non possiedono un ordinamento intrinseco nè giacciono in una struttura matriciale, come invece succede per i pixel di un'immagine. Al contrario, gli elementi appartenenti a una Point Cloud possono assumere qualsiasi configurazione nello spazio da cui sono campionati. Questo lavoro indaga sulla possibilità di estendere il paradigma proprio delle reti convoluzionali a questo nuovo tipo di dato, definendo un nuovo operatore convoluzionale, la Convoluzione Composita. Per dimostrare le potenzialità di tale operatore e della sua implementazione, vengono inoltre condotti due esperimenti: il primo, riguardante Multiclass Classification, permette di confrontare questo lavoro con altri presenti nello stato dell'arte; Il secondo, riguardante One-Class Classification, fa riferimento a un problema ancora non approfondito in ambito Point Clouds. Tramite questi due esperimenti, si vuole dimostrare che la nostra soluzione è in grado di ottenere performance comparabili allo stato dell'arte. Inoltre, si vuole mostrare come anche problemi quali OC classification possano essere affrontati tramite l'uso della Convoluzione Composita, in maniera simile a ciò che si fa nell'ambito delle immagini.

Composite convolution for 3D point clouds

Floris, Alberto
2020/2021

Abstract

In the last decade, Deep Learning has become a pervasive element in engineering. The spread of Convolutional Neural Networks in Computer Vision and Image Analysis is a major example. An aspect that has not been studied so far but which has gained increasing interest in the scientific community in recent years is the development of models designed for handling 3-dimensional data. An increasingly popular means of representing this kind of data is the so-called Point Cloud, a set of points distributed in 3D space and sampled directly from the surface of a 3-dimensional object or shape. The Point Cloud's peculiarity is its being `` unstructured '': inside it, the points do not have any intrinsic ordering, nor do they lie in a matrix-like structure, as happens instead for the pixels of an image. On the contrary, the elements belonging to a Point Cloud can assume any configuration in the space from which they are sampled. This work investigates the possibility of extending the paradigm of convolutional networks to this new type of data, defining a new convolutional operator, the Composite Convolution. In order to show the potential of this operator and its implementation, two experiments are also conducted. The first, concerning Multiclass Classification, allows to compare this work with others present in State-of-the-Art; The second, concerning One-Class Classification, refers to a problem not yet studied in the Point Clouds area. In such experiments, we show that our solution can achieve comparable performances with the State-of-the-Art. Moreover, we prove that OC classification can be addressed through the use of Composite Convolution, in a similar way to what is done in the field of images.
FRITTOLI, LUCA
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2020/2021
Nell'ultimo decennio il Deep Learning è divenuto un elemento pervasivo nell'ambito della tecnica e dell'ingegneria: di ciò è esempio lampante la diffusione delle Reti Neurali Convoluzionali in Computer Vision e Image Analysis. Un aspetto fin ora poco studiato, ma che negli ultimi anni ha guadagnato crescente interesse nella comunità scientifica, è lo sviluppo di modelli capaci di lavorare su dati 3-dimensionali. Un mezzo sempre più diffuso per rappresentare questo genere di dati è la così detta Point Cloud, un insieme di punti distribuiti nello spazio 3D e campionati direttamente dalla superficie di un oggetto o forma 3-dimensionale. La particolarità della Point Cloud è il suo essere ``non strutturata'': al suo interno, infatti, i punti non possiedono un ordinamento intrinseco nè giacciono in una struttura matriciale, come invece succede per i pixel di un'immagine. Al contrario, gli elementi appartenenti a una Point Cloud possono assumere qualsiasi configurazione nello spazio da cui sono campionati. Questo lavoro indaga sulla possibilità di estendere il paradigma proprio delle reti convoluzionali a questo nuovo tipo di dato, definendo un nuovo operatore convoluzionale, la Convoluzione Composita. Per dimostrare le potenzialità di tale operatore e della sua implementazione, vengono inoltre condotti due esperimenti: il primo, riguardante Multiclass Classification, permette di confrontare questo lavoro con altri presenti nello stato dell'arte; Il secondo, riguardante One-Class Classification, fa riferimento a un problema ancora non approfondito in ambito Point Clouds. Tramite questi due esperimenti, si vuole dimostrare che la nostra soluzione è in grado di ottenere performance comparabili allo stato dell'arte. Inoltre, si vuole mostrare come anche problemi quali OC classification possano essere affrontati tramite l'uso della Convoluzione Composita, in maniera simile a ciò che si fa nell'ambito delle immagini.
File allegati
File Dimensione Formato  
2021_04_Floris.pdf

Open Access dal 08/04/2022

Descrizione: Tesi
Dimensione 7.26 MB
Formato Adobe PDF
7.26 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/174872