A LiDAR-based approach to drivable area semantic segmentation for autonomous driving

Autonomous driving has emerged as a revolutionary innovation in mobility, establishing new transportation models. A crucial enabling task is the identification of drivable areas around the vehicle to understand the surrounding environment and support the decision-making process that governs vehicle motion. This thesis addresses this challenge by implementing a segmentation pipeline to identify road regions accessible to the vehicle, focusing on providing a comprehensive description of the road layout and its elements. The core of this thesis is the segmentation of drivable areas and road markings using a neural network model. The key innovation is the use of Range View images produced by the LiDAR sensor, which differ significantly from standard camera images. This choice aligns with the strict real-time requirements of autonomous driving for developing responsive systems. The performance of the segmentation model shows promising results in both segmentation accuracy and execution speed. Given the absence of LiDAR-based datasets for road segmentation, the training and evaluation of the segmentation model are conducted using a proprietary dataset created for this work. A hybrid annotation pipeline is presented with the objective of producing a high-quality annotated dataset, employing both automated and manual techniques to accelerate annotation. Annotation statistics collected during this process underscore the efficacy of this semi-automated approach. The final contribution to the segmentation pipeline is a grid map that applies a perspective transformation to the model's results, converting the front-facing view to a bird's-eye view. Road-related classes captured by the model are aggregated across successive frames, providing a more complete representation of the vehicle's surroundings that is resilient to occasional segmentation outliers.

La guida autonoma è emersa come un'innovazione rivoluzionaria nella mobilità, introducendo nuovi modelli di trasporto. L'identificazione delle aree percorribili attorno al veicolo è fondamentale al fine di comprendere l'ambiente circostante e supportare il processo decisionale che governa il moto del veicolo. Questa tesi affronta tale sfida mediante l'implementazione di una pipeline di segmentazione per identificare le regioni stradali accessibili al veicolo, fornendo una descrizione completa della configurazione della strada e degli elementi che la compongono. Il tema centrale di questa tesi riguarda la segmentazione delle aree percorribili e della segnaletica orizzontale mediante una rete neurale. L'innovazione principale consiste nell'impiego di immagini in Range View generate dal sensore LiDAR, invece che le classiche immagini di una telecamera. Questa scelta è motivata dai rigorosi requisiti imposti dalla guida autonoma per lo sviluppo di sistemi reattivi. Le prestazioni di questo modello mostrano risultati promettenti in termini di accuratezza e velocità di esecuzione. Data l'assenza di dataset contenenti immagini LiDAR annotate con elementi stradali, l'addestramento e la valutazione del modello sono condotti utilizzando un dataset creato appositamente per questo lavoro. Viene proposto un metodo di annotazione ibrido con l'obiettivo di generare un dataset con annotazioni di alta qualità, impiegando tecniche sia automatiche sia manuali che accelerano il processo di annotazione. Le statistiche raccolte durante questo processo evidenziano l'efficacia di questo approccio semi-automatizzato. L'ultimo contributo alla pipeline di segmentazione consiste in una mappa a griglia che applica una trasformazione prospettica ai risultati del modello, convertendo la vista frontale in una vista dall'alto. Le classi relative alla strada rilevate dal modello vengono aggregate su frame successivi, fornendo una rappresentazione più completa dell'ambiente circostante al veicolo limitando l'effetto di sporadici risultati di segmentazione di scarsa qualità.