Deep Learning models for Instance Segmentation represent the current State-of-the-Art for automating Cell Segmentation and Tracking tasks in histological imaging. These models, however, require large annotated datasets for training, which are expensive and time-consuming to obtain. In fact, annotations rely on domain experts manually tracing cell boundaries in tissue images and videos, making data availability a bottleneck that limits research in critical domains including cancer research, drug development, and tissue analysis. We tackle this data scarcity problem by proposing a novel framework for Instance-level Cell generation. Unlike existing Synthetic Data Generation methods that produce entire histological images in a single step or operate directly in pixel space, we propose a parametric approach based on Elliptical Fourier Descriptors (EFD). This parametric representation enables efficient generation of single cell masks in a low-dimensional parametric domain rather than in high-dimensional image or video space, ensuring computational efficiency and scalability that are fundamental requirements for a reproducible Data Augmentation. We developed and tested our method on two different datasets, evaluating both static (single images) and dynamic (video sequences) generation. Our synthesis scheme provides an efficient solution to produce biologically plausible synthetic cell masks that can be integrated into complete synthesis pipelines, decreasing the experts’ effort in annotating ground truth for training Deep Learning models in the biomedical domains.
I modelli di Deep Learning per la segmentazione di istanze rappresentano l’attuale Stato dell’Arte per l’automazione dei compiti di Segmentazione e Tracciamento Cellulare nel campo dell’ imaging istologico. Questi modelli richiedono grandi dataset annotati per il loro addestramento. Tuttavia, sono costosi e richiedono molto tempo per essere ottenuti. Infatti, le annotazioni si basano su esperti del settore che tracciano manualmente i confini delle cellule in immagini e video di tessuti, rendendo la disponibilità dei dati un collo di bottiglia che limita la ricerca in domini fondamentali come la ricerca sul cancro, lo sviluppo di farmaci e l’analisi dei tessuti. Affrontiamo questo problema riguardante la scarsità di dati proponendo un nuovo framework per la generazione di cellule a livello di istanza. A differenza dei metodi di Generazione di Dati Sintetici già esistenti, che producono intere immagini istologiche in un singolo passaggio o operano direttamente nello spazio dei pixel, proponiamo un approccio parametrico basato su Elliptical Fourier Descriptors (EFD). Questa rappresentazione parametrica consente una generazione efficiente di maschere di singole cellule in un dominio parametrico con bassa dimensionalità piuttosto che in un dominio spaziale ad alta dimensionalità, garantendo quindi efficienza computazionale e scalabilità, che sono requisiti fondamentali per una augmentation dei dati riproducibile. Abbiamo sviluppato e testato il nostro metodo su due dataset differenti, valutando sia la generazione statica (singole immagini) che quella dinamica (sequenze video). Il nostro schema di sintesi fornisce quindi una soluzione efficiente per produrre maschere di cellule sintetiche biologicamente plausibili che possono essere integrate in pipeline di sintesi complete, diminuendo lo sforzo degli esperti nell’annotare ground truth per l’addestramento di modelli di Deep Learning nel campo biomedico.
A parametric approach for static and dynamic instance-level cell generation
Benedetto, Francesco
2024/2025
Abstract
Deep Learning models for Instance Segmentation represent the current State-of-the-Art for automating Cell Segmentation and Tracking tasks in histological imaging. These models, however, require large annotated datasets for training, which are expensive and time-consuming to obtain. In fact, annotations rely on domain experts manually tracing cell boundaries in tissue images and videos, making data availability a bottleneck that limits research in critical domains including cancer research, drug development, and tissue analysis. We tackle this data scarcity problem by proposing a novel framework for Instance-level Cell generation. Unlike existing Synthetic Data Generation methods that produce entire histological images in a single step or operate directly in pixel space, we propose a parametric approach based on Elliptical Fourier Descriptors (EFD). This parametric representation enables efficient generation of single cell masks in a low-dimensional parametric domain rather than in high-dimensional image or video space, ensuring computational efficiency and scalability that are fundamental requirements for a reproducible Data Augmentation. We developed and tested our method on two different datasets, evaluating both static (single images) and dynamic (video sequences) generation. Our synthesis scheme provides an efficient solution to produce biologically plausible synthetic cell masks that can be integrated into complete synthesis pipelines, decreasing the experts’ effort in annotating ground truth for training Deep Learning models in the biomedical domains.| File | Dimensione | Formato | |
|---|---|---|---|
|
2025_12_Benedetto_Tesi.pdf
non accessibile
Descrizione: Classical Format Thesis
Dimensione
10.34 MB
Formato
Adobe PDF
|
10.34 MB | Adobe PDF | Visualizza/Apri |
|
2025_12_Benedetto_Executive Summary.pdf
non accessibile
Descrizione: Executive Summary
Dimensione
1.35 MB
Formato
Adobe PDF
|
1.35 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/246633