Good publishing standards play a key role in fostering knowledge sharing and experimental reproducibility. Writers do not often follow guidelines regarding the publication of western blot Images. Five characteristics can be identified: length, labels’ presence and position, ladders’ presence, and background. The aim of this thesis is to create a tool able to scan articles and the published western blot images, identify problems and provide suggestions in order to meet publishing standards. This tool is trained on a dataset of published articles and preprints and is composed of different steps. The first part is the article set up and image preprocessing for the classification, based on the computer vision pretrained algorithm YOLOv11, fine-tuned on the new dataset. The second part is the main step, including the classification of the images in different tasks, each one focusing on a specific problem. This part uses the transfer learning technique, and in the end, the different models are joined together in a single one, with a common body, composed of the fixed layers, and trainable multi heads, one for each task. The performance reached is good, in particular for the preprocessing algorithm and for some tasks, such as the cropped, the ladder, the labels, and the background. In some tasks, such as the excessive crop and the label position, the small dataset size, its imbalance, and the applied structure are key factors in the less satisfactory performance. The results obtained allow the objectives to be only partially achieved, but they provide a solid foundation for future developments.

Buoni standard editoriali giocano un ruolo fondamentale nella diffusione della conoscenza e la riproducibilità degli esperimenti. Gli autori non seguono spesso chiare linee guida riguardo la pubblicazione di immagini di western blot. Si possono identificare 5 caratteristiche: lunghezza, presenza e posizione delle etichette, presenza di scale di riferimento, sfondo. L’obiettivo di questa tesi è di creare uno strumento in grado di analizzare articoli e le immagini di western blot pubblicate, identificare i problemi e fornire suggerimenti per migliorare gli standard di pubblicazioni. Lo strumento è allenato con un dataset di articoli e preprints pubblicati ed è composto da diversi passaggi. La prima parte riguarda la preparazione degli articoli ed elaborazione delle immagini per la classificazione, basata su un YOLOv11, algoritmo di computer vision pre-allenato e poi raffinato sul nuovo dataset. La seconda parte è la principale, che include la classificazione delle immagini in diversi task, ciascuno focalizzato su un problema specifico. Questa parte utilizza la tecnica del transfer learning e alla fine i diversi algoritmi sono uniti in un singolo modello, con un corpo comune, composto dalle sezioni non ulteriormente allenate, e varie teste, una per ogni task. Le performance ottenute sono buone, in particolare per il modello di preparazione degli articoli e pe alcuni classificatori, come quello riguardo la lunghezza, la presenza di etichette e scale di riferimento e lo sfondo. Riguardo alcune classificazioni, come il taglio eccessivo e la posizione delle etichette, le piccole dimensioni del dataset, il suo squilibrio e la struttura scelta sono un fattore chiave nelle non completamente soddisfacenti performance. I risultati ottenuti permettono il raggiungimento parziale degli obiettivi, ma forniscono una solida base per futuri sviluppi.

A machine learning framework for automated quality assessment of western blot images

ZELLA, KIMBERLY
2024/2025

Abstract

Good publishing standards play a key role in fostering knowledge sharing and experimental reproducibility. Writers do not often follow guidelines regarding the publication of western blot Images. Five characteristics can be identified: length, labels’ presence and position, ladders’ presence, and background. The aim of this thesis is to create a tool able to scan articles and the published western blot images, identify problems and provide suggestions in order to meet publishing standards. This tool is trained on a dataset of published articles and preprints and is composed of different steps. The first part is the article set up and image preprocessing for the classification, based on the computer vision pretrained algorithm YOLOv11, fine-tuned on the new dataset. The second part is the main step, including the classification of the images in different tasks, each one focusing on a specific problem. This part uses the transfer learning technique, and in the end, the different models are joined together in a single one, with a common body, composed of the fixed layers, and trainable multi heads, one for each task. The performance reached is good, in particular for the preprocessing algorithm and for some tasks, such as the cropped, the ladder, the labels, and the background. In some tasks, such as the excessive crop and the label position, the small dataset size, its imbalance, and the applied structure are key factors in the less satisfactory performance. The results obtained allow the objectives to be only partially achieved, but they provide a solid foundation for future developments.
NACHEV, VLADISLAV
WEISSGERBER , TRACEY
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
Buoni standard editoriali giocano un ruolo fondamentale nella diffusione della conoscenza e la riproducibilità degli esperimenti. Gli autori non seguono spesso chiare linee guida riguardo la pubblicazione di immagini di western blot. Si possono identificare 5 caratteristiche: lunghezza, presenza e posizione delle etichette, presenza di scale di riferimento, sfondo. L’obiettivo di questa tesi è di creare uno strumento in grado di analizzare articoli e le immagini di western blot pubblicate, identificare i problemi e fornire suggerimenti per migliorare gli standard di pubblicazioni. Lo strumento è allenato con un dataset di articoli e preprints pubblicati ed è composto da diversi passaggi. La prima parte riguarda la preparazione degli articoli ed elaborazione delle immagini per la classificazione, basata su un YOLOv11, algoritmo di computer vision pre-allenato e poi raffinato sul nuovo dataset. La seconda parte è la principale, che include la classificazione delle immagini in diversi task, ciascuno focalizzato su un problema specifico. Questa parte utilizza la tecnica del transfer learning e alla fine i diversi algoritmi sono uniti in un singolo modello, con un corpo comune, composto dalle sezioni non ulteriormente allenate, e varie teste, una per ogni task. Le performance ottenute sono buone, in particolare per il modello di preparazione degli articoli e pe alcuni classificatori, come quello riguardo la lunghezza, la presenza di etichette e scale di riferimento e lo sfondo. Riguardo alcune classificazioni, come il taglio eccessivo e la posizione delle etichette, le piccole dimensioni del dataset, il suo squilibrio e la struttura scelta sono un fattore chiave nelle non completamente soddisfacenti performance. I risultati ottenuti permettono il raggiungimento parziale degli obiettivi, ma forniscono una solida base per futuri sviluppi.
File allegati
File Dimensione Formato  
2025_12_Zella_Tesi.pdf

solo utenti autorizzati a partire dal 18/11/2026

Descrizione: Tesi
Dimensione 4.97 MB
Formato Adobe PDF
4.97 MB Adobe PDF   Visualizza/Apri
2025_12_Zella_Executive_Summary.pdf

solo utenti autorizzati a partire dal 18/11/2026

Descrizione: Executive Summary
Dimensione 1.59 MB
Formato Adobe PDF
1.59 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/246822