Transfer Learning is a powerful Machine Learning technique that leverages knowledge from a “source” domain, characterized by abundance of data, to improve the learning performance in a different but related “target” domain, where data is scarce. Transfer learning is a promising technique in fields such as Additive Manufacturing, where transferring knowledge between different materials, geometries, or machines can significantly reduce the experimental effort required for process modeling under new conditions. However, the success of knowledge transfer is not always guaranteed. Transfer Learning may degrade the predictive performance of the target task, resulting in a phenomenon known as Negative Transfer. In the literature, existing metrics for assessing the risk of Negative Transfer lack explicit thresholds to guide the decision of whether to apply Transfer Learning, and they provide limited support in regression settings with very small target datasets. As demonstrated through two simulated case studies, a poor correlation results between “source-target” distributional distance and Transfer Learning performance, suggesting that the common assumption that greater distance between source and target domains leads to poorer transfer is not always valid. In addition, performance-based metrics, such as Root Mean Squared Error and Leave-One-Out Cross-Validation, show limited generalization due to overfitting on the small target dataset. Therefore, building on the performance-based approach, a metric for Negative Transfer detection is proposed by introducing a purposely overfitted transfer model as a baseline. The indicator implements a conservative approach by comparing Transfer Learning performance against the overfitted model to discern true performance gains from improvements that may be attributable to overfitting. Results in the simulated case studies demonstrate that the proposed indicator detects Negative Transfer more reliably than existing benchmarks from the literature. Furthermore, the indicator is effectively applied as a practical decision-support tool to control the Negative Transfer risk in an Additive Manufacturing scenario involving knowledge transfer across two different geometries. This real-world application demonstrates that the developed metric provides an actionable decision-making threshold, enabling the exploitation of cost benefits from applying Transfer Learning in manufacturing settings while effectively controlling the associated risks.

Il Transfer Learning è una tecnica di Machine Learning che consente di trasferire conoscenza da un dominio sorgente a uno target correlato e caratterizzato da scarsità di dati, migliorandone le prestazioni. Il Transfer Learning è una soluzione promettente in ambiti come l’Additive Manufacturing, dove trasferire la conoscenza tra materiali, geometrie o macchine diverse può ridurre in modo significativo tempi e costi necessari per la modellazione di processi in nuove condizioni. Tuttavia, il successo del transfer non è sempre garantito. Il Transfer Learning può infatti peggiorare la capacità predittiva del target, un fenomeno noto come Negative Transfer. In letteratura le metriche di trasferibilità proposte mancano di soglie utili per guidare il processo decisionale e risultano di poco supporto nei problemi di regressione con pochi dati target. Come dimostrato dai due casi studio simulati, le metriche di distanza tra domini sorgente e target mostrano una bassa correlazione con le prestazioni del Transfer Learning, indicando che l’assunzione che maggiori distanze tra domini implichino peggiori performance del transfer non è sempre valida. Inoltre, metriche basato sul confronto delle prestazioni, come l’errore quadratico medio e la Leave-One-Out Cross Validation, hanno mostrato capacità limitate di generalizzazione, spesso dovuta all’overfitting sui piccoli dataset del target. Per superare tali limitazioni è stato quindi sviluppato un nuovo indicatore di rilevazione del Negative Transfer, che introduce un nuovo modello che volutamente fa overfitting del dataset target, da usare come baseline. Confrontando le prestazioni del Transfer Learning con questa baseline, l’indicatore adotta una strategia conservative che privilegia la minimizzazione del rischio di Negative Transfer, identificando i casi in cui il Transfer Learning è influenzato dall’overfitting e andrebbe quindi evitato. I risultati mostrano che il nuovo indicatore è più affidabile nel rilevare il Negative Transfer rispetto alle metriche presenti in letteratura. Inoltre, l’indicatore è stato applicato con successo come strumento decisionale in un caso reale di Additive Manufacturing, relativo a un modello di transfer learning tra due geometrie diverse. Questa applicazione dimostra come la metrica sviluppata fornisca una soglia decisionale concreta, utile a massimizzare i vantaggi del Transfer Learning positivo, minimizzando i rischi del trasferimento negativo.

Leveraging prior knowledge for efficient additive manufacturing: a metric for negative transfer detection

Faure Ragani, Chiara
2024/2025

Abstract

Transfer Learning is a powerful Machine Learning technique that leverages knowledge from a “source” domain, characterized by abundance of data, to improve the learning performance in a different but related “target” domain, where data is scarce. Transfer learning is a promising technique in fields such as Additive Manufacturing, where transferring knowledge between different materials, geometries, or machines can significantly reduce the experimental effort required for process modeling under new conditions. However, the success of knowledge transfer is not always guaranteed. Transfer Learning may degrade the predictive performance of the target task, resulting in a phenomenon known as Negative Transfer. In the literature, existing metrics for assessing the risk of Negative Transfer lack explicit thresholds to guide the decision of whether to apply Transfer Learning, and they provide limited support in regression settings with very small target datasets. As demonstrated through two simulated case studies, a poor correlation results between “source-target” distributional distance and Transfer Learning performance, suggesting that the common assumption that greater distance between source and target domains leads to poorer transfer is not always valid. In addition, performance-based metrics, such as Root Mean Squared Error and Leave-One-Out Cross-Validation, show limited generalization due to overfitting on the small target dataset. Therefore, building on the performance-based approach, a metric for Negative Transfer detection is proposed by introducing a purposely overfitted transfer model as a baseline. The indicator implements a conservative approach by comparing Transfer Learning performance against the overfitted model to discern true performance gains from improvements that may be attributable to overfitting. Results in the simulated case studies demonstrate that the proposed indicator detects Negative Transfer more reliably than existing benchmarks from the literature. Furthermore, the indicator is effectively applied as a practical decision-support tool to control the Negative Transfer risk in an Additive Manufacturing scenario involving knowledge transfer across two different geometries. This real-world application demonstrates that the developed metric provides an actionable decision-making threshold, enabling the exploitation of cost benefits from applying Transfer Learning in manufacturing settings while effectively controlling the associated risks.
LALLI, ETTORE
PRIOGLIO, EGON
SECCHI, PIERCESARE
ING - Scuola di Ingegneria Industriale e dell'Informazione
23-ott-2025
2024/2025
Il Transfer Learning è una tecnica di Machine Learning che consente di trasferire conoscenza da un dominio sorgente a uno target correlato e caratterizzato da scarsità di dati, migliorandone le prestazioni. Il Transfer Learning è una soluzione promettente in ambiti come l’Additive Manufacturing, dove trasferire la conoscenza tra materiali, geometrie o macchine diverse può ridurre in modo significativo tempi e costi necessari per la modellazione di processi in nuove condizioni. Tuttavia, il successo del transfer non è sempre garantito. Il Transfer Learning può infatti peggiorare la capacità predittiva del target, un fenomeno noto come Negative Transfer. In letteratura le metriche di trasferibilità proposte mancano di soglie utili per guidare il processo decisionale e risultano di poco supporto nei problemi di regressione con pochi dati target. Come dimostrato dai due casi studio simulati, le metriche di distanza tra domini sorgente e target mostrano una bassa correlazione con le prestazioni del Transfer Learning, indicando che l’assunzione che maggiori distanze tra domini implichino peggiori performance del transfer non è sempre valida. Inoltre, metriche basato sul confronto delle prestazioni, come l’errore quadratico medio e la Leave-One-Out Cross Validation, hanno mostrato capacità limitate di generalizzazione, spesso dovuta all’overfitting sui piccoli dataset del target. Per superare tali limitazioni è stato quindi sviluppato un nuovo indicatore di rilevazione del Negative Transfer, che introduce un nuovo modello che volutamente fa overfitting del dataset target, da usare come baseline. Confrontando le prestazioni del Transfer Learning con questa baseline, l’indicatore adotta una strategia conservative che privilegia la minimizzazione del rischio di Negative Transfer, identificando i casi in cui il Transfer Learning è influenzato dall’overfitting e andrebbe quindi evitato. I risultati mostrano che il nuovo indicatore è più affidabile nel rilevare il Negative Transfer rispetto alle metriche presenti in letteratura. Inoltre, l’indicatore è stato applicato con successo come strumento decisionale in un caso reale di Additive Manufacturing, relativo a un modello di transfer learning tra due geometrie diverse. Questa applicazione dimostra come la metrica sviluppata fornisca una soglia decisionale concreta, utile a massimizzare i vantaggi del Transfer Learning positivo, minimizzando i rischi del trasferimento negativo.
File allegati
File Dimensione Formato  
2025_10_FaureRagani_Tesi.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi
Dimensione 2.48 MB
Formato Adobe PDF
2.48 MB Adobe PDF   Visualizza/Apri
2025_10_FaureRagani_ExecutiveSummary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary
Dimensione 871.66 kB
Formato Adobe PDF
871.66 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/243990