Interpretable Machine Learning (IML) techniques enable a detailed analysis of on-farm experiments, revealing the agronomic and environmental factors that influence silage maize yield and quality. While Machine Learning (ML) can predict yield and quality with high accuracy on a large scale, complex models require interpretability methods, such as SHAP values, to pinpoint the key factors affecting productivity. These insights help optimize management practices, enhancing both maize productivity and sustainability. This study conducted an on-farm experiment across multiple farms in the Po Valley during the 2023 and 2024 growing seasons, comparing two maize hybrids: a conventional tall hybrid and a short hybrid (Smart Corn). The short hybrid is promoted for its greater resistance to adverse climatic conditions (e.g., summer storms) due to its reduced height while also offering improved nutritional value, with higher starch content and lower fiber concentrations compared to conventional hybrids. The main objective was to evaluate IML techniques for investigating the impact of agronomic decision specifically the choice of short corn varieties on silage production. By integrating data from Sentinel-2 imagery, the LUCAS soil database, ERA5 meteorological records, and detailed agronomic measurements, six machine learning models were trained to predict silage yield and quality. The Support Vector Machine regression (SVMr) model yielded the most accurate predictions for yield (with an nRMSE of approximately 20%), while the Cubist model excelled in estimating silage quality (nRMSE around 15%). SHAP value analysis consistently revealed that soil characteristics, solar radiation, and key vegetation indices (e.g. NDMI, CIRE) are the primary factors driving maize performance, whereas agronomic practices played a secondary role under the region’s high-input management regime. Notably, the short hybrid achieved higher planting densities and superior yield and quality outcomes without compromising nutritional standards. These results underscore the potential of IML techniques to generate actionable insights that can guide the optimization of silage maize production practices for enhanced sustainability and productivity.

Le tecniche di Interpretable Machine Learning (IML) permettono un'analisi dettagliata degli esperimenti in campo, rivelando i fattori agronomici e ambientali che influenzano la resa e la qualità del mais da insilato. Sebbene il Machine Learning (ML) possa prevedere questi parametri con elevata accuratezza su larga scala, l'uso di modelli complessi richiede metodi di interpretabilità, come i valori SHAP, per identificare i fattori chiave che influenzano la produttività. Queste informazioni consentono di ottimizzare le pratiche di gestione, migliorando la produttività e la sostenibilità del mais. Questo studio ha condotto un esperimento in campo su più aziende agricole nella Pianura Padana durante le stagioni colturali 2023 e 2024, confrontando due ibridi di mais: un ibrido convenzionale a taglia alta e un ibrido a taglia bassa (Smart Corn). Quest’ultimo è promosso per la sua maggiore resistenza a condizioni climatiche avverse (es. temporali estivi) grazie alla sua ridotta altezza, oltre a offrire un miglior valore nutrizionale, con un contenuto di amido più elevato e una concentrazione inferiore di fibra rispetto agli ibridi convenzionali. L'obiettivo principale dello studio era valutare le tecniche di IML per analizzare l'impatto delle scelte agronomiche, in particolare la selezione di varietà a taglia bassa, sulla produzione di insilato. Integrando dati provenienti dalle immagini Sentinel-2, dal database dei suoli LUCAS, dai dati meteorologici ERA5 e da misurazioni agronomiche dettagliate, sono stati addestrati sei modelli di machine learning per prevedere la resa e la qualità dell’insilato. Il modello Support Vector Machine regression (SVMr) ha fornito le previsioni più accurate per la resa (con un nRMSE di circa il 20%), mentre il modello Cubist ha eccelso nella stima della qualità dell’insilato (nRMSE intorno al 15%). L’analisi dei valori SHAP ha rivelato costantemente che le caratteristiche del suolo, la radiazione solare e gli indici di vegetazione chiave (es. NDMI, CIRE) sono i principali fattori determinanti delle prestazioni del mais, mentre le pratiche agronomiche hanno avuto un ruolo secondario nel contesto di gestione ad alto input tipico della regione. Degno di nota è il fatto che l’ibrido a taglia bassa ha permesso densità di semina più elevate, ottenendo rese e qualità superiori senza compromettere gli standard nutrizionali. Questi risultati evidenziano il potenziale delle tecniche di IML nel generare informazioni utili e applicabili per ottimizzare le pratiche di produzione del mais da insilato, migliorandone la sostenibilità e la produttività.

Interpretable machine learning: an on-farm experiment comparing different silage maize hybrids

Bisignano, Paolo
2024/2025

Abstract

Interpretable Machine Learning (IML) techniques enable a detailed analysis of on-farm experiments, revealing the agronomic and environmental factors that influence silage maize yield and quality. While Machine Learning (ML) can predict yield and quality with high accuracy on a large scale, complex models require interpretability methods, such as SHAP values, to pinpoint the key factors affecting productivity. These insights help optimize management practices, enhancing both maize productivity and sustainability. This study conducted an on-farm experiment across multiple farms in the Po Valley during the 2023 and 2024 growing seasons, comparing two maize hybrids: a conventional tall hybrid and a short hybrid (Smart Corn). The short hybrid is promoted for its greater resistance to adverse climatic conditions (e.g., summer storms) due to its reduced height while also offering improved nutritional value, with higher starch content and lower fiber concentrations compared to conventional hybrids. The main objective was to evaluate IML techniques for investigating the impact of agronomic decision specifically the choice of short corn varieties on silage production. By integrating data from Sentinel-2 imagery, the LUCAS soil database, ERA5 meteorological records, and detailed agronomic measurements, six machine learning models were trained to predict silage yield and quality. The Support Vector Machine regression (SVMr) model yielded the most accurate predictions for yield (with an nRMSE of approximately 20%), while the Cubist model excelled in estimating silage quality (nRMSE around 15%). SHAP value analysis consistently revealed that soil characteristics, solar radiation, and key vegetation indices (e.g. NDMI, CIRE) are the primary factors driving maize performance, whereas agronomic practices played a secondary role under the region’s high-input management regime. Notably, the short hybrid achieved higher planting densities and superior yield and quality outcomes without compromising nutritional standards. These results underscore the potential of IML techniques to generate actionable insights that can guide the optimization of silage maize production practices for enhanced sustainability and productivity.
CROCI, MICHELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
2-apr-2025
2024/2025
Le tecniche di Interpretable Machine Learning (IML) permettono un'analisi dettagliata degli esperimenti in campo, rivelando i fattori agronomici e ambientali che influenzano la resa e la qualità del mais da insilato. Sebbene il Machine Learning (ML) possa prevedere questi parametri con elevata accuratezza su larga scala, l'uso di modelli complessi richiede metodi di interpretabilità, come i valori SHAP, per identificare i fattori chiave che influenzano la produttività. Queste informazioni consentono di ottimizzare le pratiche di gestione, migliorando la produttività e la sostenibilità del mais. Questo studio ha condotto un esperimento in campo su più aziende agricole nella Pianura Padana durante le stagioni colturali 2023 e 2024, confrontando due ibridi di mais: un ibrido convenzionale a taglia alta e un ibrido a taglia bassa (Smart Corn). Quest’ultimo è promosso per la sua maggiore resistenza a condizioni climatiche avverse (es. temporali estivi) grazie alla sua ridotta altezza, oltre a offrire un miglior valore nutrizionale, con un contenuto di amido più elevato e una concentrazione inferiore di fibra rispetto agli ibridi convenzionali. L'obiettivo principale dello studio era valutare le tecniche di IML per analizzare l'impatto delle scelte agronomiche, in particolare la selezione di varietà a taglia bassa, sulla produzione di insilato. Integrando dati provenienti dalle immagini Sentinel-2, dal database dei suoli LUCAS, dai dati meteorologici ERA5 e da misurazioni agronomiche dettagliate, sono stati addestrati sei modelli di machine learning per prevedere la resa e la qualità dell’insilato. Il modello Support Vector Machine regression (SVMr) ha fornito le previsioni più accurate per la resa (con un nRMSE di circa il 20%), mentre il modello Cubist ha eccelso nella stima della qualità dell’insilato (nRMSE intorno al 15%). L’analisi dei valori SHAP ha rivelato costantemente che le caratteristiche del suolo, la radiazione solare e gli indici di vegetazione chiave (es. NDMI, CIRE) sono i principali fattori determinanti delle prestazioni del mais, mentre le pratiche agronomiche hanno avuto un ruolo secondario nel contesto di gestione ad alto input tipico della regione. Degno di nota è il fatto che l’ibrido a taglia bassa ha permesso densità di semina più elevate, ottenendo rese e qualità superiori senza compromettere gli standard nutrizionali. Questi risultati evidenziano il potenziale delle tecniche di IML nel generare informazioni utili e applicabili per ottimizzare le pratiche di produzione del mais da insilato, migliorandone la sostenibilità e la produttività.
File allegati
File Dimensione Formato  
2025_04_Bisignano.pdf

accessibile in internet per tutti a partire dal 11/03/2028

Dimensione 2.22 MB
Formato Adobe PDF
2.22 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/236397