Global agriculture is currently facing a revolution. The increasing grain demand due to growing populations requires higher production of all crops and, due to the limited amount of arable land, the increase must come from a rise in the yield. At the same time, the advent of modern technology has provided new opportunities for farmers and agricultural companies. Smart Farming is the solution to the growing demand: by using digital technology and data-driven decision-making in the farm management process, crop yield can be brought to unprecedented heights. In this thesis we propose a new approach that uses Machine Learning for the analysis and prediction of corn (maize) yields in the United States of America. Our objective is to provide support to both farmers and traders in the decision-making process, by making accurate yield predictions and determining the most significant features during the growing season. Utilizing data collected from a variety of sources, we developed machine learning models to predict the annual yield of a subset of American counties and then aggregated the results to get a prediction of the respective state yield. Two different feature selection procedures were compared, as well as four different regression algorithms: Multiple Linear Regression (MLR), LASSO, Random Forests and Extreme Gradient Boosting (XGBoost). At the end, we evaluated the performance of the various models and compared our results with two baselines as well as the forecasts made by the American government.

L'agricoltura mondiale è di fronte a una rivoluzione. La crescente domanda di cereali causata dall'aumento delle popolazioni richiede una maggiore produzione di tutte le colture e, poichè la terra coltivabile è limitata, questo sviluppo deve derivare da un aumento della resa agricola. In contemporanea, l'avvento della tecnologia moderna ha offerto nuove opportunità per agricoltori e aziende agricole. Smart Farming è la soluzione alla domanda in aumento: utilizzando tecnologia digitale e processi decisionali basati sui dati nella gestione delle terre, la resa agricola può raggiungere livelli senza precedenti. In questa tesi proponiamo un nuovo approccio che utilizza Machine Learning per l'analisi e la predizione della resa del granoturco (mais) negli Stati Uniti d'America. Il nostro obiettivo è quello di fornire supporto sia agli agricoltori che ai trader, attraverso previsioni molto precise della resa e un'analisi dei fattori che influenzano il suo valore. Usando dati raccolti da varie fonti, abbiamo sviluppato modelli per la previsione della resa agricola di alcune contee americane e poi aggregato i risultati per ottenere la previsione della resa dei rispettivi stati. Abbiamo comparato due procedure di feature selection, e sviluppato i modelli con quattro algoritmi diversi: Multiple Linear Regression (MLR), LASSO, Random Forests ed Extreme Gradient Boosting (XGBoost). Alla fine, abbiamo valutato le prestazioni dei vari modelli e confrontato i nostri risultati con quelli di due modelli guida e quelli sviluppati dal governo Americano.

Forecasting U.S. corn yield using machine learning

OLIVA, GABRIELE
2015/2016

Abstract

Global agriculture is currently facing a revolution. The increasing grain demand due to growing populations requires higher production of all crops and, due to the limited amount of arable land, the increase must come from a rise in the yield. At the same time, the advent of modern technology has provided new opportunities for farmers and agricultural companies. Smart Farming is the solution to the growing demand: by using digital technology and data-driven decision-making in the farm management process, crop yield can be brought to unprecedented heights. In this thesis we propose a new approach that uses Machine Learning for the analysis and prediction of corn (maize) yields in the United States of America. Our objective is to provide support to both farmers and traders in the decision-making process, by making accurate yield predictions and determining the most significant features during the growing season. Utilizing data collected from a variety of sources, we developed machine learning models to predict the annual yield of a subset of American counties and then aggregated the results to get a prediction of the respective state yield. Two different feature selection procedures were compared, as well as four different regression algorithms: Multiple Linear Regression (MLR), LASSO, Random Forests and Extreme Gradient Boosting (XGBoost). At the end, we evaluated the performance of the various models and compared our results with two baselines as well as the forecasts made by the American government.
ATTUARIO, DANILO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2017
2015/2016
L'agricoltura mondiale è di fronte a una rivoluzione. La crescente domanda di cereali causata dall'aumento delle popolazioni richiede una maggiore produzione di tutte le colture e, poichè la terra coltivabile è limitata, questo sviluppo deve derivare da un aumento della resa agricola. In contemporanea, l'avvento della tecnologia moderna ha offerto nuove opportunità per agricoltori e aziende agricole. Smart Farming è la soluzione alla domanda in aumento: utilizzando tecnologia digitale e processi decisionali basati sui dati nella gestione delle terre, la resa agricola può raggiungere livelli senza precedenti. In questa tesi proponiamo un nuovo approccio che utilizza Machine Learning per l'analisi e la predizione della resa del granoturco (mais) negli Stati Uniti d'America. Il nostro obiettivo è quello di fornire supporto sia agli agricoltori che ai trader, attraverso previsioni molto precise della resa e un'analisi dei fattori che influenzano il suo valore. Usando dati raccolti da varie fonti, abbiamo sviluppato modelli per la previsione della resa agricola di alcune contee americane e poi aggregato i risultati per ottenere la previsione della resa dei rispettivi stati. Abbiamo comparato due procedure di feature selection, e sviluppato i modelli con quattro algoritmi diversi: Multiple Linear Regression (MLR), LASSO, Random Forests ed Extreme Gradient Boosting (XGBoost). Alla fine, abbiamo valutato le prestazioni dei vari modelli e confrontato i nostri risultati con quelli di due modelli guida e quelli sviluppati dal governo Americano.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_04_Oliva.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 4.06 MB
Formato Adobe PDF
4.06 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/133723