Tradeshift is a cloud based network for businesses. One of its initiatives is to implement supply-chain finance into the platform. In order to evaluate the potential risks and ways of implementation several questions were raised. The first problem is to predict if the invoice will be rejected in a highly imbalanced dataset. The second problem is to predict if the payment will be done one-time (it means that the invoice will be not paid multiple times). The third problem is to predict in how many days the invoice will be paid after it is accepted. This work aims to compare the results obtained from three different machine learning algorithms for these problems. For the classification problems Logistic Regression, Random Forest Classifier and Gradient-Boosted Classifier will be compared. For the regression problem Linear Regression, Random Forest Regressor and Gradient-Boosted Regressor will be compared. The aim of this proof of concept work is to create the baselines for further research in this domain at Tradeshift.

Tradeshift è una rete basata sul cloud per le imprese. Una delle sue iniziative è l'implementazione della finanza della supply chain nella piattaforma. Al fine di valutare i potenziali rischi e le modalità di attuazione sono state sollevate diverse domande. Il primo problema è prevedere se la fattura verrà rifiutata in un set di dati altamente squilibrato. Il secondo problema è prevedere se il pagamento verrà effettuato una sola volta (ciò significa che la fattura non verrà pagata più volte). Il terzo problema è prevedere in quanti giorni la fattura sarà pagata dopo che è stata accettata. Questo lavoro si propone di confrontare i risultati ottenuti da tre diversi algoritmi di apprendimento automatico per questi problemi. Per i problemi di classificazione verranno confrontati Logistic Regression, Random Forest Classifier and Gradient-Boosted Classifier. Per il problema di regressione verranno confrontati Linear Regression, Random Forest Regressor and Gradient-Boosted Regressor. L'obiettivo principale di questo lavoro è di creare delle linee base nella prospettiva di effettuare ulteriori ricerche nel settore Tradeshift.

Predicting transaction states

BORDEA, SERGHEI
2018/2019

Abstract

Tradeshift is a cloud based network for businesses. One of its initiatives is to implement supply-chain finance into the platform. In order to evaluate the potential risks and ways of implementation several questions were raised. The first problem is to predict if the invoice will be rejected in a highly imbalanced dataset. The second problem is to predict if the payment will be done one-time (it means that the invoice will be not paid multiple times). The third problem is to predict in how many days the invoice will be paid after it is accepted. This work aims to compare the results obtained from three different machine learning algorithms for these problems. For the classification problems Logistic Regression, Random Forest Classifier and Gradient-Boosted Classifier will be compared. For the regression problem Linear Regression, Random Forest Regressor and Gradient-Boosted Regressor will be compared. The aim of this proof of concept work is to create the baselines for further research in this domain at Tradeshift.
MORENO-DIAZ, ARMINDA
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2019
2018/2019
Tradeshift è una rete basata sul cloud per le imprese. Una delle sue iniziative è l'implementazione della finanza della supply chain nella piattaforma. Al fine di valutare i potenziali rischi e le modalità di attuazione sono state sollevate diverse domande. Il primo problema è prevedere se la fattura verrà rifiutata in un set di dati altamente squilibrato. Il secondo problema è prevedere se il pagamento verrà effettuato una sola volta (ciò significa che la fattura non verrà pagata più volte). Il terzo problema è prevedere in quanti giorni la fattura sarà pagata dopo che è stata accettata. Questo lavoro si propone di confrontare i risultati ottenuti da tre diversi algoritmi di apprendimento automatico per questi problemi. Per i problemi di classificazione verranno confrontati Logistic Regression, Random Forest Classifier and Gradient-Boosted Classifier. Per il problema di regressione verranno confrontati Linear Regression, Random Forest Regressor and Gradient-Boosted Regressor. L'obiettivo principale di questo lavoro è di creare delle linee base nella prospettiva di effettuare ulteriori ricerche nel settore Tradeshift.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_07_Bordea.pdf

non accessibile

Descrizione: Thesis text
Dimensione 3.81 MB
Formato Adobe PDF
3.81 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/148524