Money laundering is a complex and pervasive financial crime that poses a serious threat to financial integrity and social security. The growing number of transactions makes it necessary to use automatic tools that help law enforcement agencies detect this criminal activity. In this work, we present Amatriciana, a novel approach based on Graph Neural Networks that detects money launderers inside a graph of transactions by taking into account temporal information about the carried out transactions. Amatriciana uses the whole graph of transactions without splitting it into several time-based subgraphs, thus exploiting all relational information available in the dataset. The experiments we conduct on various datasets reveal that the model can learn even when the amount of available data is limited. Furthermore, when more data is available, the model achieves results that are better compared to other state-of-the-art models; in particular, the number of false positives is decreased. In general, the model detects a large amount of launderers while keeping the number of false positives relatively low. In summary, Amatriciana improves the MCC score of 42%, reaching a value of 0.5505 and an F1 score of 0.7600. In addition, it lowers the false positives by 55%.
Il riciclaggio di denaro è un crimine complesso e pervasivo che rappresenta una seria minaccia per l'integrità finanziaria e la sicurezza della società. Il numero crescente di transazioni rende necessario l'utilizzo di strumenti automatici efficaci che siano in grado di supportare le forze dell'ordine nell'individuare questa attività criminale. In questo lavoro presentiamo Amatriciana, un approccio basato su Graph Neural Networks che individua i riciclatori di denaro all'interno di un grafo che rappresenta le transazioni finanziarie, sfruttando le informazioni temporali relative alle varie transazioni effettuate. Amatriciana utilizza l'intero grafo delle transazioni senza suddividerlo in diversi sottografi basati sul tempo, sfruttando così tutte le informazioni relazionali disponibili nel dataset. Gli esperimenti condotti su diversi dataset hanno mostrato come il modello sia in grado di apprendere anche quando la quantità di dati disponibili è limitata. Inoltre, quando sono disponibili più dati, il modello ottiene risultati migliori rispetto ad altri modelli dello stato dell'arte, in particolare diminuisce il numero di falsi positivi. In generale, il modello individua una grande quantità di riciclatori mantenendo il numero di falsi positivi basso. In sintesi, Amatriciana migliora il MCC del 42%, raggiungendo un valore di 0.5505 e raggiungendo una F1 score di 0.7600. Inoltre, riduce i falsi positivi del 55%.
Amatriciana: A Temporal Graph Neural Networks based Framework for Money Laundering Detection
Pianta, Marco
2022/2023
Abstract
Money laundering is a complex and pervasive financial crime that poses a serious threat to financial integrity and social security. The growing number of transactions makes it necessary to use automatic tools that help law enforcement agencies detect this criminal activity. In this work, we present Amatriciana, a novel approach based on Graph Neural Networks that detects money launderers inside a graph of transactions by taking into account temporal information about the carried out transactions. Amatriciana uses the whole graph of transactions without splitting it into several time-based subgraphs, thus exploiting all relational information available in the dataset. The experiments we conduct on various datasets reveal that the model can learn even when the amount of available data is limited. Furthermore, when more data is available, the model achieves results that are better compared to other state-of-the-art models; in particular, the number of false positives is decreased. In general, the model detects a large amount of launderers while keeping the number of false positives relatively low. In summary, Amatriciana improves the MCC score of 42%, reaching a value of 0.5505 and an F1 score of 0.7600. In addition, it lowers the false positives by 55%.File | Dimensione | Formato | |
---|---|---|---|
2023_10_Pianta_Tesi_01.pdf
non accessibile
Descrizione: Tesi
Dimensione
1.8 MB
Formato
Adobe PDF
|
1.8 MB | Adobe PDF | Visualizza/Apri |
2023_10_Pianta_Executive Summary_02.pdf
non accessibile
Descrizione: Executive Summary
Dimensione
324.43 kB
Formato
Adobe PDF
|
324.43 kB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/209865