We live in an increasingly connected world, with the number of active Internet users growing steadily every year. Financial institutions are always on the edge of the tech- nological innovation. Internet banking, the natural evolution of traditional banking, is a consolidated reality nowadays. Millions of users worldwide resort to online bank- ing services, attracting the undesired attentions of malevolent hackers. While banks try to enhance security measures, fraudsters use always increasing sophisticated tech- niques to avoid detection. The dynamic nature of attacks, combined with a chronic trend to underestimate cyber-security risks, lead every year to huge losses for both customers and companies. In this thesis we present FraudsDigger, an active learning tool able not only to find anomalies among the huge amount of data in an unsupervised setting, but also to leverage human analyst feedback to provide the system with an updated supervised model to detect known attacks. Thanks to the collaboration of an important Italian banking group, we had the opportunity to work on a real world dataset consisting of more than 3 millions events spanning over 4 months. We performed a deep analysis on the data at our disposal, extracting the most relevant features. We demonstrated that we can lower the human investigation budget by a factor of 4×, achieving even better performances with respect to a state-of-the-art solution, detecting on average 88.76% of frauds with just 50 transactions a day to investigate, and obtaining a false positive rate of just 1.39%.

Viviamo in un mondo sempre più connesso, con il numero di utenti Internet attivi che crescono costantemente ogni anno. Le istituzioni finanziarie sono sempre ai margini dell'innovazione tecnologica. L'online banking, la naturale evoluzione della banca tradizionale, è una realtà consolidata al giorno d'oggi. Milioni di utenti in tutto il mondo ricorrono a servizi bancari online, attirando le indesiderate attenzioni degli hacker malevoli. Mentre le banche cercano di migliorare le misure di sicurezza, i truffatori utilizzano tecniche sempre più sofisticate per evitare il rilevamento. La natura dinamica degli attacchi, combinata con una tendenza cronica a sottovalutare i rischi di sicurezza informatica, portano ogni anno a enormi perdite sia per i clienti che per le aziende. In questa tesi presentiamo FraudsDigger, uno strumento di apprendimento attivo in grado non solo di trovare anomalie tra l'enorme quantità di dati in un ambiente non supervisionato, ma anche di sfruttare il feedback dell'analista umano per fornire al sistema un modello supervisionato aggiornato per rilevare gli attacchi noti. Grazie alla collaborazione con un importante gruppo bancario italiano, abbiamo avuto l'opportunità di lavorare su un set di dati del mondo reale composto da oltre 3 milioni di eventi che coprono oltre 4 mesi. Abbiamo eseguito un'analisi approfondita dei dati a nostra disposizione, estraendo le funzionalità più rilevanti. Abbiamo dimostrato che possiamo abbassare il budget delle indagini umane di un fattore 4 ×, ottenendo prestazioni ancora migliori rispetto a una soluzione all'avanguardia, rilevando in media l'88,76% delle frodi con solo 50 transazioni al giorno da investigare, e ottenendo un tasso di falsi positivi di appena l'1,39%.

FraudsDigger : an active learning tool for online banking fraud detection

DIGNANI, ALESSANDRO
2017/2018

Abstract

We live in an increasingly connected world, with the number of active Internet users growing steadily every year. Financial institutions are always on the edge of the tech- nological innovation. Internet banking, the natural evolution of traditional banking, is a consolidated reality nowadays. Millions of users worldwide resort to online bank- ing services, attracting the undesired attentions of malevolent hackers. While banks try to enhance security measures, fraudsters use always increasing sophisticated tech- niques to avoid detection. The dynamic nature of attacks, combined with a chronic trend to underestimate cyber-security risks, lead every year to huge losses for both customers and companies. In this thesis we present FraudsDigger, an active learning tool able not only to find anomalies among the huge amount of data in an unsupervised setting, but also to leverage human analyst feedback to provide the system with an updated supervised model to detect known attacks. Thanks to the collaboration of an important Italian banking group, we had the opportunity to work on a real world dataset consisting of more than 3 millions events spanning over 4 months. We performed a deep analysis on the data at our disposal, extracting the most relevant features. We demonstrated that we can lower the human investigation budget by a factor of 4×, achieving even better performances with respect to a state-of-the-art solution, detecting on average 88.76% of frauds with just 50 transactions a day to investigate, and obtaining a false positive rate of just 1.39%.
CARMINATI, MICHELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
Viviamo in un mondo sempre più connesso, con il numero di utenti Internet attivi che crescono costantemente ogni anno. Le istituzioni finanziarie sono sempre ai margini dell'innovazione tecnologica. L'online banking, la naturale evoluzione della banca tradizionale, è una realtà consolidata al giorno d'oggi. Milioni di utenti in tutto il mondo ricorrono a servizi bancari online, attirando le indesiderate attenzioni degli hacker malevoli. Mentre le banche cercano di migliorare le misure di sicurezza, i truffatori utilizzano tecniche sempre più sofisticate per evitare il rilevamento. La natura dinamica degli attacchi, combinata con una tendenza cronica a sottovalutare i rischi di sicurezza informatica, portano ogni anno a enormi perdite sia per i clienti che per le aziende. In questa tesi presentiamo FraudsDigger, uno strumento di apprendimento attivo in grado non solo di trovare anomalie tra l'enorme quantità di dati in un ambiente non supervisionato, ma anche di sfruttare il feedback dell'analista umano per fornire al sistema un modello supervisionato aggiornato per rilevare gli attacchi noti. Grazie alla collaborazione con un importante gruppo bancario italiano, abbiamo avuto l'opportunità di lavorare su un set di dati del mondo reale composto da oltre 3 milioni di eventi che coprono oltre 4 mesi. Abbiamo eseguito un'analisi approfondita dei dati a nostra disposizione, estraendo le funzionalità più rilevanti. Abbiamo dimostrato che possiamo abbassare il budget delle indagini umane di un fattore 4 ×, ottenendo prestazioni ancora migliori rispetto a una soluzione all'avanguardia, rilevando in media l'88,76% delle frodi con solo 50 transazioni al giorno da investigare, e ottenendo un tasso di falsi positivi di appena l'1,39%.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
FraudsDigger - Tesi A. Dignani.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 4.72 MB
Formato Adobe PDF
4.72 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144814