The global sports betting market accounted for 83.65 billion dollars in 2022 and is expected to expand at a compound annual growth rate (CAGR) of 10.3% from 2023 to 2030. Adopting cutting-edge technologies, such as Artificial Intelligence, is believed to largely impact bookmakers' economic profits, even though the research literature currently lacks works providing concrete aid in sports odds optimization. In this thesis, we present an examination and implementation of a Reinforcement Learning algorithm to develop an optimal odds selection system in sports betting. This will take advantage of the economic and temporal information that we can extract from real-world data containing the bets of real players. In particular, partnering with a sector-leading company, we will deliver a fully automated algorithm capable of providing optimal odds scheduling for football matches during the week before the event. Our scope is restricted to the three main odds related to the winning team of the match. We will leverage both domain knowledge and a rich historical dataset. Our framework comprises two main components: a forecasting algorithm capable of predicting the bettors' response to our stimuli (i.e., odds variations) and a model-based RL algorithm exploiting the former model to provide an optimal strategy. To achieve our goal, we explored the data, gathering insights on how both bookmakers and bettors behave when faced with particular contextual information, along with the odds: our strategy accounts for market response to new odds selection, temporal information (e.g., distance from the event, day of the week...) and minimizes the total risk of exposure of the bookmaker. We chose forecasting methods based on boosted trees while using Fitted Q-Iteration as a decision-maker. Our approach model was empirically evaluated on a simulated environment designed starting from real-world data. In particular, we evaluated our policy in scenarios representing different bookmaking challenges, attaining a final gain of 1.7 times the gain of the baseline policy.

Il mercato globale delle scommesse sportive ammontava a 83,65 miliardi di dollari nel 2022 e si prevede che si espanderà a un tasso di crescita annuale composto (CAGR) del 10,3% dal 2023 al 2030. Si ritiene che l’adozione di tecnologie all’avanguardia, come l’Intelligenza Artificiale, abbia un impatto significativo sui profitti economici dei bookmaker. Attualmente nella letteratura scientifica mancano lavori che forniscano aiuti concreti nell’ottimizzazione delle quote su eventi sportivi. In questa tesi, presentiamo l'analisi e l'implementazione di un algoritmo di Reinforcement Learning per sviluppare un sistema di selezione ottimale delle quote nelle scommesse sportive. Ciò trae vantaggio dalle informazioni economiche e temporali che possiamo estrarre da dati reali contenenti le giocate di veri scommettitori. In particolare, collaborando con un'azienda leader del settore, forniremo un algoritmo completamente automatizzato in grado di fornire una pianificazione ottimale delle quote per le partite di calcio durante la settimana prima dell'evento. Il nostro campo d'azione è limitato alle tre quote principali relative alla squadra vincente della partita. Sfrutteremo sia la conoscenza di dominio che un ricco set di dati storici. Il nostro framework comprende due componenti principali: un algoritmo di previsione in grado di predire la risposta degli scommettitori ai nostri stimoli (ovvero, variazioni di quote) e un algoritmo di model-based RL che sfrutta il predittore per fornire una strategia ottimale. Per raggiungere il nostro obiettivo, abbiamo esplorato i dati, raccogliendo informazioni su come si comportano sia i bookmaker che gli scommettitori di fronte a particolari informazioni contestuali, insieme alle quote: la nostra strategia tiene conto della risposta del mercato alla selezione di nuove quote, informazioni temporali (ad esempio, la distanza dal evento, giorno della settimana...) e riduce al minimo il rischio totale di esposizione del bookmaker. Abbiamo scelto di utilizzare metodi di previsione basati su alberi decisionali, utilizzando Fitted Q-Iteration come decisore. Il nostro approccio è stato valutato empiricamente su un ambiente simulato progettato partendo da dati reali. In particolare, abbiamo valutato la nostra strategia in scenari che rappresentano differenti tipologie di partite, ottenendo un guadagno finale pari a 1.7 volte quello della strartegia di base.

Designing a reinforcement learning-based system for optimal odds selection in sports betting

Lucchini, Marco
2022/2023

Abstract

The global sports betting market accounted for 83.65 billion dollars in 2022 and is expected to expand at a compound annual growth rate (CAGR) of 10.3% from 2023 to 2030. Adopting cutting-edge technologies, such as Artificial Intelligence, is believed to largely impact bookmakers' economic profits, even though the research literature currently lacks works providing concrete aid in sports odds optimization. In this thesis, we present an examination and implementation of a Reinforcement Learning algorithm to develop an optimal odds selection system in sports betting. This will take advantage of the economic and temporal information that we can extract from real-world data containing the bets of real players. In particular, partnering with a sector-leading company, we will deliver a fully automated algorithm capable of providing optimal odds scheduling for football matches during the week before the event. Our scope is restricted to the three main odds related to the winning team of the match. We will leverage both domain knowledge and a rich historical dataset. Our framework comprises two main components: a forecasting algorithm capable of predicting the bettors' response to our stimuli (i.e., odds variations) and a model-based RL algorithm exploiting the former model to provide an optimal strategy. To achieve our goal, we explored the data, gathering insights on how both bookmakers and bettors behave when faced with particular contextual information, along with the odds: our strategy accounts for market response to new odds selection, temporal information (e.g., distance from the event, day of the week...) and minimizes the total risk of exposure of the bookmaker. We chose forecasting methods based on boosted trees while using Fitted Q-Iteration as a decision-maker. Our approach model was empirically evaluated on a simulated environment designed starting from real-world data. In particular, we evaluated our policy in scenarios representing different bookmaking challenges, attaining a final gain of 1.7 times the gain of the baseline policy.
BIANCHI, TOMMASO
GENALTI, GIANMARCO
ING - Scuola di Ingegneria Industriale e dell'Informazione
19-dic-2023
2022/2023
Il mercato globale delle scommesse sportive ammontava a 83,65 miliardi di dollari nel 2022 e si prevede che si espanderà a un tasso di crescita annuale composto (CAGR) del 10,3% dal 2023 al 2030. Si ritiene che l’adozione di tecnologie all’avanguardia, come l’Intelligenza Artificiale, abbia un impatto significativo sui profitti economici dei bookmaker. Attualmente nella letteratura scientifica mancano lavori che forniscano aiuti concreti nell’ottimizzazione delle quote su eventi sportivi. In questa tesi, presentiamo l'analisi e l'implementazione di un algoritmo di Reinforcement Learning per sviluppare un sistema di selezione ottimale delle quote nelle scommesse sportive. Ciò trae vantaggio dalle informazioni economiche e temporali che possiamo estrarre da dati reali contenenti le giocate di veri scommettitori. In particolare, collaborando con un'azienda leader del settore, forniremo un algoritmo completamente automatizzato in grado di fornire una pianificazione ottimale delle quote per le partite di calcio durante la settimana prima dell'evento. Il nostro campo d'azione è limitato alle tre quote principali relative alla squadra vincente della partita. Sfrutteremo sia la conoscenza di dominio che un ricco set di dati storici. Il nostro framework comprende due componenti principali: un algoritmo di previsione in grado di predire la risposta degli scommettitori ai nostri stimoli (ovvero, variazioni di quote) e un algoritmo di model-based RL che sfrutta il predittore per fornire una strategia ottimale. Per raggiungere il nostro obiettivo, abbiamo esplorato i dati, raccogliendo informazioni su come si comportano sia i bookmaker che gli scommettitori di fronte a particolari informazioni contestuali, insieme alle quote: la nostra strategia tiene conto della risposta del mercato alla selezione di nuove quote, informazioni temporali (ad esempio, la distanza dal evento, giorno della settimana...) e riduce al minimo il rischio totale di esposizione del bookmaker. Abbiamo scelto di utilizzare metodi di previsione basati su alberi decisionali, utilizzando Fitted Q-Iteration come decisore. Il nostro approccio è stato valutato empiricamente su un ambiente simulato progettato partendo da dati reali. In particolare, abbiamo valutato la nostra strategia in scenari che rappresentano differenti tipologie di partite, ottenendo un guadagno finale pari a 1.7 volte quello della strartegia di base.
File allegati
File Dimensione Formato  
2023_12_Lucchini_Executive Summary_02.pdf

non accessibile

Descrizione: Executive Summary
Dimensione 501.68 kB
Formato Adobe PDF
501.68 kB Adobe PDF   Visualizza/Apri
2023_12_Lucchini_Tesi_01.pdf

non accessibile

Descrizione: Thesis
Dimensione 5.82 MB
Formato Adobe PDF
5.82 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/215909