Il presente lavoro di tesi si inserisce all'interno della letteratura finanziaria ed accademica relativa alla strategia di investimento nota come Pairs Trading. Il Pairs Trading nasce nella prima metà degli anni '80 da un'intuizione di un team di quantitativi in Morgan Stanley, guidato da Nunzio Tartaglia, capo del quantitative and proprietary trading della banca stessa. La strategia si inserisce all'interno del panorama delle applicazioni di trading appartenenti all'"arbitraggio statistico" ampiamente utilizzati dagli hedge funds e i quantitative desk delle principali banche di investimento, i quali sfruttano la possibilità di generare un profitto atteso, e non certo come nell'arbitraggio classico, a fronte di una discrepanza anomala fra due prezzi che formano la coppia. Il Pairs Trading è una strategia di investimento molto diffusa per motivi di semplicità della sua implementazione. Infatti l'investitore deve individuare due prezzi che abbiano avuto nel tempo una dinamica simile; quando la differenza fra i due prezzi, nota anche come spread, aumenta superando una soglia considerata anomala, l'investitore vende l'asset relativamente sopravvalutato e acquista quello relativamente sottovalutato, sulla base del fatto che la differenza fra i due prezzi ritornerà sotto la soglia anomala, generando quindi un profitto per l'arbitrageur. Nonostante ciò, vi sono tre principali questioni non banali alle quali è necessario dare una risposta: 1.Cosa significa che due asset presentano un dinamica comune? Come è possibile identificare ciò? 2.Come può essere modellato lo spread da un punto di vista econometrico? 3.Come viene definito e calcolato un livello di soglia o trigger point? 4.Come può essere realmente implementata una strategia di questo tipo all'interno del mercato finanziario? Quali sono i profili di profitto e rischio associati a questa strategia? La prima parte del presente lavoro di tesi è dedicata ad analizzare i maggiori contributi in letteratura che rispondono alle precedenti 4 domande. Il Capitolo 1 analizza criticamente il filone di letteratura dedicato esplicitamente a calcolare le performance di una strategia di Pairs Trading su dati finanziari reali. La maggior parte dei lavori presentati all'interno di questo Capitolo applicano la metodologia di selezione delle coppie e gestione dello spread introdotta da Gatev et al. (2006), che rappresenta il più noto contributo accademico nell'ambito del Pairs Trading. Il Capitolo 2 si pone l'obiettivo di rispondere alle prime tre domande precedentemente esposte, le quali concernono gli aspetti metodologici circa la formazione dello spread e la sua gestione all'interno di una strategia di Pairs Trading. Di particolare rilevanza all'interno di questo filone di letteratura risulta l'approccio della tecnica econometrica della cointegrazione applicata al Pairs Trading, introdotta da Burgess (2003). Lo strumento della cointegrazione permette di identificare quella combinazione lineare, se esiste, tra due serie storiche che risulti stazionaria. Quest'ultima proprietà risulta fondamentale per una strategia di Pairs Trading: infatti, uno spread, o combinazione lineare di prezzi, che presenti proprietà di stazionarietà o mean-reversion sarà caratterizzato da una dinamica prevedibile nel futuro. Questa prevedibilità permette in ultima istanza all'arbitrageur di generare un certo profitto atteso mediante la costruzione di un'opportuna combinazione lineare dei prezzi dei due asset che formano la coppia. Partendo dallo spunto della cointegrazione, fornito in letteratura da Burgess (2003), nel Capitolo 3, vengono discusse le principali problematiche associate a questo approccio, come motivazione alla base della formulazione di un modello alternativo dello spread, che rappresenta il contributo innovativo del presente lavoro di tesi. Il modello, descritto in dettaglio all'interno del Capitolo 4, parte dall'ipotesi che la cointegrazione non sia una delle condizioni fondamentali alla base del successo di una strategia di Pairs Trading, bensì la mean-reversion o stazionarietà dello spread. Infatti, la cointegrazione ipotizza la presenza di un equilibrio stabile nel lungo periodo, evento altamente improbabile all'interno dei mercati finanziari. Risulta pertanto necessario sviluppare un modello che sia in grado di intercettare correttamente la variazione della dinamica dello spread nel tempo. A tal proposito può quindi esistere uno spread che in realtà non è frutto di una combinazione lineare puramente stazionaria per cui i due prezzi originari risultano cointegrati, ma che comunque presenti una "componente latente" di mean-reversion ugualmente sfruttabile. Per ovviare a questa problematica, si è dunque ipotizzato che lo spread oggetto dell'investimento sia il risultato della somma di due componenti: un processo stazionario autoregressivo di ordine 1 y_{t} e un processo random-walk non stazionario z_{t}. Sotto queste ipotesi, in linea teorica il test di cointegrazione dovrebbe dare sempre esito negativo, dato che la combinazione lineare fra i prezzi che dà origine allo spread non è puramente stazionaria, ma solo parzialmente proprio per la presenza della componente di random-walk. Dato che i fattori costituenti lo spread non possono essere direttamente osservate, esse vanno estrapolate mediante uno strumento econometrico. A tal proposito, l'applicazione qui proposta si configura come un modello state-space a variabili latenti, le cui variabili di stato possono essere estratte mediante il filtro di Kalman. Lo strumento viene introdotto all'interno del Capitolo 4, dove vengono inoltre discusse le proprietà degli stimatori associati ai parametri del modello stesso. Una volta definito formalmente il modello, all'interno del Capitolo 5 viene definita la strategia di trading, il cui funzionamento è concepito sulle ipotesi alla base del modello. In questo contesto viene costruito un indicatore di attivazione delle posizioni all'interno della strategia. Questo indicatore coincide con il rapporto dinamico di rischio-rendimento giornaliero, in cui il profitto atteso deriva dalla componente prevedibile all'interno del modello, ovvero il processo latente autoregressivo y_{t}, e il rischio ad esso associato è dato dalla somma delle deviazioni standard dei due processi latenti y_{t} e z_{t}. Questo rapporto dinamico viene dunque confrontato nel tempo rispetto alla soglia di rischio-rendimento massima selezionata dall'investitore; ogni qualvolta questo indicatore risulta inferiore alla soglia massima accettabile per l'investitore, quest'ultimo apre una posizione sullo spread, il cui segno dipende dal livello della componente auto-regressiva. Analogamente ogni qualvolta questo rapporto supera la soglia massima di rischio-rendimento accettabile per l'investitore, quest'ultimo chiude la posizione sullo spread precedentemente aperta, il cui segno dipende dal livello della componente auto-regressiva. La parte conclusiva di questa tesi è dedicata allo svolgimento di un set di simulazioni atte a descrivere la profittabilità della strategia sotto diverse specificazioni del processo di generazione dei dati simulati. In Sezione 5.3 vengono svolte due principali indagini. La prima suppone che tutte le informazioni necessarie per la decisione di investimento siano note a priori dall'investitore. Il secondo set di simulazioni, maggiormente realistico, ipotizza che l'investitore non conosca nulla circa i parametri del modello e i processi latenti che lo caratterizzano. Dal primo set di simulazioni si evidenzia una dominanza in termini di rapporto rischio-rendimento della situazione in cui il processo autoregressivo presenti una dinamica a bassa inerzia (ρ=0,5) rispetto al caso in cui sia fortemente inerziale (ρ=0,95). Inoltre, coeteris paribus, si registra una maggiore profittabilità nel caso in cui la componente autoregressiva y_{t} sia caratterizzata da una varianza pari a 2 volte quella del random-walk z_{t}. Trasversalmente a tutti i casi analizzati, coerentemente con gli spunti forniti dalla letteratura esistente, si evidenzia in generale una bassa rischiosità della strategia, confermata dai rapporti rischio-rendimento tutti maggiori di 1. Passando dalle condizioni in cui "tutto è noto" alla situazione più realistica in cui i parametri devono essere stimati e lo stato estratto mediante il filtro di Kalman, si registra un significativo peggioramento delle performance, in media pari al 93%. Nonostante ciò, i risultati permangono positivi e confermano la dominanza in termini di rapporto rischio-rendimento della situazione in cui il processo autoregressivo sia a bassa inerzia (ρ=0,5, rendimento medio pari al 23% su due anni) rispetto al caso in cui sia fortemente inerziale (ρ=0,95, 8,8% su due anni). Il passaggio dall'utilizzo di una soglia di rischio-rendimento più conservativa ad una più aggressiva induce un aumento significativo dei profitti, in misura più che proporzionale rispetto all'aumento di rischio, con il risultato che i rapporti rischio-rendimento subiscono nel complesso un lieve miglioramento. Si osserva inoltre una dominanza del profilo di rischio più "aggressivo" rispetto a quello più "conservativo", evidenziando come la leva della soglia di rischio-rendimento agisca solamente in funzione di una riduzione del profitto atteso, non permettendo nel contempo di beneficiare di una riduzione più che proporzionale del rischio associato, inteso qui come deviazione standard. Pertanto a fronte di una prima evidenza sui dati simulati, sembrerebbe che la soglia di rischio-rendimento non sia lo strumento più corretto per gestire il rischio associato alla strategia.

Pairs trading : un modello a variabili latenti basato sul filtro di Kalman

DELLEDONNE, FRANCESCO
2011/2012

Abstract

Il presente lavoro di tesi si inserisce all'interno della letteratura finanziaria ed accademica relativa alla strategia di investimento nota come Pairs Trading. Il Pairs Trading nasce nella prima metà degli anni '80 da un'intuizione di un team di quantitativi in Morgan Stanley, guidato da Nunzio Tartaglia, capo del quantitative and proprietary trading della banca stessa. La strategia si inserisce all'interno del panorama delle applicazioni di trading appartenenti all'"arbitraggio statistico" ampiamente utilizzati dagli hedge funds e i quantitative desk delle principali banche di investimento, i quali sfruttano la possibilità di generare un profitto atteso, e non certo come nell'arbitraggio classico, a fronte di una discrepanza anomala fra due prezzi che formano la coppia. Il Pairs Trading è una strategia di investimento molto diffusa per motivi di semplicità della sua implementazione. Infatti l'investitore deve individuare due prezzi che abbiano avuto nel tempo una dinamica simile; quando la differenza fra i due prezzi, nota anche come spread, aumenta superando una soglia considerata anomala, l'investitore vende l'asset relativamente sopravvalutato e acquista quello relativamente sottovalutato, sulla base del fatto che la differenza fra i due prezzi ritornerà sotto la soglia anomala, generando quindi un profitto per l'arbitrageur. Nonostante ciò, vi sono tre principali questioni non banali alle quali è necessario dare una risposta: 1.Cosa significa che due asset presentano un dinamica comune? Come è possibile identificare ciò? 2.Come può essere modellato lo spread da un punto di vista econometrico? 3.Come viene definito e calcolato un livello di soglia o trigger point? 4.Come può essere realmente implementata una strategia di questo tipo all'interno del mercato finanziario? Quali sono i profili di profitto e rischio associati a questa strategia? La prima parte del presente lavoro di tesi è dedicata ad analizzare i maggiori contributi in letteratura che rispondono alle precedenti 4 domande. Il Capitolo 1 analizza criticamente il filone di letteratura dedicato esplicitamente a calcolare le performance di una strategia di Pairs Trading su dati finanziari reali. La maggior parte dei lavori presentati all'interno di questo Capitolo applicano la metodologia di selezione delle coppie e gestione dello spread introdotta da Gatev et al. (2006), che rappresenta il più noto contributo accademico nell'ambito del Pairs Trading. Il Capitolo 2 si pone l'obiettivo di rispondere alle prime tre domande precedentemente esposte, le quali concernono gli aspetti metodologici circa la formazione dello spread e la sua gestione all'interno di una strategia di Pairs Trading. Di particolare rilevanza all'interno di questo filone di letteratura risulta l'approccio della tecnica econometrica della cointegrazione applicata al Pairs Trading, introdotta da Burgess (2003). Lo strumento della cointegrazione permette di identificare quella combinazione lineare, se esiste, tra due serie storiche che risulti stazionaria. Quest'ultima proprietà risulta fondamentale per una strategia di Pairs Trading: infatti, uno spread, o combinazione lineare di prezzi, che presenti proprietà di stazionarietà o mean-reversion sarà caratterizzato da una dinamica prevedibile nel futuro. Questa prevedibilità permette in ultima istanza all'arbitrageur di generare un certo profitto atteso mediante la costruzione di un'opportuna combinazione lineare dei prezzi dei due asset che formano la coppia. Partendo dallo spunto della cointegrazione, fornito in letteratura da Burgess (2003), nel Capitolo 3, vengono discusse le principali problematiche associate a questo approccio, come motivazione alla base della formulazione di un modello alternativo dello spread, che rappresenta il contributo innovativo del presente lavoro di tesi. Il modello, descritto in dettaglio all'interno del Capitolo 4, parte dall'ipotesi che la cointegrazione non sia una delle condizioni fondamentali alla base del successo di una strategia di Pairs Trading, bensì la mean-reversion o stazionarietà dello spread. Infatti, la cointegrazione ipotizza la presenza di un equilibrio stabile nel lungo periodo, evento altamente improbabile all'interno dei mercati finanziari. Risulta pertanto necessario sviluppare un modello che sia in grado di intercettare correttamente la variazione della dinamica dello spread nel tempo. A tal proposito può quindi esistere uno spread che in realtà non è frutto di una combinazione lineare puramente stazionaria per cui i due prezzi originari risultano cointegrati, ma che comunque presenti una "componente latente" di mean-reversion ugualmente sfruttabile. Per ovviare a questa problematica, si è dunque ipotizzato che lo spread oggetto dell'investimento sia il risultato della somma di due componenti: un processo stazionario autoregressivo di ordine 1 y_{t} e un processo random-walk non stazionario z_{t}. Sotto queste ipotesi, in linea teorica il test di cointegrazione dovrebbe dare sempre esito negativo, dato che la combinazione lineare fra i prezzi che dà origine allo spread non è puramente stazionaria, ma solo parzialmente proprio per la presenza della componente di random-walk. Dato che i fattori costituenti lo spread non possono essere direttamente osservate, esse vanno estrapolate mediante uno strumento econometrico. A tal proposito, l'applicazione qui proposta si configura come un modello state-space a variabili latenti, le cui variabili di stato possono essere estratte mediante il filtro di Kalman. Lo strumento viene introdotto all'interno del Capitolo 4, dove vengono inoltre discusse le proprietà degli stimatori associati ai parametri del modello stesso. Una volta definito formalmente il modello, all'interno del Capitolo 5 viene definita la strategia di trading, il cui funzionamento è concepito sulle ipotesi alla base del modello. In questo contesto viene costruito un indicatore di attivazione delle posizioni all'interno della strategia. Questo indicatore coincide con il rapporto dinamico di rischio-rendimento giornaliero, in cui il profitto atteso deriva dalla componente prevedibile all'interno del modello, ovvero il processo latente autoregressivo y_{t}, e il rischio ad esso associato è dato dalla somma delle deviazioni standard dei due processi latenti y_{t} e z_{t}. Questo rapporto dinamico viene dunque confrontato nel tempo rispetto alla soglia di rischio-rendimento massima selezionata dall'investitore; ogni qualvolta questo indicatore risulta inferiore alla soglia massima accettabile per l'investitore, quest'ultimo apre una posizione sullo spread, il cui segno dipende dal livello della componente auto-regressiva. Analogamente ogni qualvolta questo rapporto supera la soglia massima di rischio-rendimento accettabile per l'investitore, quest'ultimo chiude la posizione sullo spread precedentemente aperta, il cui segno dipende dal livello della componente auto-regressiva. La parte conclusiva di questa tesi è dedicata allo svolgimento di un set di simulazioni atte a descrivere la profittabilità della strategia sotto diverse specificazioni del processo di generazione dei dati simulati. In Sezione 5.3 vengono svolte due principali indagini. La prima suppone che tutte le informazioni necessarie per la decisione di investimento siano note a priori dall'investitore. Il secondo set di simulazioni, maggiormente realistico, ipotizza che l'investitore non conosca nulla circa i parametri del modello e i processi latenti che lo caratterizzano. Dal primo set di simulazioni si evidenzia una dominanza in termini di rapporto rischio-rendimento della situazione in cui il processo autoregressivo presenti una dinamica a bassa inerzia (ρ=0,5) rispetto al caso in cui sia fortemente inerziale (ρ=0,95). Inoltre, coeteris paribus, si registra una maggiore profittabilità nel caso in cui la componente autoregressiva y_{t} sia caratterizzata da una varianza pari a 2 volte quella del random-walk z_{t}. Trasversalmente a tutti i casi analizzati, coerentemente con gli spunti forniti dalla letteratura esistente, si evidenzia in generale una bassa rischiosità della strategia, confermata dai rapporti rischio-rendimento tutti maggiori di 1. Passando dalle condizioni in cui "tutto è noto" alla situazione più realistica in cui i parametri devono essere stimati e lo stato estratto mediante il filtro di Kalman, si registra un significativo peggioramento delle performance, in media pari al 93%. Nonostante ciò, i risultati permangono positivi e confermano la dominanza in termini di rapporto rischio-rendimento della situazione in cui il processo autoregressivo sia a bassa inerzia (ρ=0,5, rendimento medio pari al 23% su due anni) rispetto al caso in cui sia fortemente inerziale (ρ=0,95, 8,8% su due anni). Il passaggio dall'utilizzo di una soglia di rischio-rendimento più conservativa ad una più aggressiva induce un aumento significativo dei profitti, in misura più che proporzionale rispetto all'aumento di rischio, con il risultato che i rapporti rischio-rendimento subiscono nel complesso un lieve miglioramento. Si osserva inoltre una dominanza del profilo di rischio più "aggressivo" rispetto a quello più "conservativo", evidenziando come la leva della soglia di rischio-rendimento agisca solamente in funzione di una riduzione del profitto atteso, non permettendo nel contempo di beneficiare di una riduzione più che proporzionale del rischio associato, inteso qui come deviazione standard. Pertanto a fronte di una prima evidenza sui dati simulati, sembrerebbe che la soglia di rischio-rendimento non sia lo strumento più corretto per gestire il rischio associato alla strategia.
MANZONI, MATTIA
ING II - Scuola di Ingegneria dei Sistemi
19-dic-2012
2011/2012
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Tesi_PairsTrading_Delledonne.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi Pairs Trading - Delledonne
Dimensione 1.21 MB
Formato Adobe PDF
1.21 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/70742