A general correction of the Dirichlet Bootstrap to ensure asymptotic consistency

The Bootstrap represents one of the cornerstone methods of nonparametric inference. In its classical formulation, introduced by Efron, it enables the estimation of the sampling distribution of a statistic using only the observed data, through resampling with replacement from the empirical distribution of the sample. Among its extensions, the Dirichlet Bootstrap, proposed by Rubin, constitutes a continuous version of the Bootstrap, based on random weights associated with the data and drawn from a Dirichlet distribution with concentration parameter α. Despite its greater flexibility compared to the classical Bootstrap, its use in the literature has remained limited, as the inferential validity of the method crucially depends on the value of α. This thesis provides both a theoretical and empirical contribution aimed at making the Dirichlet Bootstrap a generalizable and reliable tool for statistical inference. The analysis investigates the behavior of the method as a function of α, comparing it with the Naive Bootstrap, and proposes a correction factor derived from the marginal variance of the Dirichlet weights that ensures asymptotic consistency for any α. On the theoretical side, it is shown that the corrected version of the method preserves the same limiting distribution as the classical bootstrap. Empirically, an extensive Monte Carlo simulation study confirms its validity across a wide range of inferential scenarios and probability models. Finally, the methodological framework is extended to the functional data setting, demonstrating that the corrected Dirichlet approach provides a coherent formulation for inference even in infinitedimensional spaces.

Il Bootstrap rappresenta uno dei metodi cardine dell’inferenza statistica non parametrica. La formulazione classica, introdotta da Efron, consente di stimare la distribuzione di una statistica utilizzando esclusivamente i dati osservati, attraverso un campionamento con reinserimento dalla distribuzione empirica del campione. Tra le sue estensioni, il Dirichlet Bootstrap, proposto da Rubin, costituisce una versione continua, basata su pesi casuali associati ai dati e distribuiti secondo una legge Dirichlet di parametro α. Nonostante la maggiore flessibilità rispetto al Naive Bootstrap, il metodo ha avuto una diffusione limitata nella letteratura, poiché la sua validità inferenziale dipende in modo cruciale dal parametro di concentrazione α. Questa tesi fornisce un contributo teorico ed empirico volto a rendere il Dirichlet Bootstrap un metodo generalizzabile e affidabile per l’inferenza statistica. L’analisi approfondisce il comportamento del metodo al variare di α, confrontandolo con il Bootstrap classico, e propone un fattore di correzione derivato dalla varianza marginale dei pesi Dirichlet, in grado di garantire consistenza asintotica per qualunque valore di α. Da un lato, la dimostrazione teorica mostra che la versione corretta del metodo conserva la stessa distribuzione limite del bootstrap classico; dall’altro, un ampio studio di simulazione Monte Carlo ne conferma la validità empirica in diversi contesti inferenziali e per differenti distribuzioni. Infine, il quadro metodologico viene esteso al caso dei dati funzionali, mostrando come l’approccio Dirichlet corretto fornisca una formulazione coerente per l’inferenza anche in spazi a dimensione infinita.