Functional data analysis deals with data observed as curves over time or along other continua and has developed rapidly in recent years. However, methods for constructing prediction bands that are both statistically valid and locally adaptive are still relatively scarce. State-of-the-art functional conformal prediction provides band-shaped, distribution-free prediction sets with finite- sample marginal coverage, but its single global calibration becomes inefficient when predictive difficulty varies across covariate profiles. This thesis develops a kernel-based framework for normalized functional conformal prediction that preserves the simplicity of split conformal methods while allowing the band width to adapt to local heterogeneity. The central idea is to estimate a local scale function from training residuals using kernel weights, so that the band width can vary with both the covariates and the domain, while a single global conformal step is used to determine the final prediction bands. Within this framework, two concrete constructions are studied. A partition-based method uses indicator kernels on a low-dimensional embedding of the functional covariates to estimate piecewise-constant scale functions, yielding computationally efficient and regime-specific bands. A smooth kernel method replaces hard partitions with continuous kernel weights, producing genuinely localized scale estimates and smoothly varying band widths. Both procedures retain finite-sample marginal validity and adapt to heterogeneous variability patterns. Finally, the thesis shows that these constructions and the original functional conformal prediction method can be viewed as special cases of the same kernel-based framework: constant kernels recover global bands, partition-based kernels yield bin-wise adaptation, and smooth kernels provide continuous local adaptation. Simulation studies and a real-data application to bike rental demand illustrate that the proposed methods can produce substantially narrower bands in stable regions of the covariate space, while maintaining the desired coverage level.

L’analisi di dati funzionali studia informazioni osservate sotto forma di curve nel tempo o lungo altri domini continui e si è rapidamente sviluppata negli ultimi anni. La disponibilità di metodi per costruire bande di previsione che siano al tempo stesso statisticamente valide e localmente adattive rimane però limitata. La predizione conforme funzionale consente di ottenere bande di previsione prive di assunzioni distribuzionali e dotate di copertura marginale finito-campione, ma una calibrazione globale unica risulta inefficiente quando la difficoltà predittiva varia al variare delle covariate. Questa tesi introduce un quadro kernel-based per la predizione conforme funzionale normaliz- zata che conserva la semplicità dei metodi conformi di tipo split, permettendo al tempo stesso di adattare l’ampiezza della banda alla variabilità locale. L’idea centrale è stimare, a partire dai residui nel campione di training e tramite pesi kernel, una funzione di scala locale, così che l’ampiezza della banda possa dipendere sia dalle covariate sia dal dominio funzionale, mentre il passo conforme rimane globale e determina le bande finali. All’interno di questo quadro vengono analizzati due costrutti specifici. Un metodo basato su partizioni utilizza kernel indicatori su una riduzione dimensionale delle covariate funzionali per stimare funzioni di scala a tratti costanti, ottenendo bande specifiche per regime e com- putazionalmente efficienti. Un metodo a kernel liscio sostituisce le partizioni rigide con pesi kernel continui, producendo stime di scala localizzate e bande con ampiezza che varia in modo liscio. Entrambe le procedure mantengono la validità marginale finita campionaria e si adattano a pattern eterogenei di variabilità. Infine, la tesi mostra come questi metodi e la formulazione originaria della predizione conforme funzionale possano essere interpretati come casi particolari di un unico framework kernel-based: kernel costanti recuperano bande globali, kernel a partizione producono un’adattività per celle, mentre kernel regolari garantiscono un’adattività continua. Studi di simulazione e un’applicazione a dati reali sulla domanda di biciclette a noleggio evidenziano come i metodi proposti possano produrre bande significativamente più strette nelle regioni stabili dello spazio delle covariate, preservando al contempo il livello di copertura desiderato.

Kernel-based adaptive bands for normalized functional conformal prediction

CEVOLANI, MATTEO
2024/2025

Abstract

Functional data analysis deals with data observed as curves over time or along other continua and has developed rapidly in recent years. However, methods for constructing prediction bands that are both statistically valid and locally adaptive are still relatively scarce. State-of-the-art functional conformal prediction provides band-shaped, distribution-free prediction sets with finite- sample marginal coverage, but its single global calibration becomes inefficient when predictive difficulty varies across covariate profiles. This thesis develops a kernel-based framework for normalized functional conformal prediction that preserves the simplicity of split conformal methods while allowing the band width to adapt to local heterogeneity. The central idea is to estimate a local scale function from training residuals using kernel weights, so that the band width can vary with both the covariates and the domain, while a single global conformal step is used to determine the final prediction bands. Within this framework, two concrete constructions are studied. A partition-based method uses indicator kernels on a low-dimensional embedding of the functional covariates to estimate piecewise-constant scale functions, yielding computationally efficient and regime-specific bands. A smooth kernel method replaces hard partitions with continuous kernel weights, producing genuinely localized scale estimates and smoothly varying band widths. Both procedures retain finite-sample marginal validity and adapt to heterogeneous variability patterns. Finally, the thesis shows that these constructions and the original functional conformal prediction method can be viewed as special cases of the same kernel-based framework: constant kernels recover global bands, partition-based kernels yield bin-wise adaptation, and smooth kernels provide continuous local adaptation. Simulation studies and a real-data application to bike rental demand illustrate that the proposed methods can produce substantially narrower bands in stable regions of the covariate space, while maintaining the desired coverage level.
BORTOLOTTI, TERESA
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
L’analisi di dati funzionali studia informazioni osservate sotto forma di curve nel tempo o lungo altri domini continui e si è rapidamente sviluppata negli ultimi anni. La disponibilità di metodi per costruire bande di previsione che siano al tempo stesso statisticamente valide e localmente adattive rimane però limitata. La predizione conforme funzionale consente di ottenere bande di previsione prive di assunzioni distribuzionali e dotate di copertura marginale finito-campione, ma una calibrazione globale unica risulta inefficiente quando la difficoltà predittiva varia al variare delle covariate. Questa tesi introduce un quadro kernel-based per la predizione conforme funzionale normaliz- zata che conserva la semplicità dei metodi conformi di tipo split, permettendo al tempo stesso di adattare l’ampiezza della banda alla variabilità locale. L’idea centrale è stimare, a partire dai residui nel campione di training e tramite pesi kernel, una funzione di scala locale, così che l’ampiezza della banda possa dipendere sia dalle covariate sia dal dominio funzionale, mentre il passo conforme rimane globale e determina le bande finali. All’interno di questo quadro vengono analizzati due costrutti specifici. Un metodo basato su partizioni utilizza kernel indicatori su una riduzione dimensionale delle covariate funzionali per stimare funzioni di scala a tratti costanti, ottenendo bande specifiche per regime e com- putazionalmente efficienti. Un metodo a kernel liscio sostituisce le partizioni rigide con pesi kernel continui, producendo stime di scala localizzate e bande con ampiezza che varia in modo liscio. Entrambe le procedure mantengono la validità marginale finita campionaria e si adattano a pattern eterogenei di variabilità. Infine, la tesi mostra come questi metodi e la formulazione originaria della predizione conforme funzionale possano essere interpretati come casi particolari di un unico framework kernel-based: kernel costanti recuperano bande globali, kernel a partizione producono un’adattività per celle, mentre kernel regolari garantiscono un’adattività continua. Studi di simulazione e un’applicazione a dati reali sulla domanda di biciclette a noleggio evidenziano come i metodi proposti possano produrre bande significativamente più strette nelle regioni stabili dello spazio delle covariate, preservando al contempo il livello di copertura desiderato.
File allegati
File Dimensione Formato  
Cevolani_Exec_summary.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Executive Summary Matteo Cevolani
Dimensione 433.41 kB
Formato Adobe PDF
433.41 kB Adobe PDF   Visualizza/Apri
Cevolani_Tesi_Magistrale.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Tesi Matteo Cevolani
Dimensione 11.33 MB
Formato Adobe PDF
11.33 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/247240