Causal inference is crucial in observational studies where randomization is not feasible. Its primary goal is to distinguish true cause-and-effect relationships from mere correlations, ensuring that the impact of treatments on outcomes are not driven by confounding factors. Functional data, such as treatments or responses observed over a continuous domain, require specialized methods for accurate causal effect estimation. The functional propensity score (FPS) method extends propensity score approaches to functional treatments using functional principal component analysis (FPCA) but has limitations in covariate handling and computational efficiency. This thesis enhances FPS by introducing a more efficient weighting algorithm while maintaining covariate balance and causal effect accuracy. We extend its applicability to functional treatments with functional responses and covariates, improving its relevance to real-world studies. Simulations confirm the method’s effectiveness in bias reduction and computational performance. We apply our approach to the UK Biobank dataset, estimating the causal effect of body mass index trajectories on type 2 diabetes incidence, considering sex, hypertension and beta-blocker use as confounding factors. This research advances functional data analysis and causal inference by providing a robust and computationally efficient framework for estimating causal effects in functional settings.

L'inferenza causale è fondamentale negli studi osservazionali in cui la randomizzazione non è fattibile. Il suo obiettivo principale è distinguere le vere relazioni di causa-effetto dalle semplici correlazioni, garantendo che l'impatto dei trattamenti sulle risposte non sia influenzato da fattori di confondimento. I dati funzionali, come trattamenti o risposte osservate su un dominio continuo, richiedono metodi specializzati per una stima accurata degli effetti causali. Il metodo del Functional Propensity Score (FPS) estende l'approccio del propensity score ai trattamenti funzionali utilizzando l'analisi delle componenti principali funzionali, ma presenta limitazioni nella gestione delle covariate e nell'efficienza computazionale. Questa tesi migliora l'FPS introducendo un algoritmo di stima dei pesi più efficiente, garantendo al contempo il bilanciamento delle covariate e l'accuratezza della stima dell'effetto causale. Estendiamo la sua applicabilità a trattamenti funzionali con risposte e covariate funzionali, aumentando la sua rilevanza e negli studi reali. Le simulazioni confermano l'efficacia del metodo nella riduzione del bias e nelle prestazioni computazionali. Applichiamo il nostro approccio al dataset UK Biobank, stimando l'effetto causale delle traiettorie dell'indice di massa corporea sull'incidenza del diabete di tipo 2, considerando sesso, ipertensione e uso di beta-bloccanti come fattori confondenti. Questa ricerca contribuisce all'analisi dei dati funzionali e all'inferenza causale fornendo un framework robusto ed efficiente dal punto di vista computazionale per la stima degli effetti causali in contesti funzionali.

Causal inference in functional data analysis: estimating causal effects using a propensity score-based approach

Ciardulli, Simone
2023/2024

Abstract

Causal inference is crucial in observational studies where randomization is not feasible. Its primary goal is to distinguish true cause-and-effect relationships from mere correlations, ensuring that the impact of treatments on outcomes are not driven by confounding factors. Functional data, such as treatments or responses observed over a continuous domain, require specialized methods for accurate causal effect estimation. The functional propensity score (FPS) method extends propensity score approaches to functional treatments using functional principal component analysis (FPCA) but has limitations in covariate handling and computational efficiency. This thesis enhances FPS by introducing a more efficient weighting algorithm while maintaining covariate balance and causal effect accuracy. We extend its applicability to functional treatments with functional responses and covariates, improving its relevance to real-world studies. Simulations confirm the method’s effectiveness in bias reduction and computational performance. We apply our approach to the UK Biobank dataset, estimating the causal effect of body mass index trajectories on type 2 diabetes incidence, considering sex, hypertension and beta-blocker use as confounding factors. This research advances functional data analysis and causal inference by providing a robust and computationally efficient framework for estimating causal effects in functional settings.
FONTANA, NICOLE
IEVA, FRANCESCA
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-apr-2025
2023/2024
L'inferenza causale è fondamentale negli studi osservazionali in cui la randomizzazione non è fattibile. Il suo obiettivo principale è distinguere le vere relazioni di causa-effetto dalle semplici correlazioni, garantendo che l'impatto dei trattamenti sulle risposte non sia influenzato da fattori di confondimento. I dati funzionali, come trattamenti o risposte osservate su un dominio continuo, richiedono metodi specializzati per una stima accurata degli effetti causali. Il metodo del Functional Propensity Score (FPS) estende l'approccio del propensity score ai trattamenti funzionali utilizzando l'analisi delle componenti principali funzionali, ma presenta limitazioni nella gestione delle covariate e nell'efficienza computazionale. Questa tesi migliora l'FPS introducendo un algoritmo di stima dei pesi più efficiente, garantendo al contempo il bilanciamento delle covariate e l'accuratezza della stima dell'effetto causale. Estendiamo la sua applicabilità a trattamenti funzionali con risposte e covariate funzionali, aumentando la sua rilevanza e negli studi reali. Le simulazioni confermano l'efficacia del metodo nella riduzione del bias e nelle prestazioni computazionali. Applichiamo il nostro approccio al dataset UK Biobank, stimando l'effetto causale delle traiettorie dell'indice di massa corporea sull'incidenza del diabete di tipo 2, considerando sesso, ipertensione e uso di beta-bloccanti come fattori confondenti. Questa ricerca contribuisce all'analisi dei dati funzionali e all'inferenza causale fornendo un framework robusto ed efficiente dal punto di vista computazionale per la stima degli effetti causali in contesti funzionali.
File allegati
File Dimensione Formato  
2025_04_Ciardulli_Executive_Summary.pdf

solo utenti autorizzati a partire dal 12/03/2026

Descrizione: Executive Summary
Dimensione 2.92 MB
Formato Adobe PDF
2.92 MB Adobe PDF   Visualizza/Apri
2025_04_Ciardulli_Thesis.pdf

solo utenti autorizzati a partire dal 12/03/2026

Descrizione: Thesis
Dimensione 16.27 MB
Formato Adobe PDF
16.27 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/234697