In this work we aim to connect the advanced statistical techniques of Functional Data Analysis with the high dimensional and complex setting of genomic data. Specifically, we adapt some statistical techniques to the needs of the biological community, both providing solutions to specific problems with innovative biological insights and developing efficient tools to make our research easily fruitful for the community. We present how the identification of phase and amplitude variations in functional data can be useful to define and classify ChIP-sequencing profiles or cognitive decline curves of patients affected by Alzheimer’s disease. Beside that, we present a new method, called FLAME, to deal with high dimensional and sparse Function-on-Scalar linear regression. We introduce FLAME both in its theoretical aspects and in its algorithmic implementation and then we present some applications related to the genomic area. FLAME has been used to analyze the influence of Single Nucleotide Polymorphisms to the longitudinal measurements of lung development of children affected by asthma and the influence of the stool and buccal microbiome in the growth of children affected by an overweight condition.

In questo lavoro ci proponiamo l’obiettivo di collegare le avanzate tecniche statistiche dell’Analisi di Dati Funzionali con il contesto genomico di dati complessi e ad alta dimensionalità. In particolare, adattiamo alcune tecniche statistiche alle necessità della comunità biologica, sia offrendo soluzioni a specifici problemi con innovativi risvolti biologici, sia sviluppando programmi efficienti per rendere la nostra ricerca facilmente fruibile alla comunità. Analizziamo come la distinzione tra variabilità in fase e ampiezza nei dati funzionali possa essere decisiva per definire e classificare profili di ChIP-sequencing o misurazioni longitudinali del declino cognitivo di pazienti affetti dalla malattia di Alzheimer. Inoltre presentiamo un nuovo metodo, chiamato FLAME, per analizzare problemi di regressione lineare con predittori scalari e risposta funzionale. FLAME viene introdotto sia nei suoi aspetti teorici che implementativi; inoltre vengono presentate alcune applicazioni legate all’ambito genomico. In particolare FLAME viene utilizzato per analizzare l’influenza dei Polimorfismi a Singolo Nucleotide sulle misurazioni longitudinali dello sviluppo polmonare di bambini affetti da asma e per analizzare l’influenza del microbioma della saliva e delle feci sulla crescita di bambini affetti da una condizione di obesità.

Functional data analysis for high dimensional and complex genomic data

PARODI, ALICE CARLA LUISA

Abstract

In this work we aim to connect the advanced statistical techniques of Functional Data Analysis with the high dimensional and complex setting of genomic data. Specifically, we adapt some statistical techniques to the needs of the biological community, both providing solutions to specific problems with innovative biological insights and developing efficient tools to make our research easily fruitful for the community. We present how the identification of phase and amplitude variations in functional data can be useful to define and classify ChIP-sequencing profiles or cognitive decline curves of patients affected by Alzheimer’s disease. Beside that, we present a new method, called FLAME, to deal with high dimensional and sparse Function-on-Scalar linear regression. We introduce FLAME both in its theoretical aspects and in its algorithmic implementation and then we present some applications related to the genomic area. FLAME has been used to analyze the influence of Single Nucleotide Polymorphisms to the longitudinal measurements of lung development of children affected by asthma and the influence of the stool and buccal microbiome in the growth of children affected by an overweight condition.
SABADINI, IRENE MARIA
LUCCHETTI, ROBERTO
30-gen-2017
In questo lavoro ci proponiamo l’obiettivo di collegare le avanzate tecniche statistiche dell’Analisi di Dati Funzionali con il contesto genomico di dati complessi e ad alta dimensionalità. In particolare, adattiamo alcune tecniche statistiche alle necessità della comunità biologica, sia offrendo soluzioni a specifici problemi con innovativi risvolti biologici, sia sviluppando programmi efficienti per rendere la nostra ricerca facilmente fruibile alla comunità. Analizziamo come la distinzione tra variabilità in fase e ampiezza nei dati funzionali possa essere decisiva per definire e classificare profili di ChIP-sequencing o misurazioni longitudinali del declino cognitivo di pazienti affetti dalla malattia di Alzheimer. Inoltre presentiamo un nuovo metodo, chiamato FLAME, per analizzare problemi di regressione lineare con predittori scalari e risposta funzionale. FLAME viene introdotto sia nei suoi aspetti teorici che implementativi; inoltre vengono presentate alcune applicazioni legate all’ambito genomico. In particolare FLAME viene utilizzato per analizzare l’influenza dei Polimorfismi a Singolo Nucleotide sulle misurazioni longitudinali dello sviluppo polmonare di bambini affetti da asma e per analizzare l’influenza del microbioma della saliva e delle feci sulla crescita di bambini affetti da una condizione di obesità.
Tesi di dottorato
File allegati
File Dimensione Formato  
Parodi.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 23.33 MB
Formato Adobe PDF
23.33 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/131397