This work focuses on the application of functional data analysis techniques on a large database including some of the last most important available climate projections of the so called Representative Concentration Pathways (RCP) scenarios. Firstly the scenarios and the climate models that simulate these projections are described. The goal is to test a methodology based on nonparametric functional data analysis for the analysis of climate projections through the time series obtained by averaging data on the global surface. In particular the global mean is analyzed and compared to the means of the three different climatic zones: tropical, temperate and polar. The application concerns the study of surface air temperature and precipitation in the time interval 2006-2100. Data have been processed with smoothing techniques and the smoothed functions and the first derivatives were estimated. The analysis of the four possible scenarios and of the available climate models allows to answer questions like: do any differences among them exist? If so, which of them entail this difference and in which portion of the domain? In order to pursue this goal, a nonparametric inferential technique known as Interval-Wise Testing procedure (IWT) is described and applied. This technique is able to detect in which portion of the domain there is a significant difference between groups of functions, which in this case are the scenarios and the climate models. Moreover, agglomerative clustering techniques are described and adjusted for this particular application. By defining a dissimilarity matrix between the climate models, the clustering is able to group them together in small clusters with similar behaviors in terms of functions or derivatives. Finally, the so called alluvial diagrams are considered with the aim to compare the clusters obtained by analyzing different climatic variables and different functional aspects.

Questo lavoro di tesi verte sull'applicazione di tecniche di analisi di dati funzionali ad un ampio insieme di dati che consiste di alcune tra le più recenti proiezioni climatiche a lungo periodo relative agli scenari climatici denominati RCP (Representative Concentration Pathways). Lo scopo del lavoro è quello di sperimentare una metodologia basata sull'analisi non parametrica di dati funzionali per analizzare le proiezioni climatiche attraverso le serie temporali ottenute mediando i dati delle simulazioni sulla superficie terrestre. In particolare, si sono analizzati i valori di temperatura dell'aria al suolo e di precipitazione. Di tali valori sono state considerate, per ogni elemento della serie temporale, sia le medie spaziali globali sulla superficie terrestre che le medie ottenute sulle tre fasce climatiche: tropicale, temperata e polare. L'applicazione riguarda i valori simulati nell'ambito del progetto di confronto di simulazioni climatiche CMPI5 per il periodo 2006-2100. I dati sono stati trattati con tecniche di smoothing e se ne è stimata e studiata sia la funzione che la derivata prima. Le domande a cui si vuole rispondere analizzando i possibili quattro scenari e i modelli climatici sono: esiste una differenza significativa tra questi? Se sì, quali mostrano questa evidenza e in quale parte del dominio? Per perseguire questo obiettivo viene descritta e utilizzata una tecnica inferenziale non parametrica nota come procedura di Interval-Wise Testing (IWT), che consente di determinare in quali intervalli del dominio esiste una differenza significativa tra gruppi di funzioni, che in questo caso sono gli scenari e i modelli climatici. In secondo luogo vengono descritte e utilizzate alcune tecniche di clustering agglomerativo, che consentono, avendo preventivamente definito un indice di dissimilarità tra i modelli climatici, di raggrupparli in cluster che presentano caratteristiche comuni per quanto riguarda la funzione o la derivata. Infine si è utilizzata la tecnica dei cosidetti diagrammi alluvionali per confrontare i cluster ottenuti studiando le diverse variabili climatiche e le diverse caratteristiche funzionali.

Statistical assessment of climate predictions by functional data analysis techniques

CASTELLINI, MATTEO
2016/2017

Abstract

This work focuses on the application of functional data analysis techniques on a large database including some of the last most important available climate projections of the so called Representative Concentration Pathways (RCP) scenarios. Firstly the scenarios and the climate models that simulate these projections are described. The goal is to test a methodology based on nonparametric functional data analysis for the analysis of climate projections through the time series obtained by averaging data on the global surface. In particular the global mean is analyzed and compared to the means of the three different climatic zones: tropical, temperate and polar. The application concerns the study of surface air temperature and precipitation in the time interval 2006-2100. Data have been processed with smoothing techniques and the smoothed functions and the first derivatives were estimated. The analysis of the four possible scenarios and of the available climate models allows to answer questions like: do any differences among them exist? If so, which of them entail this difference and in which portion of the domain? In order to pursue this goal, a nonparametric inferential technique known as Interval-Wise Testing procedure (IWT) is described and applied. This technique is able to detect in which portion of the domain there is a significant difference between groups of functions, which in this case are the scenarios and the climate models. Moreover, agglomerative clustering techniques are described and adjusted for this particular application. By defining a dissimilarity matrix between the climate models, the clustering is able to group them together in small clusters with similar behaviors in terms of functions or derivatives. Finally, the so called alluvial diagrams are considered with the aim to compare the clusters obtained by analyzing different climatic variables and different functional aspects.
BONAVENTURA, LUCA
PINI, ALESSIA
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2017
2016/2017
Questo lavoro di tesi verte sull'applicazione di tecniche di analisi di dati funzionali ad un ampio insieme di dati che consiste di alcune tra le più recenti proiezioni climatiche a lungo periodo relative agli scenari climatici denominati RCP (Representative Concentration Pathways). Lo scopo del lavoro è quello di sperimentare una metodologia basata sull'analisi non parametrica di dati funzionali per analizzare le proiezioni climatiche attraverso le serie temporali ottenute mediando i dati delle simulazioni sulla superficie terrestre. In particolare, si sono analizzati i valori di temperatura dell'aria al suolo e di precipitazione. Di tali valori sono state considerate, per ogni elemento della serie temporale, sia le medie spaziali globali sulla superficie terrestre che le medie ottenute sulle tre fasce climatiche: tropicale, temperata e polare. L'applicazione riguarda i valori simulati nell'ambito del progetto di confronto di simulazioni climatiche CMPI5 per il periodo 2006-2100. I dati sono stati trattati con tecniche di smoothing e se ne è stimata e studiata sia la funzione che la derivata prima. Le domande a cui si vuole rispondere analizzando i possibili quattro scenari e i modelli climatici sono: esiste una differenza significativa tra questi? Se sì, quali mostrano questa evidenza e in quale parte del dominio? Per perseguire questo obiettivo viene descritta e utilizzata una tecnica inferenziale non parametrica nota come procedura di Interval-Wise Testing (IWT), che consente di determinare in quali intervalli del dominio esiste una differenza significativa tra gruppi di funzioni, che in questo caso sono gli scenari e i modelli climatici. In secondo luogo vengono descritte e utilizzate alcune tecniche di clustering agglomerativo, che consentono, avendo preventivamente definito un indice di dissimilarità tra i modelli climatici, di raggrupparli in cluster che presentano caratteristiche comuni per quanto riguarda la funzione o la derivata. Infine si è utilizzata la tecnica dei cosidetti diagrammi alluvionali per confrontare i cluster ottenuti studiando le diverse variabili climatiche e le diverse caratteristiche funzionali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2017_12_Castellini.PDF

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 35.07 MB
Formato Adobe PDF
35.07 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/137335