In the modelling of natural phenomena, it is inevitable to have a certain level of uncertainty. In fact, it is difficult both to have the certainty that a model truly describes the real physics behind the problem and to have reliable data available for the construction of the model itself. The quantification of uncertainty is therefore a subject of great importance, in particular for groundwater problems where, given the great heterogeneity of hydrogeological systems, the fundamental equations are stochastic and scale dependent. This work fits into the context of uncertainty quantification for subsurface flow models and, specifically, we use Information Theory to analyse the Upscaling process of the flow problem in heterogeneous porous media. The study is done on synthetic cases and the analysed variables are: the model input Y(x,y), a zero-mean second-order stationary random variable through which the conductivity field is derived, and the model output, that is the velocity field obtained by solving the flow problem. The purpose of the Thesis is to assess an Information Theory-based methodology that allows i) to quantify the information content of different scales ii) to investigate how much information we lose and retain through Upscaling iii) to analyse possible changes in the spatial structure of the flow field at different resolution scales. To answer the first two points, we have used elements of Information Theory, like entropy and multivariate mutual information. While the variations of the flow field structure were studied by analysing different metrics related to mutual information and covariance of pairs of points sampled at increasing spatial lags. The metrics were computed for all the points of each scale to observe eventual changes caused by the Upscaling process. The use of Information Theory allows to find answers to the previously listed points; moreover, we have observed the existence of i) a linear relationship between the reduction of information contained in the Y-fields and the corresponding velocity fields by changing the resolution scales ii) a significant growth, caused by Upscaling, of linear relationships (quantified by the Pearson correlation coefficient) between data distant few correlation scales. It has also been observed that, for the same lags, the metrics identifying a linear dependence overestimate this dependence compared to what is evidenced by metrics derived from Information Theory (e.g. Uncertainty coefficient), which also detect non-linear relations.

Nella modellazione dei fenomeni naturali è inevitabile avere un certo livello di incertezza. Infatti, è difficile sia avere la sicurezza che un modello descriva la reale fisica del problema, sia avere a disposizione dati affidabili per la costruzione del modello stesso. La quantificazione dell’incertezza è dunque una tematica di grande importanza, in particolare per lo studio dei flussi sotterranei dove, vista la grande eterogeneità dei sistemi idrogeologici, le equazioni fondamentali sono stocastiche e legate alla scala di risoluzione. Questo lavoro si inserisce nel contesto di quantificazione dell'incertezza per modelli di flusso e, nello specifico, viene utilizzata la Teoria dell’Informazione per analizzare il processo di Upscaling del problema del flusso in mezzi eterogenei. Lo studio viene fatto su casi sintetici e le variabili analizzate sono: l'input del modello Y(x,y), una variabile casuale con media nulla attraverso la quale viene ricavato il campo di conducibilità idraulica, e l'output del modello, ovvero il campo di velocità ottenuto risolvendo il problema del flusso. L'obiettivo della Tesi è quello di stabilire una metodologia che permetta di i) quantificare l'informazione contenuta in diverse scale di risoluzione, ii) investigare quanta informazione viene persa e conservata durante l’Upscaling, iii) analizzare le eventuali variazioni della struttura spaziale del campo di flusso dovute al processo di Upscaling. Per rispondere ai primi due punti vengono applicati concetti della Teoria dell'Informazione, come l'entropia e l'informazione mutua multivariata. Mentre la conservazione della struttura del campo di flusso è stata studiata analizzando diverse metriche relative all'informazione mutua ed alla covarianza di coppie di punti separati da crescenti lag spaziali. Le metriche sono state calcolate per tutti i punti di ogni scala per osservare eventuali cambiamenti causati dal processo di Upscaling. L'utilizzo della Teoria dell'Informazione permette di trovare risposte ai punti precedentemente elencati; inoltre, abbiamo osservato l'esistenza di i) una relazione lineare tra la riduzione di informazione contenuta nei campi Y(x,y) e nei relativi campi di velocità passando a scale di risoluzione minori, ii) una sostanziale crescita, causata dall’Upscaling, della relazione lineare (quantificata attraverso l’indice di Pearson) tra punti distanti poche scale di correlazione. È stato anche osservato che, per uguali lag, le metriche che identificano una dipendenza lineare sovrastimano questa dipendenza rispetto a quanto evidenziato da metriche derivate dalla Teoria dell'Informazione (p.e. coefficiente di incertezza), le quali considerano anche relazioni non lineari.

Upscaling of flow in heterogeneous porous media : an information theory perspective

MOLTENI, FRANCESCO
2018/2019

Abstract

In the modelling of natural phenomena, it is inevitable to have a certain level of uncertainty. In fact, it is difficult both to have the certainty that a model truly describes the real physics behind the problem and to have reliable data available for the construction of the model itself. The quantification of uncertainty is therefore a subject of great importance, in particular for groundwater problems where, given the great heterogeneity of hydrogeological systems, the fundamental equations are stochastic and scale dependent. This work fits into the context of uncertainty quantification for subsurface flow models and, specifically, we use Information Theory to analyse the Upscaling process of the flow problem in heterogeneous porous media. The study is done on synthetic cases and the analysed variables are: the model input Y(x,y), a zero-mean second-order stationary random variable through which the conductivity field is derived, and the model output, that is the velocity field obtained by solving the flow problem. The purpose of the Thesis is to assess an Information Theory-based methodology that allows i) to quantify the information content of different scales ii) to investigate how much information we lose and retain through Upscaling iii) to analyse possible changes in the spatial structure of the flow field at different resolution scales. To answer the first two points, we have used elements of Information Theory, like entropy and multivariate mutual information. While the variations of the flow field structure were studied by analysing different metrics related to mutual information and covariance of pairs of points sampled at increasing spatial lags. The metrics were computed for all the points of each scale to observe eventual changes caused by the Upscaling process. The use of Information Theory allows to find answers to the previously listed points; moreover, we have observed the existence of i) a linear relationship between the reduction of information contained in the Y-fields and the corresponding velocity fields by changing the resolution scales ii) a significant growth, caused by Upscaling, of linear relationships (quantified by the Pearson correlation coefficient) between data distant few correlation scales. It has also been observed that, for the same lags, the metrics identifying a linear dependence overestimate this dependence compared to what is evidenced by metrics derived from Information Theory (e.g. Uncertainty coefficient), which also detect non-linear relations.
DELL'OCA, ARONNE
ING - Scuola di Ingegneria Industriale e dell'Informazione
25-lug-2019
2018/2019
Nella modellazione dei fenomeni naturali è inevitabile avere un certo livello di incertezza. Infatti, è difficile sia avere la sicurezza che un modello descriva la reale fisica del problema, sia avere a disposizione dati affidabili per la costruzione del modello stesso. La quantificazione dell’incertezza è dunque una tematica di grande importanza, in particolare per lo studio dei flussi sotterranei dove, vista la grande eterogeneità dei sistemi idrogeologici, le equazioni fondamentali sono stocastiche e legate alla scala di risoluzione. Questo lavoro si inserisce nel contesto di quantificazione dell'incertezza per modelli di flusso e, nello specifico, viene utilizzata la Teoria dell’Informazione per analizzare il processo di Upscaling del problema del flusso in mezzi eterogenei. Lo studio viene fatto su casi sintetici e le variabili analizzate sono: l'input del modello Y(x,y), una variabile casuale con media nulla attraverso la quale viene ricavato il campo di conducibilità idraulica, e l'output del modello, ovvero il campo di velocità ottenuto risolvendo il problema del flusso. L'obiettivo della Tesi è quello di stabilire una metodologia che permetta di i) quantificare l'informazione contenuta in diverse scale di risoluzione, ii) investigare quanta informazione viene persa e conservata durante l’Upscaling, iii) analizzare le eventuali variazioni della struttura spaziale del campo di flusso dovute al processo di Upscaling. Per rispondere ai primi due punti vengono applicati concetti della Teoria dell'Informazione, come l'entropia e l'informazione mutua multivariata. Mentre la conservazione della struttura del campo di flusso è stata studiata analizzando diverse metriche relative all'informazione mutua ed alla covarianza di coppie di punti separati da crescenti lag spaziali. Le metriche sono state calcolate per tutti i punti di ogni scala per osservare eventuali cambiamenti causati dal processo di Upscaling. L'utilizzo della Teoria dell'Informazione permette di trovare risposte ai punti precedentemente elencati; inoltre, abbiamo osservato l'esistenza di i) una relazione lineare tra la riduzione di informazione contenuta nei campi Y(x,y) e nei relativi campi di velocità passando a scale di risoluzione minori, ii) una sostanziale crescita, causata dall’Upscaling, della relazione lineare (quantificata attraverso l’indice di Pearson) tra punti distanti poche scale di correlazione. È stato anche osservato che, per uguali lag, le metriche che identificano una dipendenza lineare sovrastimano questa dipendenza rispetto a quanto evidenziato da metriche derivate dalla Teoria dell'Informazione (p.e. coefficiente di incertezza), le quali considerano anche relazioni non lineari.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_07_MOLTENI.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Testo della tesi
Dimensione 7.45 MB
Formato Adobe PDF
7.45 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/148835