Tree-based input selection for hydrological modelling. Case study: Red River system in Viet Nam

Biblioteche e Archivi
POLITesi - Archivio digitale delle tesi di laurea e di dottorato

Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.

La selezione delle variabili di ingresso è il primo, necessario passo di ogni esercizio di modellizzazione, in quanto una corretta scelta ne detta l'accuratezza nella simulazione dei sistemi. Nel campo dell'Idrologia e risorse idriche, l'idrologo deve frequentemente affrontare la sfida derivante dalla necessità di pre-elaborare una serie enorme di possibili input in un sistema idrologico. Un adeguato meccanismo di selezione degli input è di particolare importanza quando si analizzano ignote serie di ingressi con modelli basati sui dati. Questa tesi propone un percorso per la selezione delle variabili di ingresso basato su algoritmi ad albero. Il contributo principale della tesi è lo sviluppo di un nuovo schema iterativa ad albero per costruzione di graduatorie utili per la selezione delle appropriate variabili idrologiche per modelli empirici. Questo approccio è basato su una classificazione reiterata ad alberi estremamente randomizzati. Lo schema è stato testato sul sistema del Fiume Rosso in Viet Nam a supporto del modello di previsione degli afflussi al bacino di Hoa Binh e dei livelli idrici ad Ha Noi. I risultati di tali modelli sono stati altresì confrontati con le previsioni date da modelli concettuali.

Tree-based input selection for hydrological modelling. Case study: Red River system in Viet Nam

NGUYEN, VAN MANH

2009/2010

Abstract

Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.

Scheda breve

Scheda completa

	Relatore
	
				CASTELLETTI, ANDREA FRANCESCO
			
	Correlatore/i
	
				QUACH, THI XUAN
SONCINI SESSA, RODOLFO
			
	Scuola / Dip.
	
				ING I - Facolta' di Ingegneria Civile, Ambientale e Territoriale
			
	Data
	
				21-lug-2010
			
	Anno accademico
	
				2009/2010
			
	Abstract in italiano
	
				La selezione delle variabili di ingresso è il primo, necessario passo di ogni esercizio di modellizzazione, in quanto una corretta scelta ne detta l'accuratezza nella simulazione dei sistemi. 
Nel campo dell'Idrologia e risorse idriche, l'idrologo deve frequentemente affrontare la sfida derivante dalla necessità di pre-elaborare una serie enorme di possibili input in un sistema idrologico. Un adeguato meccanismo di selezione degli input è di particolare importanza quando si analizzano ignote serie di ingressi con modelli basati sui dati.
Questa tesi propone un percorso per la selezione delle variabili di ingresso basato su algoritmi ad albero.

Il contributo principale della tesi è lo sviluppo di un nuovo schema  iterativa ad albero per costruzione di graduatorie utili per la selezione delle appropriate variabili idrologiche per modelli empirici.
Questo approccio è basato su una classificazione reiterata ad alberi estremamente randomizzati.
Lo schema è stato testato sul sistema del Fiume Rosso in Viet Nam a supporto del modello di previsione degli afflussi al bacino di Hoa Binh e dei livelli idrici ad Ha Noi.
I risultati di tali modelli sono stati altresì confrontati con le previsioni date da modelli concettuali.
			
	Tipo di documento
	
				Tesi di laurea Magistrale
			
	Appare nelle tipologie:
	
				Tesi di laurea Magistrale

File allegati

File	Dimensione	Formato
2010_07_Nguyen_Van_Manh.PDF accessibile in internet per tutti Descrizione: Thesis text Dimensione 6.45 MB Formato Adobe PDF Visualizza/Apri	6.45 MB	Adobe PDF	Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/801