Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.
La selezione delle variabili di ingresso è il primo, necessario passo di ogni esercizio di modellizzazione, in quanto una corretta scelta ne detta l'accuratezza nella simulazione dei sistemi. Nel campo dell'Idrologia e risorse idriche, l'idrologo deve frequentemente affrontare la sfida derivante dalla necessità di pre-elaborare una serie enorme di possibili input in un sistema idrologico. Un adeguato meccanismo di selezione degli input è di particolare importanza quando si analizzano ignote serie di ingressi con modelli basati sui dati. Questa tesi propone un percorso per la selezione delle variabili di ingresso basato su algoritmi ad albero. Il contributo principale della tesi è lo sviluppo di un nuovo schema iterativa ad albero per costruzione di graduatorie utili per la selezione delle appropriate variabili idrologiche per modelli empirici. Questo approccio è basato su una classificazione reiterata ad alberi estremamente randomizzati. Lo schema è stato testato sul sistema del Fiume Rosso in Viet Nam a supporto del modello di previsione degli afflussi al bacino di Hoa Binh e dei livelli idrici ad Ha Noi. I risultati di tali modelli sono stati altresì confrontati con le previsioni date da modelli concettuali.
Tree-based input selection for hydrological modelling. Case study: Red River system in Viet Nam
NGUYEN, VAN MANH
2009/2010
Abstract
Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.File | Dimensione | Formato | |
---|---|---|---|
2010_07_Nguyen_Van_Manh.PDF
accessibile in internet per tutti
Descrizione: Thesis text
Dimensione
6.45 MB
Formato
Adobe PDF
|
6.45 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/801