Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.

La selezione delle variabili di ingresso è il primo, necessario passo di ogni esercizio di modellizzazione, in quanto una corretta scelta ne detta l'accuratezza nella simulazione dei sistemi. Nel campo dell'Idrologia e risorse idriche, l'idrologo deve frequentemente affrontare la sfida derivante dalla necessità di pre-elaborare una serie enorme di possibili input in un sistema idrologico. Un adeguato meccanismo di selezione degli input è di particolare importanza quando si analizzano ignote serie di ingressi con modelli basati sui dati. Questa tesi propone un percorso per la selezione delle variabili di ingresso basato su algoritmi ad albero. Il contributo principale della tesi è lo sviluppo di un nuovo schema iterativa ad albero per costruzione di graduatorie utili per la selezione delle appropriate variabili idrologiche per modelli empirici. Questo approccio è basato su una classificazione reiterata ad alberi estremamente randomizzati. Lo schema è stato testato sul sistema del Fiume Rosso in Viet Nam a supporto del modello di previsione degli afflussi al bacino di Hoa Binh e dei livelli idrici ad Ha Noi. I risultati di tali modelli sono stati altresì confrontati con le previsioni date da modelli concettuali.

Tree-based input selection for hydrological modelling. Case study: Red River system in Viet Nam

NGUYEN, VAN MANH
2009/2010

Abstract

Input variable selection is an initial, necessary step of any modeling exercise and a proper selection dictates the modeling accuracy of systems. In the hydrology and water resources arena, a hydrologist is often faced with the challenge of preprocessing a huge set of possible inputs into a hydrological system. A proper input selection mechanism is of particular importance when dealing with data-driven models with unknown sets of inputs. The thesis proposes an avenue for input variable selection, taking advantage of tree-based algorithms. The main contribution of the thesis is the development of a new reiterated tree-based ranking application to hydrological variable selection for empirical models. This approach is based on a reiterated tree-based ranking uses Extremely randomized trees. The approach is tested on the Red River System in Viet Nam to support prediction models of inflow to Hoa Binh reservoir and prediction models of water level in Ha Noi. The results of those models are also compared with conceptual models.
QUACH, THI XUAN
SONCINI SESSA, RODOLFO
ING I - Facolta' di Ingegneria Civile, Ambientale e Territoriale
21-lug-2010
2009/2010
La selezione delle variabili di ingresso è il primo, necessario passo di ogni esercizio di modellizzazione, in quanto una corretta scelta ne detta l'accuratezza nella simulazione dei sistemi. Nel campo dell'Idrologia e risorse idriche, l'idrologo deve frequentemente affrontare la sfida derivante dalla necessità di pre-elaborare una serie enorme di possibili input in un sistema idrologico. Un adeguato meccanismo di selezione degli input è di particolare importanza quando si analizzano ignote serie di ingressi con modelli basati sui dati. Questa tesi propone un percorso per la selezione delle variabili di ingresso basato su algoritmi ad albero. Il contributo principale della tesi è lo sviluppo di un nuovo schema iterativa ad albero per costruzione di graduatorie utili per la selezione delle appropriate variabili idrologiche per modelli empirici. Questo approccio è basato su una classificazione reiterata ad alberi estremamente randomizzati. Lo schema è stato testato sul sistema del Fiume Rosso in Viet Nam a supporto del modello di previsione degli afflussi al bacino di Hoa Binh e dei livelli idrici ad Ha Noi. I risultati di tali modelli sono stati altresì confrontati con le previsioni date da modelli concettuali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2010_07_Nguyen_Van_Manh.PDF

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 6.45 MB
Formato Adobe PDF
6.45 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/801