Active Preference Learning (APL) is an emerging optimization technique to solve problems in which the decision-maker cannot evaluate the objective function, but can only express a preference when comparing two decision vectors, such as “this is better than that”. The interest in APL methodology is motivated by applications within the field of control parameters calibration, which is indisputably considered a critical subproblem of control systems design. In order to find the best value for the parameters vector, classical calibration methods usually optimize a predefined performance index, based on prior knowledge. However, there exist many practical situations where a mathematical comprehensive description of what is “the best” appears elusive since tightly linked with the human perception, hardly quantifiable. A new model-free approach, with APL at its core and the human playing the key role of decision-maker, is proposed to tackle those calibration problems with unknown objective function: the algorithm drives a trial-and-error experimental procedure so as to converge to the best preference calibration (i.e. the preferred one among all decision vectors) within the least number of preference queries. This master thesis dissertation bridges the gap from theory to practice and experimentally assesses the effectiveness of APL for comfort-oriented suspension calibration of road vehicles via a bump test scenario. The results are also validated by learning from data a user-tailored preference-based performance index, which reconstructs, a-posteriori, the latent objective function.

Active Preference Learning (APL) è un’emergente tecnica di ottimizzazione per risolvere problemi in cui il decisore non può valutare la funzione obiettivo, ma può solamente esprimere una preferenza, del tipo “A è meglio di B”. L’interesse per la metodologia APL è motivato da applicazioni nel campo della calibrazione dei parametri di controllo, la quale è indiscutibilmente considerata un cruciale sottoproblema nella progettazione di sistemi di controllo. Al fine di trovare il migliore valore per i parametri, i classici metodi di calibrazione ottimizzano un predeterminato indice di performance, basato su conoscenza a priori. Tuttavia, esistono molte situazioni pratiche in cui una descrizione matematica completa di cosa sia “il migliore” appare sfuggente perché collegata strettamente alla percezione umana, difficilmente quantificabile. Un nuovo approccio model-free, basato su APL e con l’individuo umano nel ruolo chiave di decisore, è proposto per affrontare quei problemi di calibrazione con funzione obiettivo non nota: l’algoritmo guida una procedura sperimentale di tipo trial-and-error in modo tale da convergere alla migliore calibrazione per preferenza (cioè quella preferita fra tutte) nel minor numero di interrogazioni dell’utente. Questo elaborato di tesi magistrale chiude il gap tra teoria e pratica e valuta sperimentalmente l’efficacia di APL per la taratura comfort-oriented di sospensioni nei veicoli stradali per lo scenario di superamento di un dosso. I risultati sono inoltre validati tramite l’apprendimento dai dati di un indice di performance basato sulle preferenze soggettive dell’utente, il quale indice ricostruisce, a posteriori, la funzione obiettivo latente.

Active preference learning for automotive suspension calibration

DUBBINI, ALBERTO
2019/2020

Abstract

Active Preference Learning (APL) is an emerging optimization technique to solve problems in which the decision-maker cannot evaluate the objective function, but can only express a preference when comparing two decision vectors, such as “this is better than that”. The interest in APL methodology is motivated by applications within the field of control parameters calibration, which is indisputably considered a critical subproblem of control systems design. In order to find the best value for the parameters vector, classical calibration methods usually optimize a predefined performance index, based on prior knowledge. However, there exist many practical situations where a mathematical comprehensive description of what is “the best” appears elusive since tightly linked with the human perception, hardly quantifiable. A new model-free approach, with APL at its core and the human playing the key role of decision-maker, is proposed to tackle those calibration problems with unknown objective function: the algorithm drives a trial-and-error experimental procedure so as to converge to the best preference calibration (i.e. the preferred one among all decision vectors) within the least number of preference queries. This master thesis dissertation bridges the gap from theory to practice and experimentally assesses the effectiveness of APL for comfort-oriented suspension calibration of road vehicles via a bump test scenario. The results are also validated by learning from data a user-tailored preference-based performance index, which reconstructs, a-posteriori, the latent objective function.
CATENARO, EDOARDO
CORNO, MATTEO
SAVARESI, SERGIO MATTEO
ING - Scuola di Ingegneria Industriale e dell'Informazione
28-apr-2021
2019/2020
Active Preference Learning (APL) è un’emergente tecnica di ottimizzazione per risolvere problemi in cui il decisore non può valutare la funzione obiettivo, ma può solamente esprimere una preferenza, del tipo “A è meglio di B”. L’interesse per la metodologia APL è motivato da applicazioni nel campo della calibrazione dei parametri di controllo, la quale è indiscutibilmente considerata un cruciale sottoproblema nella progettazione di sistemi di controllo. Al fine di trovare il migliore valore per i parametri, i classici metodi di calibrazione ottimizzano un predeterminato indice di performance, basato su conoscenza a priori. Tuttavia, esistono molte situazioni pratiche in cui una descrizione matematica completa di cosa sia “il migliore” appare sfuggente perché collegata strettamente alla percezione umana, difficilmente quantificabile. Un nuovo approccio model-free, basato su APL e con l’individuo umano nel ruolo chiave di decisore, è proposto per affrontare quei problemi di calibrazione con funzione obiettivo non nota: l’algoritmo guida una procedura sperimentale di tipo trial-and-error in modo tale da convergere alla migliore calibrazione per preferenza (cioè quella preferita fra tutte) nel minor numero di interrogazioni dell’utente. Questo elaborato di tesi magistrale chiude il gap tra teoria e pratica e valuta sperimentalmente l’efficacia di APL per la taratura comfort-oriented di sospensioni nei veicoli stradali per lo scenario di superamento di un dosso. I risultati sono inoltre validati tramite l’apprendimento dai dati di un indice di performance basato sulle preferenze soggettive dell’utente, il quale indice ricostruisce, a posteriori, la funzione obiettivo latente.
File allegati
File Dimensione Formato  
[Dubbini]APL_for_automotive_suspension_calibration.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Versione completa
Dimensione 27.85 MB
Formato Adobe PDF
27.85 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/175911