This thesis discusses a set of machine learning methods able to work in non-stationary environments, and provides practical applications for them. Standard machine learning methods are suitable to work in stationary environments but they often fail when this assumption is violated, which is the case in many real-world situations. Thus, the problem of non-stationarity is an important issue for practical applications of machine learning. The non-stationary situation considered in the thesis is covariate shift, where the training input points and test input points follow different probability distributions, but the conditional distribution of output values given input points is unchanged. The tool used to mitigate the influence of covariate shift is importance-weighting: weighting every training input point in accordance with its similarity to the test samples, in order to assign higher importance to the most pertinent samples. Importance-weighted methods are applied to two important real-world machine learning problems, which are prone to non-stationary phenomena: brain-computer interfaces and image analysis. The results obtained allow us to claim the effectiveness of importance-weighted methods in real-world applications.

Questa tesi discute un insieme di metodi di machine learning in grado di operare in ambienti non stazionari, e ne fornisce alcune applicazioni pratiche. I metodi standard di machine learning sono pensati per lavorare in condizioni stazionarie ma falliscono quando questa assunzione è violata, cosa che accade in molte situazioni reali. Il problema della non stazionarietà è perciò di rilievo in molte applicazioni pratiche di machine learning. La non stazionarietà considerata nella tesi è quella di covariate shift in cui i campioni di training e i campioni di test seguono diverse distribuzioni di probabilità, ma la distribuzione condizionata dei valori in output rispetto a quelli in input è invariata. Lo strumento utilizzato per mitigare l’influenza della covariate shift è l’importance-weighting: pesare ogni campione di training in accordo con la sua similarità rispetto ai campioni di test, in modo da attribuire maggiore importanza ai campioni più pertinenti. L’importance-weighting viene quindi applicata su due importanti problemi reali che sono soggetti a fenomeni non stazionari: brain-computer interfaces e image analysis. I risultati ottenuti ci permetto di affermare l’efficacia di questi metodi in applicazioni reali.

Importance weighted methods in real world applications

BALZI, ALESSANDRO
2014/2015

Abstract

This thesis discusses a set of machine learning methods able to work in non-stationary environments, and provides practical applications for them. Standard machine learning methods are suitable to work in stationary environments but they often fail when this assumption is violated, which is the case in many real-world situations. Thus, the problem of non-stationarity is an important issue for practical applications of machine learning. The non-stationary situation considered in the thesis is covariate shift, where the training input points and test input points follow different probability distributions, but the conditional distribution of output values given input points is unchanged. The tool used to mitigate the influence of covariate shift is importance-weighting: weighting every training input point in accordance with its similarity to the test samples, in order to assign higher importance to the most pertinent samples. Importance-weighted methods are applied to two important real-world machine learning problems, which are prone to non-stationary phenomena: brain-computer interfaces and image analysis. The results obtained allow us to claim the effectiveness of importance-weighted methods in real-world applications.
SUGIYAMA, MASASHI
YGER, FLORIAN
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2015
2014/2015
Questa tesi discute un insieme di metodi di machine learning in grado di operare in ambienti non stazionari, e ne fornisce alcune applicazioni pratiche. I metodi standard di machine learning sono pensati per lavorare in condizioni stazionarie ma falliscono quando questa assunzione è violata, cosa che accade in molte situazioni reali. Il problema della non stazionarietà è perciò di rilievo in molte applicazioni pratiche di machine learning. La non stazionarietà considerata nella tesi è quella di covariate shift in cui i campioni di training e i campioni di test seguono diverse distribuzioni di probabilità, ma la distribuzione condizionata dei valori in output rispetto a quelli in input è invariata. Lo strumento utilizzato per mitigare l’influenza della covariate shift è l’importance-weighting: pesare ogni campione di training in accordo con la sua similarità rispetto ai campioni di test, in modo da attribuire maggiore importanza ai campioni più pertinenti. L’importance-weighting viene quindi applicata su due importanti problemi reali che sono soggetti a fenomeni non stazionari: brain-computer interfaces e image analysis. I risultati ottenuti ci permetto di affermare l’efficacia di questi metodi in applicazioni reali.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2015_12_Balzi.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 6.64 MB
Formato Adobe PDF
6.64 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/115583