Rapid advancement of machine learning make it possible to consider large amounts of data to learn from. In most of the implementations of reinforcement learning facing this type of data, approximation is obtained by neural networks and the process of drawing information from data is mediated by a short-term memory that stores the previous experiences for additional re-learning, to speed-up the learning process, mimicking what is done by people. In this work, we are proposing a range of novel computational approaches able to selectively filter the informational or cognitive load for the agent’s short-term memory, thus simulating the attention mechanism characteristic also of human perception. Using the proposed attention filter block architecture, we were able to devise a variety of frameworks of agent’s perception that are able to adapt to its environment by selecting the most suitable experiences. The adaptation also resulted in an emergence of different behavioural characteristics or traits among artificial learning agents.

Il rapido avanzamento dell'apprendimento automatico consente di prendere in considerazione grandi quantità di dati da cui imparare. Nella maggior parte delle implementazioni dell'apprendimento di rinforzo che affrontano questo tipo di dati, l'approssimazione è ottenuta dalle reti neurali e il processo di estrazione delle informazioni dai dati è mediato da una memoria a breve termine che memorizza le precedenti esperienze per un ulteriore re-apprendimento, per accelerare il processo di apprendimento, imitando ciò che viene fatto dalle persone. In questo lavoro, stiamo proponendo una serie di nuovi approcci computazionali in grado di filtrare selettivamente il carico informativo o cognitivo per la memoria a breve termine dell'agente, simulando così il meccanismo di attenzione caratteristico anche della percezione umana. Utilizzando l'architettura proposta, che include uno speciale filtro di attenzione, siamo stati in grado di ideare una varietà di strutture di percezione dell'agente che sono in grado di adattarsi al suo ambiente selezionando le esperienze più adatte. L'adattamento ha anche comportato l'emergere di diverse caratteristiche o tratti comportamentali tra gli agenti di apprendimento artificiale.

Perception as behaviour inducing mechanism: a reinforcement learning perspective

RAMICIC, MIRZA

Abstract

Rapid advancement of machine learning make it possible to consider large amounts of data to learn from. In most of the implementations of reinforcement learning facing this type of data, approximation is obtained by neural networks and the process of drawing information from data is mediated by a short-term memory that stores the previous experiences for additional re-learning, to speed-up the learning process, mimicking what is done by people. In this work, we are proposing a range of novel computational approaches able to selectively filter the informational or cognitive load for the agent’s short-term memory, thus simulating the attention mechanism characteristic also of human perception. Using the proposed attention filter block architecture, we were able to devise a variety of frameworks of agent’s perception that are able to adapt to its environment by selecting the most suitable experiences. The adaptation also resulted in an emergence of different behavioural characteristics or traits among artificial learning agents.
PERNICI, BARBARA
AMIGONI, FRANCESCO
18-feb-2019
Il rapido avanzamento dell'apprendimento automatico consente di prendere in considerazione grandi quantità di dati da cui imparare. Nella maggior parte delle implementazioni dell'apprendimento di rinforzo che affrontano questo tipo di dati, l'approssimazione è ottenuta dalle reti neurali e il processo di estrazione delle informazioni dai dati è mediato da una memoria a breve termine che memorizza le precedenti esperienze per un ulteriore re-apprendimento, per accelerare il processo di apprendimento, imitando ciò che viene fatto dalle persone. In questo lavoro, stiamo proponendo una serie di nuovi approcci computazionali in grado di filtrare selettivamente il carico informativo o cognitivo per la memoria a breve termine dell'agente, simulando così il meccanismo di attenzione caratteristico anche della percezione umana. Utilizzando l'architettura proposta, che include uno speciale filtro di attenzione, siamo stati in grado di ideare una varietà di strutture di percezione dell'agente che sono in grado di adattarsi al suo ambiente selezionando le esperienze più adatte. L'adattamento ha anche comportato l'emergere di diverse caratteristiche o tratti comportamentali tra gli agenti di apprendimento artificiale.
Tesi di dottorato
File allegati
File Dimensione Formato  
2019_02_PhD_Ramicic.pdf

Open Access dal 15/01/2020

Descrizione: Thesis text
Dimensione 12.15 MB
Formato Adobe PDF
12.15 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144993