My thesis investigates the conversational interaction between humans and machines. It explores the differences between natural and artificial languages. It highlights the innate human ability to build conceptual representations from the conversation, examines why machines fail to do so and questions whether machines will ever be able to interact in natural language. I build an abstraction layer to uncover the unapparent structure of the conversation. Under this thesis point of view, every conversation admits a precise structure. I propose the conversation structure as a graph built from the syntactic dependency parsing that also carries the conversation semantics. It is possible to follow paths in the graph connecting the relevant concepts of the conversation together: the conversation structure reveals how the syntactic constructions yield the semantic interpretations. The goal of my thesis is to build an abstraction layer to characterize any conversation. In my thesis I investigate the bond between syntax and semantics in natural language. I generate an abstraction layer on top of the syntactic-semantic bond encapsulating the concepts from the conversation. The conversation is made up by pre-linguistically available “abstractions” (i.e. entities and relations). I investigate whether machines can understand the “abstractions” interpreted effortlessly by humans. The abstraction layer I propose defines the foundational characteristics of any conversation and is machine interpretable. The abstraction layer uncovers some of the reasons that cause a gap in the interaction between humans and machines. I review the extent of the conversational gap in natural language interaction. I propose a parallel with the uncanny valley theory from the robotics field. The uncanny valley expresses the affinity perceived by humans when interacting with robots. This thesis studies similar perceived affinities with conversational agents. I exploit the abstraction layer built from syntax to assess the uncanny valley in conversations. I inspect the part of speech - POS - tags dependencies and drive semantic relations from specific POS that are configurable as arguments of the service I build. As a result, I obtain a graph that constitutes a layer describing the semantic representations constructed through the conversational interaction. I borrow the notion of blueprint drawing from architecture. Since the abstraction layer represents the characteristics of the conversation, and the term blueprint conveys the specifications of an engineering/architectural plan, it is the fittest to convey the conversation plan. The blueprint emphasizes the nature of the layer of abstraction I build: an accurate, reproducible and technical specification of the conversation plan or the conversation structure. Since my blueprint of the conversation is a graph, I call the level of abstraction proposed by this thesis with the term graphprint. The graph- print is the main output of my work. I am able to analyze the conversation structure by means of graph theory. The graphprint encompasses both syntax and semantics of the natural language in one single abstraction layer. In summary, I capture the structure of a conversation into an interpretable level of abstraction: a graph. My thesis proposes the following contributions: 1. The graphrint generation: a conversational blueprint represent- ing the conversation semantics as it arises from syntactic de- pendencies. 2. The graphprint interpretation: it uncovers a layer that captures one possible origin for the uncanny valley in conversations. 3. The graphprint replication: it is deterministic, reproducible and inspectable by means of known graph algorithms. In conclusion, my thesis provides a tool that is configurable and useful to generate alternative representation of conversations under one point of view that depends both on syntax and semantics. This suggests a reconciliation between competence and performance explaining the rules of the language and the use of the language respectively. Both mechanisms should have evolved as a package: the construction of the graphprint provides a hint advocating for a symbiotic evolution of syntax together with semantics. The graphprint offers a deterministic approach to portray the conversation plan and reveals which plans signal the appearance of the uncanny valley in conversations.

La mia tesi indaga l'interazione conversazionale tra esseri umani e macchine. Esplora le differenze tra lingue naturali e artificiali. Mette in luce la capacità innata dell'uomo di costruire rappresentazioni concettuali dalla conversazione, esamina perché le macchine falliscano nel farlo e si interroga se le macchine saranno mai in grado di interagire in lingua naturale. Costruisco uno strato di astrazione per svelare la struttura non apparente della conversazione. Da questa prospettiva della tesi, ogni conversazione ammette una struttura precisa. Propongo la struttura della conversazione come un grafo costruito dalla sintassi delle dipendenze che porta anche la semantica della conversazione. È possibile seguire percorsi nel grafo che collegano i concetti rilevanti della conversazione tra loro: la struttura della conversazione rivela come le costruzioni sintattiche producano le interpretazioni semantiche. L'obiettivo della mia tesi è costruire uno strato di astrazione per caratterizzare qualsiasi conversazione. Nella mia tesi indago il legame tra sintassi e semantica nella lingua naturale. Genero uno strato di astrazione sopra il legame sintattico-semantico che racchiude i concetti della conversazione. La conversazione è composta da "astrazioni" disponibili pre-linguisticamente (cioè entità e relazioni). Indago se le macchine possono comprendere le "astrazioni" interpretate senza sforzo dagli esseri umani. Lo strato di astrazione che propongo definisce le caratteristiche fondamentali di qualsiasi conversazione ed è interpretabile dalle macchine. Lo strato di astrazione scopre alcune delle ragioni che causano un divario nell'interazione tra esseri umani e macchine. Esamino l'estensione del divario conversazionale nell'interazione in lingua naturale. Propongo un parallelismo con la teoria della "uncanny valley" nel campo della robotica. La valle inquietante esprime l'affinità percepita dagli esseri umani nell'interagire con i robot. Questa tesi studia simili affinità percepite con agenti conversazionali. Sfrutto lo strato di astrazione costruito dalla sintassi per valutare la valle inquietante nelle conversazioni. Esamino le dipendenze delle parti del discorso (POS) e ricavo relazioni semantiche da specifiche POS configurabili come argomenti del servizio che costruisco. Di conseguenza, ottengo un grafo che costituisce uno strato che descrive le rappresentazioni semantiche costruite attraverso l'interazione conversazionale. Prendo in prestito la nozione di "disegno del progetto", "planimetria" o "blueprint" dall'architettura. Poiché lo strato di astrazione rappresenta le caratteristiche della conversazione, e il termine "blueprint" comunica le specifiche di un piano ingegneristico/architettonico, è il più adatto per rappresentare il piano della conversazione. Il "blueprint" enfatizza la natura dello strato di astrazione che costruisco: una specifica accurata, riproducibile e tecnica del piano della conversazione o della struttura della conversazione. Poiché il mio "blueprint" della conversazione è un grafo, chiamo il livello di astrazione proposto da questa tesi con il termine "graphprint". Il "graphprint" è il principale risultato del mio lavoro. Sono in grado di analizzare la struttura della conversazione attraverso la teoria dei grafi. Il "graphprint" comprende sia la sintassi che la semantica della lingua naturale in uno strato di astrazione unico. In sintesi, catturo la struttura di una conversazione in un livello di astrazione interpretabile: un grafo. La mia tesi propone i seguenti contributi: 1. La generazione del "graphprint": una rappresentazione del piano conversazionale che rappresenta la semantica della conversazione come emerge dalle dipendenze sintattiche. 2. L'interpretazione del "graphprint": esso scopre uno strato che cattura una possibile origine della valle inquietante nelle conversazioni. 3. La replicazione del "graphprint": è deterministica, riproducibile e ispezionabile mediante noti algoritmi dei grafi. In conclusione, la mia tesi fornisce uno strumento configurabile e utile per generare una rappresentazione alternativa delle conversazioni da un punto di vista che dipende sia dalla sintassi che dalla semantica. Ciò suggerisce una conciliazione tra competenza e performance spiegando le regole della lingua e l'uso della lingua rispettivamente. Entrambi i meccanismi dovrebbero essere evoluti come un pacchetto: la costruzione del "graphprint" fornisce un suggerimento a favore di un'evoluzione simbiotica della sintassi insieme alla semantica. Il "graphprint" offre un approccio deterministico per rappresentare il piano della conversazione e rivela quali piani segnalino l'apparizione della "uncanny valley" nelle conversazioni.

Aurora : natural language sleeps in an uncanny valley of ambiguous semantic constructions

Occhiuto, Daniele
2022/2023

Abstract

My thesis investigates the conversational interaction between humans and machines. It explores the differences between natural and artificial languages. It highlights the innate human ability to build conceptual representations from the conversation, examines why machines fail to do so and questions whether machines will ever be able to interact in natural language. I build an abstraction layer to uncover the unapparent structure of the conversation. Under this thesis point of view, every conversation admits a precise structure. I propose the conversation structure as a graph built from the syntactic dependency parsing that also carries the conversation semantics. It is possible to follow paths in the graph connecting the relevant concepts of the conversation together: the conversation structure reveals how the syntactic constructions yield the semantic interpretations. The goal of my thesis is to build an abstraction layer to characterize any conversation. In my thesis I investigate the bond between syntax and semantics in natural language. I generate an abstraction layer on top of the syntactic-semantic bond encapsulating the concepts from the conversation. The conversation is made up by pre-linguistically available “abstractions” (i.e. entities and relations). I investigate whether machines can understand the “abstractions” interpreted effortlessly by humans. The abstraction layer I propose defines the foundational characteristics of any conversation and is machine interpretable. The abstraction layer uncovers some of the reasons that cause a gap in the interaction between humans and machines. I review the extent of the conversational gap in natural language interaction. I propose a parallel with the uncanny valley theory from the robotics field. The uncanny valley expresses the affinity perceived by humans when interacting with robots. This thesis studies similar perceived affinities with conversational agents. I exploit the abstraction layer built from syntax to assess the uncanny valley in conversations. I inspect the part of speech - POS - tags dependencies and drive semantic relations from specific POS that are configurable as arguments of the service I build. As a result, I obtain a graph that constitutes a layer describing the semantic representations constructed through the conversational interaction. I borrow the notion of blueprint drawing from architecture. Since the abstraction layer represents the characteristics of the conversation, and the term blueprint conveys the specifications of an engineering/architectural plan, it is the fittest to convey the conversation plan. The blueprint emphasizes the nature of the layer of abstraction I build: an accurate, reproducible and technical specification of the conversation plan or the conversation structure. Since my blueprint of the conversation is a graph, I call the level of abstraction proposed by this thesis with the term graphprint. The graph- print is the main output of my work. I am able to analyze the conversation structure by means of graph theory. The graphprint encompasses both syntax and semantics of the natural language in one single abstraction layer. In summary, I capture the structure of a conversation into an interpretable level of abstraction: a graph. My thesis proposes the following contributions: 1. The graphrint generation: a conversational blueprint represent- ing the conversation semantics as it arises from syntactic de- pendencies. 2. The graphprint interpretation: it uncovers a layer that captures one possible origin for the uncanny valley in conversations. 3. The graphprint replication: it is deterministic, reproducible and inspectable by means of known graph algorithms. In conclusion, my thesis provides a tool that is configurable and useful to generate alternative representation of conversations under one point of view that depends both on syntax and semantics. This suggests a reconciliation between competence and performance explaining the rules of the language and the use of the language respectively. Both mechanisms should have evolved as a package: the construction of the graphprint provides a hint advocating for a symbiotic evolution of syntax together with semantics. The graphprint offers a deterministic approach to portray the conversation plan and reveals which plans signal the appearance of the uncanny valley in conversations.
PIRODDI, LUIGI
CAPPIELLO, CINZIA
31-ott-2023
Aurora : natural language sleeps in an uncanny valley of ambiguous semantic constructions
La mia tesi indaga l'interazione conversazionale tra esseri umani e macchine. Esplora le differenze tra lingue naturali e artificiali. Mette in luce la capacità innata dell'uomo di costruire rappresentazioni concettuali dalla conversazione, esamina perché le macchine falliscano nel farlo e si interroga se le macchine saranno mai in grado di interagire in lingua naturale. Costruisco uno strato di astrazione per svelare la struttura non apparente della conversazione. Da questa prospettiva della tesi, ogni conversazione ammette una struttura precisa. Propongo la struttura della conversazione come un grafo costruito dalla sintassi delle dipendenze che porta anche la semantica della conversazione. È possibile seguire percorsi nel grafo che collegano i concetti rilevanti della conversazione tra loro: la struttura della conversazione rivela come le costruzioni sintattiche producano le interpretazioni semantiche. L'obiettivo della mia tesi è costruire uno strato di astrazione per caratterizzare qualsiasi conversazione. Nella mia tesi indago il legame tra sintassi e semantica nella lingua naturale. Genero uno strato di astrazione sopra il legame sintattico-semantico che racchiude i concetti della conversazione. La conversazione è composta da "astrazioni" disponibili pre-linguisticamente (cioè entità e relazioni). Indago se le macchine possono comprendere le "astrazioni" interpretate senza sforzo dagli esseri umani. Lo strato di astrazione che propongo definisce le caratteristiche fondamentali di qualsiasi conversazione ed è interpretabile dalle macchine. Lo strato di astrazione scopre alcune delle ragioni che causano un divario nell'interazione tra esseri umani e macchine. Esamino l'estensione del divario conversazionale nell'interazione in lingua naturale. Propongo un parallelismo con la teoria della "uncanny valley" nel campo della robotica. La valle inquietante esprime l'affinità percepita dagli esseri umani nell'interagire con i robot. Questa tesi studia simili affinità percepite con agenti conversazionali. Sfrutto lo strato di astrazione costruito dalla sintassi per valutare la valle inquietante nelle conversazioni. Esamino le dipendenze delle parti del discorso (POS) e ricavo relazioni semantiche da specifiche POS configurabili come argomenti del servizio che costruisco. Di conseguenza, ottengo un grafo che costituisce uno strato che descrive le rappresentazioni semantiche costruite attraverso l'interazione conversazionale. Prendo in prestito la nozione di "disegno del progetto", "planimetria" o "blueprint" dall'architettura. Poiché lo strato di astrazione rappresenta le caratteristiche della conversazione, e il termine "blueprint" comunica le specifiche di un piano ingegneristico/architettonico, è il più adatto per rappresentare il piano della conversazione. Il "blueprint" enfatizza la natura dello strato di astrazione che costruisco: una specifica accurata, riproducibile e tecnica del piano della conversazione o della struttura della conversazione. Poiché il mio "blueprint" della conversazione è un grafo, chiamo il livello di astrazione proposto da questa tesi con il termine "graphprint". Il "graphprint" è il principale risultato del mio lavoro. Sono in grado di analizzare la struttura della conversazione attraverso la teoria dei grafi. Il "graphprint" comprende sia la sintassi che la semantica della lingua naturale in uno strato di astrazione unico. In sintesi, catturo la struttura di una conversazione in un livello di astrazione interpretabile: un grafo. La mia tesi propone i seguenti contributi: 1. La generazione del "graphprint": una rappresentazione del piano conversazionale che rappresenta la semantica della conversazione come emerge dalle dipendenze sintattiche. 2. L'interpretazione del "graphprint": esso scopre uno strato che cattura una possibile origine della valle inquietante nelle conversazioni. 3. La replicazione del "graphprint": è deterministica, riproducibile e ispezionabile mediante noti algoritmi dei grafi. In conclusione, la mia tesi fornisce uno strumento configurabile e utile per generare una rappresentazione alternativa delle conversazioni da un punto di vista che dipende sia dalla sintassi che dalla semantica. Ciò suggerisce una conciliazione tra competenza e performance spiegando le regole della lingua e l'uso della lingua rispettivamente. Entrambi i meccanismi dovrebbero essere evoluti come un pacchetto: la costruzione del "graphprint" fornisce un suggerimento a favore di un'evoluzione simbiotica della sintassi insieme alla semantica. Il "graphprint" offre un approccio deterministico per rappresentare il piano della conversazione e rivela quali piani segnalino l'apparizione della "uncanny valley" nelle conversazioni.
File allegati
File Dimensione Formato  
2023_10_phd_occhiuto.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: phd_dissertation_occhiuto
Dimensione 65.25 MB
Formato Adobe PDF
65.25 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/212995