This master thesis aims at conducting a vertical research on computer vision, an interdisciplinary field that is being disrupted by Artificial Intelligence and its techniques. The work starts by reviewing the literature, with the dual objective of clarifying the computer vision concept, providing an overview of the many tasks that state-of-the-art computer vision systems perform as well as presenting their technical foundations. Specifically, a focus will be placed on deep learning, a subset of machine learning that is revolutionizing the paradigm through which computer vision is being applied, as well as its visual intelligence and performance, now closer to those of humans. After having reviewed the literature, some logical dependencies existing between computer vision tasks are highlighted, as to provide them with a hierarchical representation. Subsequently, an interpretative framework is elaborated with the objective of setting a schema able to cluster the many tasks inside computer vision, as to best highlight their differences and similarities between each other’s. The thesis then turns to the market, aimed at investigating the computer vision adoption by companies at an international scale. Specifically, the scenario analysis involves the collection of 85 cases where companies, supported by technology providers, embed computer vision in their organizations, processes and products/services. The results are then analyzed in terms of adoption over time, most impacted industries, most popular application fields and computer vision systems’ capabilities, widespread benefits for companies as well as technology providers involved.

In questa tesi viene condotta una ricerca verticale sulla computer vision, un campo di ricerca interdisciplinare che è fortemente influenzato dall’ascesa dell’Intelligenza Artificiale e dalle sue tecniche sottostanti. In primis, si effettua un’analisi della letteratura volta al duplice obiettivo di fare chiarezza sulla terminologia, presentare i principali task che moderni sistemi di computer vision effettuano, assieme alle tecniche che ne stanno alla base. In particolar modo, un’intera sezione viene dedicata al deep learning, una sottocategoria del machine learning che sta rivoluzionando il paradigma di attuazione della computer vision, i risultati che si possono ottenere e il tipo di intelligenza che si riesce a replicare, ormai vicina a quella degli umani. Successivamente, alcune dipendenze logiche che coinvolgono i vari task vengono identificate ed organizzate in uno schema gerarchico. In seguito, un framework interpretativo viene proposto con l’obiettivo di organizzare vari concetti chiave che emergono dalla letteratura, in modo da proporre una segmentazione dei computer vision tasks in grado di evidenziare le loro differenze e punti in comune. Successivamente, lo sguardo viene volto al mercato, con l’obiettivo di analizzare l’adozione della computer vision da parte di aziende, su scala internazionale. In particolar modo, si procede alla raccolta di 85 casi in cui partner tecnologici supportano le aziende nell’implementazione di soluzioni di computer vision nella catena del valore interna e/o value proposition. I risultati della ricerca vengono infine analizzati lungo diverse dimensioni, tra cui l’adozione nel tempo, i settori maggiormente influenzati, i campi applicativi più comuni, i task maggiormente attuati, i maggiori benefici che seguono l’adozione della computer vision e le tipologie di provider tecnologici coinvolti.

Artificial intelligence for computer vision : an interpretative framework and a scenario analysis

MOGGIA, MASSIMILIANO
2018/2019

Abstract

This master thesis aims at conducting a vertical research on computer vision, an interdisciplinary field that is being disrupted by Artificial Intelligence and its techniques. The work starts by reviewing the literature, with the dual objective of clarifying the computer vision concept, providing an overview of the many tasks that state-of-the-art computer vision systems perform as well as presenting their technical foundations. Specifically, a focus will be placed on deep learning, a subset of machine learning that is revolutionizing the paradigm through which computer vision is being applied, as well as its visual intelligence and performance, now closer to those of humans. After having reviewed the literature, some logical dependencies existing between computer vision tasks are highlighted, as to provide them with a hierarchical representation. Subsequently, an interpretative framework is elaborated with the objective of setting a schema able to cluster the many tasks inside computer vision, as to best highlight their differences and similarities between each other’s. The thesis then turns to the market, aimed at investigating the computer vision adoption by companies at an international scale. Specifically, the scenario analysis involves the collection of 85 cases where companies, supported by technology providers, embed computer vision in their organizations, processes and products/services. The results are then analyzed in terms of adoption over time, most impacted industries, most popular application fields and computer vision systems’ capabilities, widespread benefits for companies as well as technology providers involved.
GARAVAGLIA, STEFANO
LECCARDI, FILIPPO
NEGRI, CARLO
ING - Scuola di Ingegneria Industriale e dell'Informazione
18-dic-2019
2018/2019
In questa tesi viene condotta una ricerca verticale sulla computer vision, un campo di ricerca interdisciplinare che è fortemente influenzato dall’ascesa dell’Intelligenza Artificiale e dalle sue tecniche sottostanti. In primis, si effettua un’analisi della letteratura volta al duplice obiettivo di fare chiarezza sulla terminologia, presentare i principali task che moderni sistemi di computer vision effettuano, assieme alle tecniche che ne stanno alla base. In particolar modo, un’intera sezione viene dedicata al deep learning, una sottocategoria del machine learning che sta rivoluzionando il paradigma di attuazione della computer vision, i risultati che si possono ottenere e il tipo di intelligenza che si riesce a replicare, ormai vicina a quella degli umani. Successivamente, alcune dipendenze logiche che coinvolgono i vari task vengono identificate ed organizzate in uno schema gerarchico. In seguito, un framework interpretativo viene proposto con l’obiettivo di organizzare vari concetti chiave che emergono dalla letteratura, in modo da proporre una segmentazione dei computer vision tasks in grado di evidenziare le loro differenze e punti in comune. Successivamente, lo sguardo viene volto al mercato, con l’obiettivo di analizzare l’adozione della computer vision da parte di aziende, su scala internazionale. In particolar modo, si procede alla raccolta di 85 casi in cui partner tecnologici supportano le aziende nell’implementazione di soluzioni di computer vision nella catena del valore interna e/o value proposition. I risultati della ricerca vengono infine analizzati lungo diverse dimensioni, tra cui l’adozione nel tempo, i settori maggiormente influenzati, i campi applicativi più comuni, i task maggiormente attuati, i maggiori benefici che seguono l’adozione della computer vision e le tipologie di provider tecnologici coinvolti.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2019_12_Moggia.pdf

solo utenti autorizzati dal 10/12/2020

Descrizione: Testo della tesi
Dimensione 2.33 MB
Formato Adobe PDF
2.33 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/152717