Natural Language Processing (NLP) is one of the most important academic domains where Artificial Intelligence (AI) has shown significant growth in recent years and which has represented, from a business point of view, a remarkable opportunity for companies and entrepreneurs. The most significant developments in NLP have just occurred in the recent few decades, as a result of the development of sophisticated methodologies and the expansion of computing power; therefore, the field is still relatively undeveloped and, for this reason, really attractive for practitioners. Thus, the first part of this thesis has as its objective to provide the reader with a concise overview of the key NLP technological components, reviewing the main literature on the topic. After having set the theoretical basis that will lead the reader to fully understand the subject, the focus will be shifted to the business aspects and implications that NLP has on organizations, and particularly on startups, real protagonists in such an innovative field. In fact, the main scope of the work is to analyze their offer and business models, to find out the main tendencies in the market and discover if they are in line with the main current literature on the topic. In order to do that, data were collected from Crunchbase and startups were manually classified through the taxonomy offered by Weber et al. (2022). Then, on this dataset, I tried to investigate the most relevant business model variables in determining the “attractiveness” of a startup (measured in the amount of funding it received through its lifecycle), by clustering the data in three funding categories that were also analyzed through a classification algorithm. Finally, the results were summarized in a framework that offers a snapshot of the 2022 market situation and that, at the same time, set the basis for further future research.

Il Natural Language Processing (NLP) è uno degli ambiti accademici più importanti in cui l'Intelligenza Artificiale (IA) ha mostrato una crescita significativa negli ultimi anni e che ha rappresentato, dal punto di vista del business, una notevole opportunità per aziende e imprenditori. Gli sviluppi più significativi del NLP si sono verificati negli ultimi decenni, come risultato dello sviluppo di algoritmi sofisticati e dell'espansione della potenza di calcolo; perciò, il campo è ancora relativamente poco sviluppato e, per questo motivo, molto attraente per i professionisti del settore. Pertanto, la prima parte di questa tesi ha come obiettivo quello di fornire al lettore una panoramica sintetica delle componenti chiave della tecnologia NLP, rivedendo la principale letteratura sul tema. Dopo aver posto le basi teoriche che porteranno il lettore a comprendere appieno l'argomento, il focus sarà spostato sugli aspetti e le implicazioni di business che il NLP ha sulle organizzazioni, e in particolare sulle startup, vere protagoniste in un campo così innovativo. Scopo principale del lavoro, infatti, è analizzare la loro offerta e i modelli di business, scoprire le principali tendenze del mercato e verificare se sono in linea con la principale letteratura. Per fare ciò, i dati sono stati raccolti da Crunchbase e le startup sono state classificate manualmente attraverso la tassonomia offerta da Weber et al. (2022). Quindi, su questo dataset ho cercato di indagare le variabili di modello di business più rilevanti per determinare l'attrattività di una startup (misurata dall'importo dei finanziamenti ricevuti durante il suo ciclo di vita), raggruppando i dati in tre categorie di finanziamento analizzate attraverso un algoritmo di classificazione. Infine, i risultati sono stati riassunti in un modello che offre un’instantanea della situazione del mercato nel 2022 e che, contemporaneamente, pone le basi per ulteriori ricerche.

Natural language processing startups : analysis of the main business model trends

MUSCIA, ALESSANDRO
2021/2022

Abstract

Natural Language Processing (NLP) is one of the most important academic domains where Artificial Intelligence (AI) has shown significant growth in recent years and which has represented, from a business point of view, a remarkable opportunity for companies and entrepreneurs. The most significant developments in NLP have just occurred in the recent few decades, as a result of the development of sophisticated methodologies and the expansion of computing power; therefore, the field is still relatively undeveloped and, for this reason, really attractive for practitioners. Thus, the first part of this thesis has as its objective to provide the reader with a concise overview of the key NLP technological components, reviewing the main literature on the topic. After having set the theoretical basis that will lead the reader to fully understand the subject, the focus will be shifted to the business aspects and implications that NLP has on organizations, and particularly on startups, real protagonists in such an innovative field. In fact, the main scope of the work is to analyze their offer and business models, to find out the main tendencies in the market and discover if they are in line with the main current literature on the topic. In order to do that, data were collected from Crunchbase and startups were manually classified through the taxonomy offered by Weber et al. (2022). Then, on this dataset, I tried to investigate the most relevant business model variables in determining the “attractiveness” of a startup (measured in the amount of funding it received through its lifecycle), by clustering the data in three funding categories that were also analyzed through a classification algorithm. Finally, the results were summarized in a framework that offers a snapshot of the 2022 market situation and that, at the same time, set the basis for further future research.
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2022
2021/2022
Il Natural Language Processing (NLP) è uno degli ambiti accademici più importanti in cui l'Intelligenza Artificiale (IA) ha mostrato una crescita significativa negli ultimi anni e che ha rappresentato, dal punto di vista del business, una notevole opportunità per aziende e imprenditori. Gli sviluppi più significativi del NLP si sono verificati negli ultimi decenni, come risultato dello sviluppo di algoritmi sofisticati e dell'espansione della potenza di calcolo; perciò, il campo è ancora relativamente poco sviluppato e, per questo motivo, molto attraente per i professionisti del settore. Pertanto, la prima parte di questa tesi ha come obiettivo quello di fornire al lettore una panoramica sintetica delle componenti chiave della tecnologia NLP, rivedendo la principale letteratura sul tema. Dopo aver posto le basi teoriche che porteranno il lettore a comprendere appieno l'argomento, il focus sarà spostato sugli aspetti e le implicazioni di business che il NLP ha sulle organizzazioni, e in particolare sulle startup, vere protagoniste in un campo così innovativo. Scopo principale del lavoro, infatti, è analizzare la loro offerta e i modelli di business, scoprire le principali tendenze del mercato e verificare se sono in linea con la principale letteratura. Per fare ciò, i dati sono stati raccolti da Crunchbase e le startup sono state classificate manualmente attraverso la tassonomia offerta da Weber et al. (2022). Quindi, su questo dataset ho cercato di indagare le variabili di modello di business più rilevanti per determinare l'attrattività di una startup (misurata dall'importo dei finanziamenti ricevuti durante il suo ciclo di vita), raggruppando i dati in tre categorie di finanziamento analizzate attraverso un algoritmo di classificazione. Infine, i risultati sono stati riassunti in un modello che offre un’instantanea della situazione del mercato nel 2022 e che, contemporaneamente, pone le basi per ulteriori ricerche.
File allegati
File Dimensione Formato  
THESIS_MUSCIA_10610141.pdf

accessibile in internet solo dagli utenti autorizzati

Descrizione: Natural Language Processing startups: analysis of the main business model trends
Dimensione 3.8 MB
Formato Adobe PDF
3.8 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/197039