Nowadays e-commerce is more relevant than it has ever been before, with Amazon having 5% percent of USA retail and Alibaba Group being able to generate $25 Billion of revenues on China’s Singles’ Day. Online reviews are more and more crucial for customers trying to choose what to buy or what to do and they are of undeniable importance for a wide variety of businesses: retail, accomodations, restaurants, healthcare... This study looks at some challenges offered by the huge amount of data con- stituted by Amazon.com reviews, in particular Document Clustering, Opinion Polarity Analysis and Forecasting of Economic Impact of Reviews. We will propose solutions to identified use cases, which are deemed interesting for companies. The use cases selected are: Document Clustering in the field of the online reviews, Transfer Learning for MultiClass Sentiment classification and Google Trends index prediction for some products. The study is divided in three main parts, following the three above mentioned macro areas. Each of the steps will make use of a particular subset of Machine Learning techniques, respectively: Unsupervised Learning, Supervised Learning and Time Series Forecasting. After each phase we will evaluate results according to mathematical performances metrics.

Oggigiorno l’e-commerce è più importante di quanto sia mai stato: Amazon.com detiene il 5% della quota del mercato retail statunitense e Alibaba Group ha generato 25 Miliardi di dollari di ricavi nel Single Day in Cina. Le recensioni online sono sempre più cruciali per i consumatori che cercano consigli su cosa comprare o cosa fare e sono di innegabile importanza per un gran numero di business: retail, alberghi, ristoranti, strutture mediche... Questo lavoro analizza alcune sfide presentate dalla vasta mole di dati costituita dalle recensioni di Amazon.com, in particolare Document Clustering, Opinion Po- larity Analysis e Forecasting dell’Impatto Economico delle Recensioni. Proporremo soluzioni per i casi d’uso identificati, che riteniamo interessanti per le aziende. I casi d’uso identificati sono: Document Clustering nel campo delle rencesioni online, Transfer Learning per classification del Sentiment e previsione dell’indice di ricerca di Google Trends per alcuni prodotti. Il seguente lavoro è diviso in tre parti principali, ciascuna delle quali si inquadra in una delle tre macro aree menzionate. Inoltre, in ciascuna parte verrà utiliz- zato principalmente un particolare sottoinsieme di tecniche di Machine Learning, rispettivamente: Unsupervised Learning, Supervised Learning e Time Series Fore- casting. Dopo ciascuna fase valuteremo i risultati secondo metriche matematiche di performance.

Analysing marketing trends from product reviews

POLIMENO CAMASTRA, PAOLO
2017/2018

Abstract

Nowadays e-commerce is more relevant than it has ever been before, with Amazon having 5% percent of USA retail and Alibaba Group being able to generate $25 Billion of revenues on China’s Singles’ Day. Online reviews are more and more crucial for customers trying to choose what to buy or what to do and they are of undeniable importance for a wide variety of businesses: retail, accomodations, restaurants, healthcare... This study looks at some challenges offered by the huge amount of data con- stituted by Amazon.com reviews, in particular Document Clustering, Opinion Polarity Analysis and Forecasting of Economic Impact of Reviews. We will propose solutions to identified use cases, which are deemed interesting for companies. The use cases selected are: Document Clustering in the field of the online reviews, Transfer Learning for MultiClass Sentiment classification and Google Trends index prediction for some products. The study is divided in three main parts, following the three above mentioned macro areas. Each of the steps will make use of a particular subset of Machine Learning techniques, respectively: Unsupervised Learning, Supervised Learning and Time Series Forecasting. After each phase we will evaluate results according to mathematical performances metrics.
LUI, ANDREA
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
Oggigiorno l’e-commerce è più importante di quanto sia mai stato: Amazon.com detiene il 5% della quota del mercato retail statunitense e Alibaba Group ha generato 25 Miliardi di dollari di ricavi nel Single Day in Cina. Le recensioni online sono sempre più cruciali per i consumatori che cercano consigli su cosa comprare o cosa fare e sono di innegabile importanza per un gran numero di business: retail, alberghi, ristoranti, strutture mediche... Questo lavoro analizza alcune sfide presentate dalla vasta mole di dati costituita dalle recensioni di Amazon.com, in particolare Document Clustering, Opinion Po- larity Analysis e Forecasting dell’Impatto Economico delle Recensioni. Proporremo soluzioni per i casi d’uso identificati, che riteniamo interessanti per le aziende. I casi d’uso identificati sono: Document Clustering nel campo delle rencesioni online, Transfer Learning per classification del Sentiment e previsione dell’indice di ricerca di Google Trends per alcuni prodotti. Il seguente lavoro è diviso in tre parti principali, ciascuna delle quali si inquadra in una delle tre macro aree menzionate. Inoltre, in ciascuna parte verrà utiliz- zato principalmente un particolare sottoinsieme di tecniche di Machine Learning, rispettivamente: Unsupervised Learning, Supervised Learning e Time Series Fore- casting. Dopo ciascuna fase valuteremo i risultati secondo metriche matematiche di performance.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
tesi_versione_finale.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 2.25 MB
Formato Adobe PDF
2.25 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144742