In today’s society everything is happening on the Internet, in particular on social networks. Social networks play central role in everyday life of average people. So naturally, companies recognize the opportunity and try to make use of that by changing their business plans and focusing on potential customers on social networks. Business is realized by means of the presence of the company on web and by producing content that will take customer’s attention. In return, users share their opinions about particular products by leaving comments on them and reacting to the company’s posts. Taking this scenario into consideration, it is useful to have automated techniques to analyse user reactions on products that a company is offering. Also knowing types of people following and leaving opinions on products can be turned into advantage for defining future business plans. For example, to predict which products can be attractive for specific user groups or to determine the best time when to launch products. We recognized the potential of that and that’s why we were eager to examine sentiment analysis tools and machine learning algorithms to improve the analysis. In this thesis we have built an automatic procedure for calculating sentiment of users who comment on specific company’s posts properly cleaned by means of intelligent spam filter. Sentiment analysis was done separately on text and on emojis. For evaluating text sentiment, we used open source APIs and for emojis we used tables of evaluation for each emoji. The spam filter was designed using supervised machine learning techniques to determine spam, not just by searching URL patterns in comments, but checking the whole text content. We have also built a clustering module that uses unsupervised learning techniques on user data and visualize characteristics for each discovered group. Finally, in last chapter we define how the defined models and algorithm can be used together in an API to evaluate success of company’s posts.

Nella società di oggi tutto accade in Internet, in particolare nei social network. I social network svolgono un ruolo centrale nella vita di tutti i giorni. Naturalmente, le aziende riconoscono diverse opportunità derivanti da questo uso diffuso dei canali social e cercano di farne uso cambiando i loro piani aziendali e concentrandosi sui potenziali clienti così come essi emergono dai social network. Parte del business delle aziende è quindi realizzato attraverso la loro presenza sul web e producendo contenuti che cattureranno l'attenzione del cliente. Come reazioni, gli utenti condividono le loro opinioni su determinati prodotti, lasciando commenti su di loro e reagendo ai post della dell’azienda. Prendendo in considerazione questo scenario, è utile disporre di tecniche automatizzate per analizzare le reazioni degli utenti sui prodotti offerti da un'azienda. Anche la conoscenza dei tipi di follower e degli utenti che lasciano i commenti sui prodotti può essere trasformata in vantaggio per la definizione di piani aziendali futuri. Per esempio, tali informazioni possono essere utili per prevedere quali prodotti possono essere attraenti per specifici gruppi di utenti o per determinare il momento migliore in cui lanciare e presentare i prodotti. Abbiamo riconosciuto il potenziale di questo aspetto ed è per questo che abbiamo esaminato gli strumenti di analisi delle opinioni e gli algoritmi di apprendimento automatico per migliorare l'analisi. In questa tesi abbiamo costruito una procedura automatica per il calcolo delle opinioni degli utenti che commentano i messaggi specifici di un'azienda, correttamente filtrate mediante un algoritmo anti-spam intelligente. L'analisi delle opinioni è stata fatta separatamente sul testo e sugli emoticon. Per valutare le opinione emergenti dal testo, abbiamo utilizzato API open source; per gli emoticon abbiamo utilizzato tabelle di valutazione predefinite per ogni emoticon. Il filtro anti-spam è stato progettato utilizzando tecniche di apprendimento automatico supervisionato per determinare lo spam, non solo ricercando URL nei commenti, ma controllando l'intero contenuto del testo. Abbiamo anche creato un modulo di clustering che utilizza tecniche di apprendimento non supervisionato sui dati degli utenti e visualizza le caratteristiche per ciascun gruppo individuato. Infine, nell'ultimo capitolo definiamo come i modelli e gli algoritmi definiti possono essere utilizzati in modo combinato in un'API per valutare il successo dei post pubblicati da un’azienda.

Machine learning techniques for social media analysis

KORDA, PETAR;VIDANOVIC, PAVLE
2016/2017

Abstract

In today’s society everything is happening on the Internet, in particular on social networks. Social networks play central role in everyday life of average people. So naturally, companies recognize the opportunity and try to make use of that by changing their business plans and focusing on potential customers on social networks. Business is realized by means of the presence of the company on web and by producing content that will take customer’s attention. In return, users share their opinions about particular products by leaving comments on them and reacting to the company’s posts. Taking this scenario into consideration, it is useful to have automated techniques to analyse user reactions on products that a company is offering. Also knowing types of people following and leaving opinions on products can be turned into advantage for defining future business plans. For example, to predict which products can be attractive for specific user groups or to determine the best time when to launch products. We recognized the potential of that and that’s why we were eager to examine sentiment analysis tools and machine learning algorithms to improve the analysis. In this thesis we have built an automatic procedure for calculating sentiment of users who comment on specific company’s posts properly cleaned by means of intelligent spam filter. Sentiment analysis was done separately on text and on emojis. For evaluating text sentiment, we used open source APIs and for emojis we used tables of evaluation for each emoji. The spam filter was designed using supervised machine learning techniques to determine spam, not just by searching URL patterns in comments, but checking the whole text content. We have also built a clustering module that uses unsupervised learning techniques on user data and visualize characteristics for each discovered group. Finally, in last chapter we define how the defined models and algorithm can be used together in an API to evaluate success of company’s posts.
MATERA, MARISTELLA
MEDANA, RICCARDO
ING - Scuola di Ingegneria Industriale e dell'Informazione
21-dic-2017
2016/2017
Nella società di oggi tutto accade in Internet, in particolare nei social network. I social network svolgono un ruolo centrale nella vita di tutti i giorni. Naturalmente, le aziende riconoscono diverse opportunità derivanti da questo uso diffuso dei canali social e cercano di farne uso cambiando i loro piani aziendali e concentrandosi sui potenziali clienti così come essi emergono dai social network. Parte del business delle aziende è quindi realizzato attraverso la loro presenza sul web e producendo contenuti che cattureranno l'attenzione del cliente. Come reazioni, gli utenti condividono le loro opinioni su determinati prodotti, lasciando commenti su di loro e reagendo ai post della dell’azienda. Prendendo in considerazione questo scenario, è utile disporre di tecniche automatizzate per analizzare le reazioni degli utenti sui prodotti offerti da un'azienda. Anche la conoscenza dei tipi di follower e degli utenti che lasciano i commenti sui prodotti può essere trasformata in vantaggio per la definizione di piani aziendali futuri. Per esempio, tali informazioni possono essere utili per prevedere quali prodotti possono essere attraenti per specifici gruppi di utenti o per determinare il momento migliore in cui lanciare e presentare i prodotti. Abbiamo riconosciuto il potenziale di questo aspetto ed è per questo che abbiamo esaminato gli strumenti di analisi delle opinioni e gli algoritmi di apprendimento automatico per migliorare l'analisi. In questa tesi abbiamo costruito una procedura automatica per il calcolo delle opinioni degli utenti che commentano i messaggi specifici di un'azienda, correttamente filtrate mediante un algoritmo anti-spam intelligente. L'analisi delle opinioni è stata fatta separatamente sul testo e sugli emoticon. Per valutare le opinione emergenti dal testo, abbiamo utilizzato API open source; per gli emoticon abbiamo utilizzato tabelle di valutazione predefinite per ogni emoticon. Il filtro anti-spam è stato progettato utilizzando tecniche di apprendimento automatico supervisionato per determinare lo spam, non solo ricercando URL nei commenti, ma controllando l'intero contenuto del testo. Abbiamo anche creato un modulo di clustering che utilizza tecniche di apprendimento non supervisionato sui dati degli utenti e visualizza le caratteristiche per ciascun gruppo individuato. Infine, nell'ultimo capitolo definiamo come i modelli e gli algoritmi definiti possono essere utilizzati in modo combinato in un'API per valutare il successo dei post pubblicati da un’azienda.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Machine-Learning-Techniques-for-Social-Media-Analysis.pdf

accessibile in internet per tutti

Descrizione: Thesis text
Dimensione 2.03 MB
Formato Adobe PDF
2.03 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/137564