In the last years more and more often we heard about IoT devices and their util- ity in the everyday life. One of the most important category in this world is the one represented by Smart Speakers. The world leader in the production of these devices is, without any doubt, Amazon which was the first, in 2014 in U.S.A, to develop these kind of products based on Alexa, which is a virtual assistant AI technology. Based on the success obtained by Amazon, Google, decided in 2016 to start the production of these devices supported by Google Assistant as software. Two of the most popular products, not only for economic reasons, are Amazon Echo Dot and Google Home Mini. Just these two devices were used in the context of this thesis. We’re aiming to analyze the network traffic of these devices in order to study their behaviour when we change the kind of request; for this purpose we divided the activities in 8 categories. In order to achieve our goal, we used some Machine Learning models, that we tested to evaluate which of them perform better, basing on the selected features. These results will be shown through some graphical plots, such as ROC-AUC Curves, Confusion Matrix, etc.
Negli ultimi anni, sempre più spesso, abbiamo sentito parlare di dispositivi IoT e della loro importanza nella vita di tutti i giorni. Una delle categorie più importanti in questo mondo è quella che comprende gli Smart Speakers. Il leader mondiale nella produzione di questi dispositivi è, senza ombra di dubbio, Amazon che è stato il primo, nel 2014 negli Stati Uniti, a sviluppare questa tipologia di prodotti basati su Alexa, un assistente virtuale dotato di Intelligenza Artificiale come tecnologia. Basandosi sul successo ottenuto da Amazon, anche Google, ha deciso nel 2016 di avviare la produzione di questi dispositivi supportati da Google Assistant come software. Due dei prodotti più popolari, non solo per ragioni economiche, sono Amazon Echo Dot e Google Home Mini. Proprio questi due dispositivi sono stati utilizzati nel contesto di questa tesi. Il nostro obiettivo è quello di analizzare il traffico di rete di questi dispositivi nel tentativo di studiarne il comportamento quando cambia la tipologia di richiesta vocale effettuata dall'utente; a tal proposito abbiamo suddiviso le richieste in 8 categorie. Allo scopo di raggiungere questo obiettivo, abbiamo utilizzato alcuni modelli di Machine Learning, che abbiamo testato per valutare quale tra questi è in grado di fornire prestazioni migliori, basandosi su un insieme di informazioni selezionate. Questi risultati verranno mostrati tramite delle rappresentazioni grafiche, come ad esempio le curve ROC-AUC o le Matrici di Confusione.
Machine learning classification of smart speakers activities based on network traffic features
Spiguzza, Luigi
2019/2020
Abstract
In the last years more and more often we heard about IoT devices and their util- ity in the everyday life. One of the most important category in this world is the one represented by Smart Speakers. The world leader in the production of these devices is, without any doubt, Amazon which was the first, in 2014 in U.S.A, to develop these kind of products based on Alexa, which is a virtual assistant AI technology. Based on the success obtained by Amazon, Google, decided in 2016 to start the production of these devices supported by Google Assistant as software. Two of the most popular products, not only for economic reasons, are Amazon Echo Dot and Google Home Mini. Just these two devices were used in the context of this thesis. We’re aiming to analyze the network traffic of these devices in order to study their behaviour when we change the kind of request; for this purpose we divided the activities in 8 categories. In order to achieve our goal, we used some Machine Learning models, that we tested to evaluate which of them perform better, basing on the selected features. These results will be shown through some graphical plots, such as ROC-AUC Curves, Confusion Matrix, etc.File | Dimensione | Formato | |
---|---|---|---|
Tesi.pdf
accessibile in internet solo dagli utenti autorizzati
Descrizione: MACHINE LEARNING CLASSIFICATION OF SMART SPEAKERS ACTIVITIES BASED ON NETWORK TRAFFIC FEATURES
Dimensione
3.78 MB
Formato
Adobe PDF
|
3.78 MB | Adobe PDF | Visualizza/Apri |
I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/10589/167149