Introduction The way the people use the Internet is dramatically changed in the last few years. Yet the Internet was never architected to support the levels of performance, reliability and scalability that modern applications require. Indeed the evolution of online services and the worldwide success of online marketplaces for digital content delivery reshape the idea of the Internet from a network used to perform message delivery into an efficient content distribution infrastructure. Nowadays the vast majority of data carried by the Internet is composed by large multimedia contents, especially videos. Cisco[key-1] has forecasted that this traffic trend is going to be even more relevant in the near and long term future. However, the Internet as we know it today was not created for such intent. As a matter of fact, the location-based addressing of Internet Protocol poses severe limitations to the content distribution capabilities of the network. In order to overcome this limitation, Content Delivery Networks (CDNs) were specifically proposed to solve this issue. CDN is an overlay infrastructure that replicates contents inside the network, storing them in appropriate Replica Servers scattered all over the world, closer to the locations where most of the users are generating traffic demands. Yet, while using a CDN, the mechanisms and inner functionalities of the Internet remain the same. An alternative approach that recently gained momentum in the scientific research community, is known under the name of Information Centric Networks (ICNs). The idea is to develop a completely new paradigm of Internet, focused on the real needs of nowadays users', the contents. This paradigm aims to re-design the Internet protocol stack, while implementing a new set of protocols used to perform efficient content distribution. The communication model is pull-based, since it is the data receiver (i.e.: the Consumer) that controls the exchange of data. Having two new packets, Interest and Data packet, a Consumer asks for content by broadcasting its Interest over all available connectivity. Any node hearing the Interest and possessing a copy of the requested content, can directly serve the request by responding with a Data packet that satisfies it. Data is transmitted only in response to an Interest and consumes that Interest. In these terms there is a huge difference between this new paradigm and the “classical” Client-Server approach, still used nowadays. The ICN research community is mostly working on specific technical aspects of this novel paradigm. However, at the time of writing, no comparison work has been performed in order to evaluate directly the efficiency of ICN and CDN. Thus an interesting research is to directly compare these technologies under the same conditions, in order to perform a fair comparison between them. On top of that, we also thoroughly analyzed these technologies, describing their advantages and disadvantages. This master thesis investigates the paradigms of ICN and CDN and compares them using a network simulator, that we extended for this purpose. Our focus is to illustrate which technology better handles content delivery, minimizing the overall traffic in the network. This traffic metric is very interesting from an Internet Service Provider point of view because gives the chance to understand which one of the two technologies can better offload the infrastructure, thus leading to lower operational costs. After studying the ICN and CDN technologies, we extended the ndnSIM simulator in order to make it capable to represent a CDN network and we performed extensive simulation campaigns of the two networking technologies. The idea behind the extension is to create, in a CDN scenario, a separate path connecting every Client to its own associated Surrogate Server using a graph search technique. By creating “virtual” nodes and an extended representation of the network we can re-use the functionalities provided by the simulator in order to consider a CDN on the same framework. The results obtained using the simulator confirm the trends previously studied through optimization techniques. Our simulations show how a CDN architecture with an adequate number of Replica Servers installed gives better results, consuming less Bandwidth, in comparison with an equivalent ICN one. The 1^{st} chapter is an introduction to the evolution of the Internet and its usage, showing how this “network of networks” has changed the way we live. The 2^{nd} chapter describes the content delivery infrastructures considered, CDN and ICN, illustrating the main characteristics, similarities and differences. The 3^{rd} chapter describes the approach used for the comparison and shows the problems encountered along the work. The 4^{th} chapter gives an in depth introduction to the simulator and explains the extension work performed in order to suite it for CDN scenarios. The 5^{th} chapter presents the most important results obtained using the extended simulator tool. The 6^{th} chapter covers the conclusions and explains the possible future studies and developments of the technologies considered. KEYWORDS: Content Delivery, CDN, CCN, Simulation

Introduzione Internet, la rete delle reti, ha letteralmente cambiato il modo di vivere della società moderna permettendo sviluppi ed interconnessioni mai pensati prima d'ora. Eppure la rete Internet non è mai stata ideata per sostenere i livelli di prestazioni, affidabilità e scalabilità richieste dalle moderne applicazioni. L'evoluzione dei servizi sul web ed il successo mondiale dei marketplace online per la distribuzione di contenuti digitali hanno rivoluzionato l'idea stessa di Internet. Oggi la stragrande maggioranza dei dati trasportati da Internet è composta da contenuti multimediali, in particolare video. Cisco[key-1] ha previsto che questa tendenza sarà in continuo incremento anche nel prossimo futuro. Tuttavia, Internet non è stata creata per tale scopo e questo genera problemi di efficienza difficilmente superabili. Infatti l'utilizzo del protocollo Internet Protocol, che dipende dalla posizione fisica del dispositivo, pone seri limiti alla capacità di distribuzione dei contenuti nella rete. Al fine di superare questa limitazione, sono state proposte le Content Delivery Networks (CDN). Una CDN è un'infrastruttura overlay che replica i contenuti all'interno della rete, memorizzandoli in appositi Server Replica sparsi in tutto il mondo, più vicino ai luoghi dove la maggior parte degli utenti sta generando, o statisticamente genererà, richieste di contenuti. Eppure, anche utilizzando una CDN, i meccanismi e le funzionalità interne di Internet rimangono le medesime. Un approccio alternativo proposto recentemente dalla comunità di ricerca scientifica è rappresentato dall' Information Centric Network (ICN). L'idea di ICN è di sviluppare un nuovo paradigma di Internet più focalizzato sulle reali esigenze degli utenti del giorno d'oggi: i contenuti. Questo paradigma intende ridisegnare lo stack protocollare di Internet, implementando una nuova serie di protocolli utilizzati per eseguire la distribuzione dei contenuti in modo più efficiente. La comunicazione proposta è guidata dal consumo di dati. Vi sono due nuovi pacchetti, Interest e Data, e il consumatore richiede un contenuto trasmettendo il proprio interesse per quel contenuto. Qualsiasi nodo ricevente un Interest e avente il dato che soddisfa tale Interest può rispondere con un pacchetto Data. I dati vengono trasmessi solo in risposta ad un Interest e consumano tale Interest. C'è una grande differenza tra questo nuovo paradigma e l'approccio "classico" di richiedere contenuti da una singola fonte (Client-Server), largamente usato tutt'oggi. La comunità di ricerca ICN sta lavorando perlopiù su specifici aspetti tecnici riguardanti questo nuovo paradigma. Tuttavia, ad oggi, nessun lavoro di confronto è stato veramente effettuato per valutare direttamente l'efficienza delle due tecnologie. Così un'interessante ricerca è quella di confrontare queste tecnologie in un ambiente consono in cui i Clients inoltrano la stessa quantità di richieste nel tempo. Inoltre, l'attenzione è rivolta in modo particolare alla comprensione di queste tecnologie in modo da sottolinearne i pregi ed i difetti. In questo lavoro di tesi si indagano i paradigmi di distribuzione di contenuti ICN e CDN confrontandoli con un simulatore di rete, che abbiamo esteso per questo scopo. Il nostro obiettivo è quello di illustrare quale tecnologia risulti migliore nella distribuzione dei contenuti, riducendo al minimo il traffico complessivo della rete. La metrica del traffico è molto interessante per un Internet Service Provider, perché dà la possibilità di assegnare e preventivare costi direttamente associati ai dispositivi utilizzati nella rete per distribuire i contenuti. Dopo aver studiato le tecnologie ICN e CDN, il simulatore ndnSIM è stato esteso in modo da renderlo capace di rappresentare una rete CDN e sono state effettuate un gran numero di analisi comparative delle due tecnologie. Il lavoro di estensione del simulatore ed il confronto di performance ha consentito di valutare in modo equo le prestazioni dei due paradigmi considerati. L'idea alla base dell'estensione è quella di creare, in uno scenario CDN, un percorso alternativo che collega ogni Client con il proprio Server Replica associato. Usando una tecnica di ricerca nel grafo è possibile annotare e memorizzare i Router che collegano ogni Client con il proprio Server Replica e quindi creare il nuovo percorso usando l'elenco dei Routers inverso. I risultati ottenuti con il simulatore confermano le tendenze precedentemente studiate mediante tecniche di ottimizzazione. Le simulazioni mostrano come un'architettura CDN con un adeguato numero di Server Replica installati possa produrre risultati migliori, consumando meno banda, in confronto ad uno scenario ICN equivalente. Il I capitolo è un'introduzione all'evoluzione di Internet ed al suo utilizzo. Viene altresì mostrato come questa "rete delle reti" ha cambiato il nostro modo di vivere. Il II capitolo descrive le infrastrutture di distribuzione dei contenuti considerate, CDN e ICN, illustrandone le caratteristiche principali, le analogie e le differenze. Il III capitolo descrive l'approccio utilizzato per il confronto e mostra i problemi incontrati durante il lavoro. Il IV capitolo fornisce un'introduzione approfondita del simulatore utilizzato, sottolineando il lavoro di estensione svolto in modo da poterne adattare scenari CDN. Il V capitolo presenta i risultati più importanti ottenuti con le simulazioni degli scenari considerati. Il VI capitolo tratta le conclusioni e spiega i possibili studi e sviluppi futuri riguardo le tecnologie considerate. PAROLE CHIAVE: Distribuzione di contenuti, CDN, CCN, Simulazione

Performance analysis, simulation and comparison for efficient content delivery in the Internet

SIRONI, DANIELE
2012/2013

Abstract

Introduction The way the people use the Internet is dramatically changed in the last few years. Yet the Internet was never architected to support the levels of performance, reliability and scalability that modern applications require. Indeed the evolution of online services and the worldwide success of online marketplaces for digital content delivery reshape the idea of the Internet from a network used to perform message delivery into an efficient content distribution infrastructure. Nowadays the vast majority of data carried by the Internet is composed by large multimedia contents, especially videos. Cisco[key-1] has forecasted that this traffic trend is going to be even more relevant in the near and long term future. However, the Internet as we know it today was not created for such intent. As a matter of fact, the location-based addressing of Internet Protocol poses severe limitations to the content distribution capabilities of the network. In order to overcome this limitation, Content Delivery Networks (CDNs) were specifically proposed to solve this issue. CDN is an overlay infrastructure that replicates contents inside the network, storing them in appropriate Replica Servers scattered all over the world, closer to the locations where most of the users are generating traffic demands. Yet, while using a CDN, the mechanisms and inner functionalities of the Internet remain the same. An alternative approach that recently gained momentum in the scientific research community, is known under the name of Information Centric Networks (ICNs). The idea is to develop a completely new paradigm of Internet, focused on the real needs of nowadays users', the contents. This paradigm aims to re-design the Internet protocol stack, while implementing a new set of protocols used to perform efficient content distribution. The communication model is pull-based, since it is the data receiver (i.e.: the Consumer) that controls the exchange of data. Having two new packets, Interest and Data packet, a Consumer asks for content by broadcasting its Interest over all available connectivity. Any node hearing the Interest and possessing a copy of the requested content, can directly serve the request by responding with a Data packet that satisfies it. Data is transmitted only in response to an Interest and consumes that Interest. In these terms there is a huge difference between this new paradigm and the “classical” Client-Server approach, still used nowadays. The ICN research community is mostly working on specific technical aspects of this novel paradigm. However, at the time of writing, no comparison work has been performed in order to evaluate directly the efficiency of ICN and CDN. Thus an interesting research is to directly compare these technologies under the same conditions, in order to perform a fair comparison between them. On top of that, we also thoroughly analyzed these technologies, describing their advantages and disadvantages. This master thesis investigates the paradigms of ICN and CDN and compares them using a network simulator, that we extended for this purpose. Our focus is to illustrate which technology better handles content delivery, minimizing the overall traffic in the network. This traffic metric is very interesting from an Internet Service Provider point of view because gives the chance to understand which one of the two technologies can better offload the infrastructure, thus leading to lower operational costs. After studying the ICN and CDN technologies, we extended the ndnSIM simulator in order to make it capable to represent a CDN network and we performed extensive simulation campaigns of the two networking technologies. The idea behind the extension is to create, in a CDN scenario, a separate path connecting every Client to its own associated Surrogate Server using a graph search technique. By creating “virtual” nodes and an extended representation of the network we can re-use the functionalities provided by the simulator in order to consider a CDN on the same framework. The results obtained using the simulator confirm the trends previously studied through optimization techniques. Our simulations show how a CDN architecture with an adequate number of Replica Servers installed gives better results, consuming less Bandwidth, in comparison with an equivalent ICN one. The 1^{st} chapter is an introduction to the evolution of the Internet and its usage, showing how this “network of networks” has changed the way we live. The 2^{nd} chapter describes the content delivery infrastructures considered, CDN and ICN, illustrating the main characteristics, similarities and differences. The 3^{rd} chapter describes the approach used for the comparison and shows the problems encountered along the work. The 4^{th} chapter gives an in depth introduction to the simulator and explains the extension work performed in order to suite it for CDN scenarios. The 5^{th} chapter presents the most important results obtained using the extended simulator tool. The 6^{th} chapter covers the conclusions and explains the possible future studies and developments of the technologies considered. KEYWORDS: Content Delivery, CDN, CCN, Simulation
MANGILI, MICHELE
ING - Scuola di Ingegneria Industriale e dell'Informazione
29-apr-2014
2012/2013
Introduzione Internet, la rete delle reti, ha letteralmente cambiato il modo di vivere della società moderna permettendo sviluppi ed interconnessioni mai pensati prima d'ora. Eppure la rete Internet non è mai stata ideata per sostenere i livelli di prestazioni, affidabilità e scalabilità richieste dalle moderne applicazioni. L'evoluzione dei servizi sul web ed il successo mondiale dei marketplace online per la distribuzione di contenuti digitali hanno rivoluzionato l'idea stessa di Internet. Oggi la stragrande maggioranza dei dati trasportati da Internet è composta da contenuti multimediali, in particolare video. Cisco[key-1] ha previsto che questa tendenza sarà in continuo incremento anche nel prossimo futuro. Tuttavia, Internet non è stata creata per tale scopo e questo genera problemi di efficienza difficilmente superabili. Infatti l'utilizzo del protocollo Internet Protocol, che dipende dalla posizione fisica del dispositivo, pone seri limiti alla capacità di distribuzione dei contenuti nella rete. Al fine di superare questa limitazione, sono state proposte le Content Delivery Networks (CDN). Una CDN è un'infrastruttura overlay che replica i contenuti all'interno della rete, memorizzandoli in appositi Server Replica sparsi in tutto il mondo, più vicino ai luoghi dove la maggior parte degli utenti sta generando, o statisticamente genererà, richieste di contenuti. Eppure, anche utilizzando una CDN, i meccanismi e le funzionalità interne di Internet rimangono le medesime. Un approccio alternativo proposto recentemente dalla comunità di ricerca scientifica è rappresentato dall' Information Centric Network (ICN). L'idea di ICN è di sviluppare un nuovo paradigma di Internet più focalizzato sulle reali esigenze degli utenti del giorno d'oggi: i contenuti. Questo paradigma intende ridisegnare lo stack protocollare di Internet, implementando una nuova serie di protocolli utilizzati per eseguire la distribuzione dei contenuti in modo più efficiente. La comunicazione proposta è guidata dal consumo di dati. Vi sono due nuovi pacchetti, Interest e Data, e il consumatore richiede un contenuto trasmettendo il proprio interesse per quel contenuto. Qualsiasi nodo ricevente un Interest e avente il dato che soddisfa tale Interest può rispondere con un pacchetto Data. I dati vengono trasmessi solo in risposta ad un Interest e consumano tale Interest. C'è una grande differenza tra questo nuovo paradigma e l'approccio "classico" di richiedere contenuti da una singola fonte (Client-Server), largamente usato tutt'oggi. La comunità di ricerca ICN sta lavorando perlopiù su specifici aspetti tecnici riguardanti questo nuovo paradigma. Tuttavia, ad oggi, nessun lavoro di confronto è stato veramente effettuato per valutare direttamente l'efficienza delle due tecnologie. Così un'interessante ricerca è quella di confrontare queste tecnologie in un ambiente consono in cui i Clients inoltrano la stessa quantità di richieste nel tempo. Inoltre, l'attenzione è rivolta in modo particolare alla comprensione di queste tecnologie in modo da sottolinearne i pregi ed i difetti. In questo lavoro di tesi si indagano i paradigmi di distribuzione di contenuti ICN e CDN confrontandoli con un simulatore di rete, che abbiamo esteso per questo scopo. Il nostro obiettivo è quello di illustrare quale tecnologia risulti migliore nella distribuzione dei contenuti, riducendo al minimo il traffico complessivo della rete. La metrica del traffico è molto interessante per un Internet Service Provider, perché dà la possibilità di assegnare e preventivare costi direttamente associati ai dispositivi utilizzati nella rete per distribuire i contenuti. Dopo aver studiato le tecnologie ICN e CDN, il simulatore ndnSIM è stato esteso in modo da renderlo capace di rappresentare una rete CDN e sono state effettuate un gran numero di analisi comparative delle due tecnologie. Il lavoro di estensione del simulatore ed il confronto di performance ha consentito di valutare in modo equo le prestazioni dei due paradigmi considerati. L'idea alla base dell'estensione è quella di creare, in uno scenario CDN, un percorso alternativo che collega ogni Client con il proprio Server Replica associato. Usando una tecnica di ricerca nel grafo è possibile annotare e memorizzare i Router che collegano ogni Client con il proprio Server Replica e quindi creare il nuovo percorso usando l'elenco dei Routers inverso. I risultati ottenuti con il simulatore confermano le tendenze precedentemente studiate mediante tecniche di ottimizzazione. Le simulazioni mostrano come un'architettura CDN con un adeguato numero di Server Replica installati possa produrre risultati migliori, consumando meno banda, in confronto ad uno scenario ICN equivalente. Il I capitolo è un'introduzione all'evoluzione di Internet ed al suo utilizzo. Viene altresì mostrato come questa "rete delle reti" ha cambiato il nostro modo di vivere. Il II capitolo descrive le infrastrutture di distribuzione dei contenuti considerate, CDN e ICN, illustrandone le caratteristiche principali, le analogie e le differenze. Il III capitolo descrive l'approccio utilizzato per il confronto e mostra i problemi incontrati durante il lavoro. Il IV capitolo fornisce un'introduzione approfondita del simulatore utilizzato, sottolineando il lavoro di estensione svolto in modo da poterne adattare scenari CDN. Il V capitolo presenta i risultati più importanti ottenuti con le simulazioni degli scenari considerati. Il VI capitolo tratta le conclusioni e spiega i possibili studi e sviluppi futuri riguardo le tecnologie considerate. PAROLE CHIAVE: Distribuzione di contenuti, CDN, CCN, Simulazione
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2014_04_Sironi.pdf

solo utenti autorizzati dal 29/03/2015

Descrizione: Thesis
Dimensione 5.31 MB
Formato Adobe PDF
5.31 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/92313