In recent years, cloud data architectures have become increasingly popular among companies looking to move away from on-premise systems and leverage the computational power offered by major cloud providers such as Microsoft. A company’s Data Warehouse contains information that is vital to the proper functioning of the business and organizations across all sectors, including the luxury fashion retail market, aim to maintain high-quality data and derive meaningful insights to support decision-making. This work originates from an internship at PricewaterhouseCoopers (PwC) and describes how a company can migrate its data from an on-premise system to a new cloud-based one. The study focuses on migration from an Oracle on-premise DataWarehouse to Microsoft’s new Fabric platform, highlighting the advantages offered by the medallion architecture, the lakehouse paradigm as a primary storage for data and ETL/ELT processes. The proposed approach was implemented in Microsoft Fabric mainly through pipelines and notebooks, demonstrating how Fabric can be leveraged to perform a migration using a “Lift & Shift” strategy. The results show how the architecture evolved by centralizing all operations within Fabric, while respecting pipeline scheduling constraints and reducing overall costs. The final result will not deprecate the utilization of the Oracle Data Warehouse but this work represents a starting point for a future definitive replacement.

Negli ultimi anni le architetture dati gestite tramite sistemi cloud sono diventate sempre più popolari tra le aziende che desiderano abbandonare i sistemi on-premise e sfruttare la potenza computazionale offerta dai principali servizi cloud. Il Data Warehouse di un’azienda contiene informazioni vitali per il corretto funzionamento del business e tutte le organizzazioni, incluse quelle operanti nel settore del lusso, hanno interesse a conservare ed elaborare dati di alta qualità e a ricavarne informazioni significative per supportare i processi decisionali. Questo lavoro nasce da un tirocinio svolto presso Pricewaterhouse- Coopers (PwC) e descrive come un’azienda possa migrare i propri dati da un sistema on-premise a un nuovo ambiente cloud. Lo studio si concentra sulla migrazione da un Data Warehouse Oracle on-premise alla nuova piattaforma cloud Microsoft Fabric, mettendo in evidenza i vantaggi offerti dalla medallion architecture, dall’utilizzo di lakehouse come principale sistema di archiviazione dei dati e dai processi ETL/ELT. La migrazione è stata svolta seguendo una strategia “Lift & Shift”, ovvero senza l’introduzione di nuova logica rispetto alla soluzione originale, utilizzando principalmente pipeline e notebook disponibili in Fabric. I risultati ottenuti mostrano come l’architettura di partenza si sia evoluta centralizzando tutte le operazioni all’interno di Fabric, rispettando i vincoli di schedulazione delle pipeline e riducendo i costi complessivi. Il risultato finale non prevede la dismissione immediata del Data Warehouse Oracle, ma questo lavoro rappresenta un punto di partenza per una futura sostituzione definitiva.

Migration of an on-premise data platform to a cloud environment with microsoft fabric

Negri, Luca
2024/2025

Abstract

In recent years, cloud data architectures have become increasingly popular among companies looking to move away from on-premise systems and leverage the computational power offered by major cloud providers such as Microsoft. A company’s Data Warehouse contains information that is vital to the proper functioning of the business and organizations across all sectors, including the luxury fashion retail market, aim to maintain high-quality data and derive meaningful insights to support decision-making. This work originates from an internship at PricewaterhouseCoopers (PwC) and describes how a company can migrate its data from an on-premise system to a new cloud-based one. The study focuses on migration from an Oracle on-premise DataWarehouse to Microsoft’s new Fabric platform, highlighting the advantages offered by the medallion architecture, the lakehouse paradigm as a primary storage for data and ETL/ELT processes. The proposed approach was implemented in Microsoft Fabric mainly through pipelines and notebooks, demonstrating how Fabric can be leveraged to perform a migration using a “Lift & Shift” strategy. The results show how the architecture evolved by centralizing all operations within Fabric, while respecting pipeline scheduling constraints and reducing overall costs. The final result will not deprecate the utilization of the Oracle Data Warehouse but this work represents a starting point for a future definitive replacement.
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
Negli ultimi anni le architetture dati gestite tramite sistemi cloud sono diventate sempre più popolari tra le aziende che desiderano abbandonare i sistemi on-premise e sfruttare la potenza computazionale offerta dai principali servizi cloud. Il Data Warehouse di un’azienda contiene informazioni vitali per il corretto funzionamento del business e tutte le organizzazioni, incluse quelle operanti nel settore del lusso, hanno interesse a conservare ed elaborare dati di alta qualità e a ricavarne informazioni significative per supportare i processi decisionali. Questo lavoro nasce da un tirocinio svolto presso Pricewaterhouse- Coopers (PwC) e descrive come un’azienda possa migrare i propri dati da un sistema on-premise a un nuovo ambiente cloud. Lo studio si concentra sulla migrazione da un Data Warehouse Oracle on-premise alla nuova piattaforma cloud Microsoft Fabric, mettendo in evidenza i vantaggi offerti dalla medallion architecture, dall’utilizzo di lakehouse come principale sistema di archiviazione dei dati e dai processi ETL/ELT. La migrazione è stata svolta seguendo una strategia “Lift & Shift”, ovvero senza l’introduzione di nuova logica rispetto alla soluzione originale, utilizzando principalmente pipeline e notebook disponibili in Fabric. I risultati ottenuti mostrano come l’architettura di partenza si sia evoluta centralizzando tutte le operazioni all’interno di Fabric, rispettando i vincoli di schedulazione delle pipeline e riducendo i costi complessivi. Il risultato finale non prevede la dismissione immediata del Data Warehouse Oracle, ma questo lavoro rappresenta un punto di partenza per una futura sostituzione definitiva.
File allegati
File Dimensione Formato  
2025_12_Negri.pdf

non accessibile

Descrizione: Testo Tesi
Dimensione 856.9 kB
Formato Adobe PDF
856.9 kB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/246789