This thesis develops a comprehensive pipeline to explain and predict photovoltaic (PV) module costs. It connects supply-chain factors (upstream materials, manufacturing growth, operational efficiency) with deployment and macroeconomic impacts to provide a comprehensible explanation of price formation and short-term forecasts for procurement and planning. Regarding Data Architecture, a multi-year (2010-2024) dataset combines public and private investment series, innovation indicators (patents), capacity and generation statistics, supply chain proxies (polysilicon, copper, logistics), and performance metrics (capacity factor). A Power BI dashboard organizes descriptive analysis through the sequence of finance, innovation, assets and outputs; it categorizes by country, technology, and time, guiding variable selection. A specific case study converts global signals into localized local insights with GeoDa and Sunprime’s Company data. The inferential layer uses Generalized Least Squares (GLS) with a power-of-the-mean variance and AR(1) errors to stabilize elasticities and account for temporal dependency. Support Vector Regression (SVR) is applied for prediction and compared to basic time-series benchmarks. The main economic-technical drivers include polysilicon (upstream pressure), imports of semiconductor equipment (capital expenditure/line growth), wafer shipments, and capacity factor; copper, oil, and geopolitical risk indexes serve as controls. The operational process is structured in four phases: (1) Exploratory profiling utilizing the dashboard; (2) selection of drivers and correlations aligned with the PV value chain; (3) GLS estimation for resilience and scenario analysis; (4) time-sensitive validation and model selection for forecasts. GLS demonstrates solid indicators: polysilicon serves as the primary upward accelerator, factory expansion (equipment imports) has a negative influence, capacity factor has a positive contribution and wafer shipments exhibit a slight decline. In predictions, the linear Support Vector Regression (SVR) model is the most reliable and precise, outperforming persistence in the presence of minor trends and maintaining stability in out-of-sample evaluations. Regarding the contribution, the study provides a coherent approach that integrates interpretable responses (GLS) with operational short-term forecasting (SVR), further facilitating purchase and planning decisions. Limitations pertain to data accessibility and reporting difficulties with fast technological advancements or important disruptions in the supply chain.

Questa tesi sviluppa un percorso completo per analizzare e prevedere i costi dei moduli fotovoltaici (PV). L’obiettivo è mettere in relazione i fattori della supply chain, come materie prime, crescita della capacità produttiva ed efficienza operativa, con gli effetti della diffusione della tecnologia e le dinamiche macroeconomiche. Inoltre, offre sia una lettura chiara della formazione dei prezzi, sia previsioni utili nel breve periodo per gli acquisti e la pianificazione nel contesto energetico mondiale. Dal punto di vista dei dati, è stato costruito un dataset pluriennale (ultimi 14 anni) che integra le variabili citate con fattori non strettamente legati alla produzione del pannello fotovoltaico. L’analisi descrittiva è stata organizzata in un cruscotto Power BI, che segue il filo conduttore finanza–innovazione–asset–output e che consente di classificare le informazioni per Paese, tecnologia e periodo, guidando così la selezione delle variabili. Un case study ha inoltre permesso di tradurre segnali globali in evidenze locali grazie all’uso di GeoDa e dei dati aziendali di Sunprime. La fase inferenziale impiega i Generalized Least Squares (GLS), con varianza proporzionale alla media ed errori AR(1), per stabilizzare le elasticità e catturare la dipendenza temporale. Per le previsioni è stato invece applicato un modello di Support Vector Regression (SVR), confrontato con benchmark di serie storiche più semplici. I principali driver economici e tecnici individuati sono il prezzo del polisilicio (fattore di pressione a monte), le importazioni di macchinari e semiconduttori (indicatore di espansione della capacità produttiva, con effetto negativo), le spedizioni di wafer e il capacity factor, mentre rame, petrolio e indici di rischio geopolitico sono stati considerati come variabili di controllo. Il processo operativo si articola in quattro fasi: (1) fase esplorativa dei dati tramite dashboard, (2) selezione dei driver e delle correlazioni lungo la supply chain del fotovoltaico, (3) stima con GLS per analisi di resilienza e scenari, (4) validazione temporale e scelta del modello per le previsioni. I risultati mostrano che il modello GLS restituisce indicatori solidi: il polisilicio emerge come principale fattore di crescita dei prezzi; l’espansione produttiva esercita un effetto negativo; il capacity factor contribuisce positivamente. Sul fronte delle previsioni, il modello lineare SVR si dimostra il più affidabile e preciso, superando le semplici strategie di persistenza quando sono presenti tendenze deboli e mantenendo stabilità anche fuori campione. In termini di contributo, lo studio propone un approccio coerente che integra risposte interpretabili (GLS) con previsioni operative di breve periodo (SVR), rendendo più agevoli le decisioni di acquisto e pianificazione. Restano tuttavia alcune limitazioni legate alla disponibilità dei dati e alle difficoltà di monitoraggio in presenza di rapidi avanzamenti tecnologici o di interruzioni significative nella catena di fornitura.

From visualization to prediction: dashboard design and statistical modelling of photovoltaic panel prices

Alliata, Andrea Filippo
2024/2025

Abstract

This thesis develops a comprehensive pipeline to explain and predict photovoltaic (PV) module costs. It connects supply-chain factors (upstream materials, manufacturing growth, operational efficiency) with deployment and macroeconomic impacts to provide a comprehensible explanation of price formation and short-term forecasts for procurement and planning. Regarding Data Architecture, a multi-year (2010-2024) dataset combines public and private investment series, innovation indicators (patents), capacity and generation statistics, supply chain proxies (polysilicon, copper, logistics), and performance metrics (capacity factor). A Power BI dashboard organizes descriptive analysis through the sequence of finance, innovation, assets and outputs; it categorizes by country, technology, and time, guiding variable selection. A specific case study converts global signals into localized local insights with GeoDa and Sunprime’s Company data. The inferential layer uses Generalized Least Squares (GLS) with a power-of-the-mean variance and AR(1) errors to stabilize elasticities and account for temporal dependency. Support Vector Regression (SVR) is applied for prediction and compared to basic time-series benchmarks. The main economic-technical drivers include polysilicon (upstream pressure), imports of semiconductor equipment (capital expenditure/line growth), wafer shipments, and capacity factor; copper, oil, and geopolitical risk indexes serve as controls. The operational process is structured in four phases: (1) Exploratory profiling utilizing the dashboard; (2) selection of drivers and correlations aligned with the PV value chain; (3) GLS estimation for resilience and scenario analysis; (4) time-sensitive validation and model selection for forecasts. GLS demonstrates solid indicators: polysilicon serves as the primary upward accelerator, factory expansion (equipment imports) has a negative influence, capacity factor has a positive contribution and wafer shipments exhibit a slight decline. In predictions, the linear Support Vector Regression (SVR) model is the most reliable and precise, outperforming persistence in the presence of minor trends and maintaining stability in out-of-sample evaluations. Regarding the contribution, the study provides a coherent approach that integrates interpretable responses (GLS) with operational short-term forecasting (SVR), further facilitating purchase and planning decisions. Limitations pertain to data accessibility and reporting difficulties with fast technological advancements or important disruptions in the supply chain.
ING - Scuola di Ingegneria Industriale e dell'Informazione
10-dic-2025
2024/2025
Questa tesi sviluppa un percorso completo per analizzare e prevedere i costi dei moduli fotovoltaici (PV). L’obiettivo è mettere in relazione i fattori della supply chain, come materie prime, crescita della capacità produttiva ed efficienza operativa, con gli effetti della diffusione della tecnologia e le dinamiche macroeconomiche. Inoltre, offre sia una lettura chiara della formazione dei prezzi, sia previsioni utili nel breve periodo per gli acquisti e la pianificazione nel contesto energetico mondiale. Dal punto di vista dei dati, è stato costruito un dataset pluriennale (ultimi 14 anni) che integra le variabili citate con fattori non strettamente legati alla produzione del pannello fotovoltaico. L’analisi descrittiva è stata organizzata in un cruscotto Power BI, che segue il filo conduttore finanza–innovazione–asset–output e che consente di classificare le informazioni per Paese, tecnologia e periodo, guidando così la selezione delle variabili. Un case study ha inoltre permesso di tradurre segnali globali in evidenze locali grazie all’uso di GeoDa e dei dati aziendali di Sunprime. La fase inferenziale impiega i Generalized Least Squares (GLS), con varianza proporzionale alla media ed errori AR(1), per stabilizzare le elasticità e catturare la dipendenza temporale. Per le previsioni è stato invece applicato un modello di Support Vector Regression (SVR), confrontato con benchmark di serie storiche più semplici. I principali driver economici e tecnici individuati sono il prezzo del polisilicio (fattore di pressione a monte), le importazioni di macchinari e semiconduttori (indicatore di espansione della capacità produttiva, con effetto negativo), le spedizioni di wafer e il capacity factor, mentre rame, petrolio e indici di rischio geopolitico sono stati considerati come variabili di controllo. Il processo operativo si articola in quattro fasi: (1) fase esplorativa dei dati tramite dashboard, (2) selezione dei driver e delle correlazioni lungo la supply chain del fotovoltaico, (3) stima con GLS per analisi di resilienza e scenari, (4) validazione temporale e scelta del modello per le previsioni. I risultati mostrano che il modello GLS restituisce indicatori solidi: il polisilicio emerge come principale fattore di crescita dei prezzi; l’espansione produttiva esercita un effetto negativo; il capacity factor contribuisce positivamente. Sul fronte delle previsioni, il modello lineare SVR si dimostra il più affidabile e preciso, superando le semplici strategie di persistenza quando sono presenti tendenze deboli e mantenendo stabilità anche fuori campione. In termini di contributo, lo studio propone un approccio coerente che integra risposte interpretabili (GLS) con previsioni operative di breve periodo (SVR), rendendo più agevoli le decisioni di acquisto e pianificazione. Restano tuttavia alcune limitazioni legate alla disponibilità dei dati e alle difficoltà di monitoraggio in presenza di rapidi avanzamenti tecnologici o di interruzioni significative nella catena di fornitura.
File allegati
File Dimensione Formato  
2025_12_Alliata_thesis.pdf

accessibile in internet per tutti

Descrizione: Thesis
Dimensione 5.1 MB
Formato Adobe PDF
5.1 MB Adobe PDF Visualizza/Apri
2025_12_Alliata_ExecutiveSummary.pdf

accessibile in internet per tutti

Descrizione: Executive Summary
Dimensione 1.71 MB
Formato Adobe PDF
1.71 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/246092