With the recent transformation in the electrical network, the role of the DSO became more significant and difficult, this work wants to explore the field of the analysis and forecasting of monthly substation’s load profile for planning purpose of new secondary substation in the mid-long term with machine learning techniques and in particularly it treats a real life case study focused on the city of Milan. For the purpose, a large amount of data was collected and integrated from different sources to properly describe every secondary substation. The new advance sensor systems are able to collect data every 15 minutes increasing dramatically the number of data available and that has to be processed in a proper way to unleash their true value. A briefly description of some machine learning approach (selected as suitable for the case under analysis) was given and some technique to improve their performances. We choose to use decision trees to process the data, make predictions and detect the most significant variables to characterize problem. The database was also integrated with geographical information derived with GIS software with a multiple purpose, to find if this new variables could help in the load forecasting and also to combining the secondary substation information with geographical reference, in fact this permit a better visualization of the situation and can help the DSO for multiple tasks of planning and organization. Results are obtained and compared for different type of decision trees to compare them to find the better solution for forecasting of monthly load profile and monthly maximum load for both single secondary substation and aggregate of them.

Con le recenti trasformazioni nel Sistema elettrico il ruolo del DSO è diventato sempre più significativo e difficile, questo lavoro vuole esplorare il campo dell’analisi e della previsione dei profili di carico mensili per le sottostazioni secondarie da utilizzare in ambito di pianificazione di nuove sottostazioni nel medio-lungo termine, con tecniche di machine learning e tratta il caso studio reale della città di Milano. Per far ciò, una grande quantità di dati è stata raccolta e integrata da diverse fonti per descrivere al meglio ogni stazione secondaria. I più avanzati sistemi di misura sono ormai in grado di collezionare dati ogni 15 minuti incrementando enormemente l’ammontare di dati disponibili che devono essere processati in maniera adeguata per sfruttare il loro valore nel migliore dei modi. Nella tesi viene fornita una descrizione di alcuni algoritmi di machine learning (selezionati in quanto adatti al caso in analisi) ed alcune tecniche per migliorare le loro performance. Abbiamo scelto di utilizzare gli alberi decisionali per processare i dati, ottenere previsioni e identificare le variabili più significative per la descrizione del problema. Il database è stato integrato con informazioni georeferenziate grazie ad un software GIS con plurimi obbiettivi, trovare nuove variabili che potessero aiutare nella previsione del carico e anche per georeferenziare le cabine secondarie in modo da permetterne una più intuitiva rappresentazione che possa aiutare il DSO nelle attività di programmazione e organizzazione. I risultati sono stati ottenuti per diverse tipologie di alberi decisionali e confrontati tra loro per identificare la soluzione migliore in termini di capacità di previsione del profilo di carico mensile e del carico massimo mensile richiesto, sia per le singole cabine secondarie che per aggregati di esse.

Machine learning and GIS approaches for electrical substation load forecast

VILLA, MANUEL
2018/2019

Abstract

With the recent transformation in the electrical network, the role of the DSO became more significant and difficult, this work wants to explore the field of the analysis and forecasting of monthly substation’s load profile for planning purpose of new secondary substation in the mid-long term with machine learning techniques and in particularly it treats a real life case study focused on the city of Milan. For the purpose, a large amount of data was collected and integrated from different sources to properly describe every secondary substation. The new advance sensor systems are able to collect data every 15 minutes increasing dramatically the number of data available and that has to be processed in a proper way to unleash their true value. A briefly description of some machine learning approach (selected as suitable for the case under analysis) was given and some technique to improve their performances. We choose to use decision trees to process the data, make predictions and detect the most significant variables to characterize problem. The database was also integrated with geographical information derived with GIS software with a multiple purpose, to find if this new variables could help in the load forecasting and also to combining the secondary substation information with geographical reference, in fact this permit a better visualization of the situation and can help the DSO for multiple tasks of planning and organization. Results are obtained and compared for different type of decision trees to compare them to find the better solution for forecasting of monthly load profile and monthly maximum load for both single secondary substation and aggregate of them.
BOSISIO, ALESSANDRO
MONCECCHI, MATTEO
ING - Scuola di Ingegneria Industriale e dell'Informazione
3-ott-2019
2018/2019
Con le recenti trasformazioni nel Sistema elettrico il ruolo del DSO è diventato sempre più significativo e difficile, questo lavoro vuole esplorare il campo dell’analisi e della previsione dei profili di carico mensili per le sottostazioni secondarie da utilizzare in ambito di pianificazione di nuove sottostazioni nel medio-lungo termine, con tecniche di machine learning e tratta il caso studio reale della città di Milano. Per far ciò, una grande quantità di dati è stata raccolta e integrata da diverse fonti per descrivere al meglio ogni stazione secondaria. I più avanzati sistemi di misura sono ormai in grado di collezionare dati ogni 15 minuti incrementando enormemente l’ammontare di dati disponibili che devono essere processati in maniera adeguata per sfruttare il loro valore nel migliore dei modi. Nella tesi viene fornita una descrizione di alcuni algoritmi di machine learning (selezionati in quanto adatti al caso in analisi) ed alcune tecniche per migliorare le loro performance. Abbiamo scelto di utilizzare gli alberi decisionali per processare i dati, ottenere previsioni e identificare le variabili più significative per la descrizione del problema. Il database è stato integrato con informazioni georeferenziate grazie ad un software GIS con plurimi obbiettivi, trovare nuove variabili che potessero aiutare nella previsione del carico e anche per georeferenziare le cabine secondarie in modo da permetterne una più intuitiva rappresentazione che possa aiutare il DSO nelle attività di programmazione e organizzazione. I risultati sono stati ottenuti per diverse tipologie di alberi decisionali e confrontati tra loro per identificare la soluzione migliore in termini di capacità di previsione del profilo di carico mensile e del carico massimo mensile richiesto, sia per le singole cabine secondarie che per aggregati di esse.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
Machine_learning_and_gis_approach_for_electrical_substation_load_forecast.pdf

non accessibile

Descrizione: Testo della tesi in pdf
Dimensione 4.61 MB
Formato Adobe PDF
4.61 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/149579