This study shows an application of left censored data analysis techniques to environmental data. In environmental monitoring studies, concentration measurements frequently fall below detection (LOD) or quantification limits (LOQ) of measuring instruments, resulting in left-censored data. Traditional methods to process this data are simple substitution with 0, LOQ or a fraction of LOQ, or censored data deleting. These techniques, however, have some disadvantages, since they are invasive methods, since they add an invasive signal to data that was not previously there. There are other methods, based on survival and reliability analysis techniques that allow to take into account the complete information present in the dataset, which are: the parametric method of maximum likelihood, the non parametric method of Kaplan-Meier and the method semi-parametric ROS. The inclusion of the censored data in the estimation of pollutant distributions allows a realistic representation of the presence of these compounds. This study considers water quality data set from the monitoring dataset of Milan city Drinking Water Supply system. Data derive from three monitoring point: wells, entering treatments train and drinking water entering supply. Drinking water treatment in the city of Milan takes place in 28 drinking water treatment plants, which collect groundwater. First temporal variability of groundwater dataset was assessed, in order to verify the presence of statistically significant trends. Then the cumulative distributions (CDF, Cumulative Probability Distribution) of each pollutant were evaluated. From the comparison between the curves and the percentiles of the CDF it was possible to draw information on concentration and time trends concerning the contamination in the water table of the treated water for drinking purposes and the management of plants. From the analysis of the perfluorinated compounds it was found that the most present compound is PFOA and that the highest concentrations are found in the first layer, concentrations in the waters captured by the plants are lower and the CAG activated carbon is an effective means for reducing the concentration. Concentrations measured in drinking water are lower than temporary regulation limit, but the possible regulation for these compounds makes it more important to carry out more in-depth research.

Spesso le misure di concentrazione di parametri di qualità dell’acqua risultano inferiori al limite di quantificazione (LOQ, Limit of Quantification) dello strumento di analisi e vengono classificate come censurate a sinistra: di esse si conosce solo che si trovano al di sotto di una soglia prestabilita, ma non se ne può definire la misura quantitativa. I metodi tradizionali più utilizzati per trattare questi dati sono la sostituzione semplice o l’esclusione dei dati censurati. Queste tecniche però presentano degli svantaggi, dal momento che sono tecniche invasive. Esistono altri metodi di analisi, che si basano su tecniche di survival e reliability analysis che consentono di tenere conto dell’informazione completa presente nel dataset. Questi sono: il metodo parametrico della massima verosimiglianza (MLE, Maximum Likelihood Estimation), il metodo non parametrico di Kaplan-Meier (KM) e il metodo semi-parametrico di regressione (ROS, Robust Regression on Order Statistics) (Helsel, 2012). L’inclusione dei dati censurati nella stima della concentrazione di inquinanti permette una realistica rappresentazione della presenza di questi composti. In particolare, la necessità del trattamento corretto dei dati censurati assume importanza fondamentale per l’analisi della presenza di contaminanti emergenti; questi contaminanti sono presenti in concentrazioni molto basse, prossime al LOQ dello strumento analitico, per cui per fornire una rappresentazione veritiera della loro presenza sono necessarie adeguate tecniche di analisi. Oggetto del presente lavoro di tesi è stata l’analisi del database di monitoraggio routinario di Metropolitana Milanese contenente cinque anni di dati (2012-2016) riferiti a sei contaminanti, tetracloroetilene (PCE), tricloroetilene (TCE), cloroformio, 2,6-diclorobenzammide (BAM), cromo totale e nitrato. I dati derivano da tre diversi punti di monitoraggio delle singole centrali di potabilizzazione: pozzi potabili, ingresso ai sistemi di trattamento e rubinetti di controllo qualità. Inoltre, è stata effettuata una campagna di analisi per la ricerca e la quantificazione di della presenza di composti perfluorurati (PFAS) nelle acque di prima falda attraverso il campionamento di 16 piezometri, in 24 pozzi delle centrali, in 40 punti agli ingressi e alle uscite dei trattamenti e in 17 rubinetti di controllo qualità. È stata valutata la variabilità temporale della concentrazione nelle acque di falda captate dalle centrali, al fine di verificare la presenza di trend statisticamente significativi. Sono state calcolate le statistiche descrittive della distribuzione di concentrazione per ciascun inquinante in ciascun punto di campionamento considerando il set di dati nella sua totalità. Dal confronto tra i percentili delle distribuzioni è stato possibile trarre informazioni circa la gestione delle centrali. I trattamenti presenti nelle centrali di potabilizzazione risultano efficaci nella rimozione dei composti organici, come evidenziato dalle elevate efficienze di rimozione, soprattutto per il PCE (superiori al 90%). Particolare attenzione va posta nelle centrali che presentano elevate concentrazioni di cromo totale, per un possibile superamento del limite normativo sul Cr(VI). Il trend in falda del nitrato non risulta in aumento, ma sono state evidenziate le centrali che presentano concentrazioni massime prossime al limite normativo. Dall’analisi dei composti perfluorurati è risultato che il composto più presente è l’acido perfluoroottanoico (PFOA) e che le concentrazioni più elevate si trovano nella prima falda, a suggerire una contaminazione derivante dalla presenza di industrie locali o di scambio con le acque superficiali. Le concentrazioni nelle acque captate dalle centrali risultano inferiori e il carbone attivo (GAC, Granular Activated Carbon) è un mezzo efficace per la riduzione della loro concentrazione. Le concentrazioni misurate nell’acqua potabile di Milano risultano inferiori ai limiti della Regione Veneto (D.G.R. n.168 del 20 febbraio 2014).

Un esempio di utilizzo di dati censurati nell'analisi del funzionamento delle centrali di potabilizzazione della città di Milano

GENTILE, ILARIA
2017/2018

Abstract

This study shows an application of left censored data analysis techniques to environmental data. In environmental monitoring studies, concentration measurements frequently fall below detection (LOD) or quantification limits (LOQ) of measuring instruments, resulting in left-censored data. Traditional methods to process this data are simple substitution with 0, LOQ or a fraction of LOQ, or censored data deleting. These techniques, however, have some disadvantages, since they are invasive methods, since they add an invasive signal to data that was not previously there. There are other methods, based on survival and reliability analysis techniques that allow to take into account the complete information present in the dataset, which are: the parametric method of maximum likelihood, the non parametric method of Kaplan-Meier and the method semi-parametric ROS. The inclusion of the censored data in the estimation of pollutant distributions allows a realistic representation of the presence of these compounds. This study considers water quality data set from the monitoring dataset of Milan city Drinking Water Supply system. Data derive from three monitoring point: wells, entering treatments train and drinking water entering supply. Drinking water treatment in the city of Milan takes place in 28 drinking water treatment plants, which collect groundwater. First temporal variability of groundwater dataset was assessed, in order to verify the presence of statistically significant trends. Then the cumulative distributions (CDF, Cumulative Probability Distribution) of each pollutant were evaluated. From the comparison between the curves and the percentiles of the CDF it was possible to draw information on concentration and time trends concerning the contamination in the water table of the treated water for drinking purposes and the management of plants. From the analysis of the perfluorinated compounds it was found that the most present compound is PFOA and that the highest concentrations are found in the first layer, concentrations in the waters captured by the plants are lower and the CAG activated carbon is an effective means for reducing the concentration. Concentrations measured in drinking water are lower than temporary regulation limit, but the possible regulation for these compounds makes it more important to carry out more in-depth research.
DELLI COMPAGNI, RICCARDO
MANENTI, ANGELA
ING I - Scuola di Ingegneria Civile, Ambientale e Territoriale
25-lug-2018
2017/2018
Spesso le misure di concentrazione di parametri di qualità dell’acqua risultano inferiori al limite di quantificazione (LOQ, Limit of Quantification) dello strumento di analisi e vengono classificate come censurate a sinistra: di esse si conosce solo che si trovano al di sotto di una soglia prestabilita, ma non se ne può definire la misura quantitativa. I metodi tradizionali più utilizzati per trattare questi dati sono la sostituzione semplice o l’esclusione dei dati censurati. Queste tecniche però presentano degli svantaggi, dal momento che sono tecniche invasive. Esistono altri metodi di analisi, che si basano su tecniche di survival e reliability analysis che consentono di tenere conto dell’informazione completa presente nel dataset. Questi sono: il metodo parametrico della massima verosimiglianza (MLE, Maximum Likelihood Estimation), il metodo non parametrico di Kaplan-Meier (KM) e il metodo semi-parametrico di regressione (ROS, Robust Regression on Order Statistics) (Helsel, 2012). L’inclusione dei dati censurati nella stima della concentrazione di inquinanti permette una realistica rappresentazione della presenza di questi composti. In particolare, la necessità del trattamento corretto dei dati censurati assume importanza fondamentale per l’analisi della presenza di contaminanti emergenti; questi contaminanti sono presenti in concentrazioni molto basse, prossime al LOQ dello strumento analitico, per cui per fornire una rappresentazione veritiera della loro presenza sono necessarie adeguate tecniche di analisi. Oggetto del presente lavoro di tesi è stata l’analisi del database di monitoraggio routinario di Metropolitana Milanese contenente cinque anni di dati (2012-2016) riferiti a sei contaminanti, tetracloroetilene (PCE), tricloroetilene (TCE), cloroformio, 2,6-diclorobenzammide (BAM), cromo totale e nitrato. I dati derivano da tre diversi punti di monitoraggio delle singole centrali di potabilizzazione: pozzi potabili, ingresso ai sistemi di trattamento e rubinetti di controllo qualità. Inoltre, è stata effettuata una campagna di analisi per la ricerca e la quantificazione di della presenza di composti perfluorurati (PFAS) nelle acque di prima falda attraverso il campionamento di 16 piezometri, in 24 pozzi delle centrali, in 40 punti agli ingressi e alle uscite dei trattamenti e in 17 rubinetti di controllo qualità. È stata valutata la variabilità temporale della concentrazione nelle acque di falda captate dalle centrali, al fine di verificare la presenza di trend statisticamente significativi. Sono state calcolate le statistiche descrittive della distribuzione di concentrazione per ciascun inquinante in ciascun punto di campionamento considerando il set di dati nella sua totalità. Dal confronto tra i percentili delle distribuzioni è stato possibile trarre informazioni circa la gestione delle centrali. I trattamenti presenti nelle centrali di potabilizzazione risultano efficaci nella rimozione dei composti organici, come evidenziato dalle elevate efficienze di rimozione, soprattutto per il PCE (superiori al 90%). Particolare attenzione va posta nelle centrali che presentano elevate concentrazioni di cromo totale, per un possibile superamento del limite normativo sul Cr(VI). Il trend in falda del nitrato non risulta in aumento, ma sono state evidenziate le centrali che presentano concentrazioni massime prossime al limite normativo. Dall’analisi dei composti perfluorurati è risultato che il composto più presente è l’acido perfluoroottanoico (PFOA) e che le concentrazioni più elevate si trovano nella prima falda, a suggerire una contaminazione derivante dalla presenza di industrie locali o di scambio con le acque superficiali. Le concentrazioni nelle acque captate dalle centrali risultano inferiori e il carbone attivo (GAC, Granular Activated Carbon) è un mezzo efficace per la riduzione della loro concentrazione. Le concentrazioni misurate nell’acqua potabile di Milano risultano inferiori ai limiti della Regione Veneto (D.G.R. n.168 del 20 febbraio 2014).
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_07_Gentile.pdf

non accessibile

Descrizione: Testo della tesi
Dimensione 7.63 MB
Formato Adobe PDF
7.63 MB Adobe PDF   Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/141534