The ischemic stroke in Lombardy represents the second cause of emergency call to the national emergency number (112) and affects every about 18,000 people every year, over a total population of 10 million inhabitants. The disease manifests itself following the formation of a thrombus, due to arteriosclerosis or cardiac embolism, which occludes arterial vessels inside the brain, preventing the oxygenation of tissues. This condition is treatable through specific fibrinolytic therapies or by mechanical asportation of the thrombus performed in hospitals having a Stroke Unit and thus qualified for surgery. In the case of rapid action, ie within 4-6 hours, death can be prevented. In non-fatal cases, however, the patients can face permanent disabilities that lead to incalculable economic and human damage. Only the intervention carried out within one hour from the onset of symptoms is able to ward off long-term handikap and guarantee an almost certain recovery. Stroke death occurs as a result of cerebral anoxia, which damages the frontal lobe of the brain, being responsible for controlling the heartbeat. The disease is notoriously associated with a higher incidence in the population over 65 years and in a historical period in which the average age of the population is constantly increasing, the recorded cases of stroke, according to the data, seem to follow the same increasing trend. Therefore, the detailed study of this phenomenon assumes particular importance in relation to the possible triggering causes, so to circumscribe the areas at risk, draw up effective action plans and possibly predict the cases. In the literature, particular interest has been given to the identification of a link between stroke, meteorological factors and pollutants. The first researches in this sense date back to the beginning of the 2000s and in particular are attributable to [Hong Y. et al. 2002], which, by observing the data collected in the city of Seoul in the period between 1991 and 1997, concluded that TSP (total suspended particulate), SO2, NO2, CO and O3 were significantly attributable to an increase in the risk linked to onset of stroke due to the inflammatory action these pollutants exert on the organism. Other research work followed and other cities in the world were used as a basis for analysis. Most of these are roughly in agreement with what was discovered by [Hong Y. et al. 2002]. XVIII The aim of this thesis work, carried out in collaboration with AREU (Agenzia Regionale Emergenze Urgenze), is to propose an innovative approach in clinical studies. A Health Geomatics (namely the science that studies the medical phenomena associated with the territory ) framework is proposed to associate information on demography and atmospheric variables sampled in the reference environment directly to the patients’ records. A methodology typical of geomatics is used to try to obtain more reliable data from the qualitative point of view, using the resources available to offer a broader and more detailed view of the phenomena under investigation. This methodology is applied to the case of stroke registered in Lombardy in the years 2015-2017 and, in particular, it investigates the phenomenon by restricting it to the area of the city of Milan, which, counting on a population of over one million inhabitants, is particularly affected by the phenomenon. The territorial data used for the analysis are provided by ARPA (Agenzia Regionale per la Protezione dell’Ambiente) through the open data platform held by Regione Lombardia, while the data about strokes are provided, in an anonymised form, directly by AREU. The demographic information is obtained through the public web portal made available by ISTAT (Istituto Nazionale di STATistica). The phenomena investigated in this paper are: temperature, relative humidity, ozone, nitrogen dioxide, nitrogen oxides, carbon monoxide, benzene, PM10 and PM2.5. The choice is dictated by the fact that what is presented corresponds to the maximum selection of available variables. The records within the AREU database are geolocated and present the different locations of stroke events. The data were pre-processed in such a way as to give each of these records a value for each of the environmental variables under examination. A value has been assigned to all the variables studied for each of the 5 days of lag period prior to the event; this choice is due to studies in the literature, and in particular to [Guo P. et al. 2017], which identifies in the number 5 the maximum amount of days prior to the stroke within which significant correlations are identified with the studied parameters. In the analysis phase, the percentages of incidence of stroke events were assessed in relation to the province of residence, sex and age of the patient. Subsequently, the characteristic trends of the phenomenon were studied on he basis of three different granularities: hourly, daily and monthly, in order to highlight any cyclicity. In these first two phases of the analysis, the dataset provided by AREU was used in its entirety and the data were processed on a regional basis as the operations are not affected by the quality of interpolations for atmospheric variables. XIX On the other hand, the last analysis was focused on the correlation analysis between the stroke events and the environmental data interpolated with the Kriging method starting from the ARPA stations. For this last phase of the analysis it was decided to carry out a specific focus on the city of Milan, which thanks to the high density of environmental station present on the territory allows to obtain interpolations of great precision and at the same time counts a sample population suitable for the purpose. The correlation analysis was performed with three different granularities: first the daily stroke number was correlated with the average of the variables calculated on the basis of the interpolated values associated with each of the records (for each of the lag periods). This preliminary analysis allowed to verify if there was an association between the onset of stroke and the instantaneous values of the monitored parameters. Secondly, the number of strokes was reported to the daily averages of the city to see if daily exposure would play a decisive role in the manifestation of symptoms. Also in this case the 5 days of lag period prior to the call to 112 were taken into account. As a last resort, the aggregate cases count on a monthly basis was associated with the monthly average of the different monitored phenomena. This last phase aims to verify the existance of a dependency relation to be ascribed to a longer lasting exposure over time. All correlation analyzes, given the discrete domain of the variables under examination, were verified using Spearman's rank correlation. The obtained results show an increasing incidence during the three year period 2015-2017 in almost all the provinces in Lombardy and also prove that women are more interested in the phenomenon than men do. Specifically, it worth to highlight two distinct behaviors, which see the male population most affected in the age groups below 77 years, while over 78 years the situation is reversed. The most active time slots for the interventions provided by the 112 are those of the early morning, a period in which one most likely notice the symptoms after the night. The daily trend sees a predominance of the incidence in the working days while at the weekend there is a decrease of 8% in the number of cases. Yearly distribution of the events sees the maximum peak in the cold period of the year, from October to March, while there is a minimum in August, a month in which there is a strong increase in the departures for vacationers, a phenomenon that helps to reduce the sample population. Analysis results report a weak correlations in all the cases assessed on a daily basis, with at the very least a slight indication of causality given by pollutants such as NO2, NOx, benzene, PM10 and PM2.5, which although they appear to be the same pollutants reported in the XX literature, do not provide numbers high enough to be able to consider the results as indicative. On the other hand, the analysis carried out on a monthly basis shows moderate correlations with the variables previously mentioned, a sign that the correlation is to be found more in a long-term exposure rather than in the 5 days preceding the stroke. In conclusion, a Health Geomatics framework was developed for the correlation research between clinical data and environmental variables, presenting in detail the application to the case of stroke in Lombardy in the 2015-2017 three-year period. The results show that the purely environmental component is not the only triggering factor of the disease, which, as the data on the daily incidence indicate, could find fertile ground in exposure to work stress or other stress accumulated during the week. It has been shown that, among the analyzed granularities, that relating to long-term exposure, is the one to direct future and further investigations, possibly linking territorial analysis to biometric data and assessments on personal stress.

L’ictus ischemico in Lombardia rappresenta la seconda causa di chiamata al numero unico di emergenza (112) e colpisce ogni anno circa 18.000 persone su una popolazione totale di 10 milioni di abitanti. La patologia si manifesta in seguito alla formazione di un trombo, dovuto ad arteriosclerosi o ad embolia cardiaca, che occlude vasi arteriosi all’interno del cervello, impedendo di fatto l’ossigenazione dei tessuti. Questa condizione è trattabile tramite apposite terapie fibrinolitiche o mediante asportazione meccanica del trombo effettuata in ospedali attrezzati con Stroke Unit e dunque abilitati all’intervento. In caso di azione rapida, cioè entro 4-6 ore, si riesce a prevenire il decesso. Nei casi non fatali ci si trova comunque a dover affrontare disabilità permanenti che portano a danni economici ed umani incalcolabili. Solo la disostruzione effettuata entro al più un’ora dall’insorgenza dei sintomi è in grado di scongiurare handikap a lungo termine e di garantire un recupero prossimo al 100%. La morte per ictus sopraggiunge in seguito all’anossia cerebrale che danneggia il lobo frontale del cervello, responsabile delle attività di controllo del cuore. La malattia è notoriamente associata ad un’incidenza superiore nella popolazione over 65 anni e in un periodo storico in cui l’età media della popolazione è in costante aumento, i casi di ictus registrati, stando ai dati, sembrano seguire il medesimo andamento crescente. Assume dunque una particolare importanza lo studio dettagliato di questo fenomeno in relazione alle possibili cause scatenanti, così da circoscrivere le aree a rischio, stilare piani d’intervento efficaci e possibilmente predire i casi. In letteratura, particolare interesse è stato dato all’individuazione di un legame tra ictus, fattori meteorologici ed agenti inquinanti. Le prime ricerche in tal senso risalgono agli inizia degli anni 2000 ed in particolare sono attribuibili a [Hong Y. et al. 2002], che osservando i dati raccolti nella città di Seoul nel periodo compreso tra il 1991 e il 1997 giungeva alla conclusione che TSP (particolato totale sospeso), SO2, NO2, CO e O3 fossero significativamente riconducibili ad un incremento del rischio collegato all’insorgenza di ictus per via dell’azione infiammatoria che questi inquinanti esercitano sull’organismo. XIV Altri lavori di ricerca si sono succeduti ed altre città del mondo sono state utilizzate come base per le analisi. La maggior parte di queste si trova grossomodo concorde con quanto scoperto da [Hong Y. et al. 2002]. Lo scopo di questo lavoro di tesi, svolto in collaborazione con AREU (Agenzia Regionale Emergenze urgenze), è quello di proporre un approccio innovativo nell’ambito degli studi clinici. Si propone infatti un framework di Health Geomatics, ossia la scienza che studia i fenomeni medici associati al territorio, che riconduca ai record dei pazienti informazioni sulla demografia e sulle variabili atmosferiche campionate nell’ambiente di riferimento. Si usano metodologie tipiche della geomatica per cercare di ottenere dati più affidabili dal punto di vista qualitativo, sfruttando le risorse a disposizione per offrire una visione più ampia e dettagliata dei fenomeni sotto indagine. Questa metodologia viene applicata al caso degli ictus registrati in Lombardia negli anni 2015-2017 ed in particolare indaga il fenomeno restringendolo all’area della città di Milano, che con una popolazione di oltre un milione di abitanti risulta particolarmente interessata dal fenomeno. I dati territoriali utilizzati sono forniti da ARPA (Agenzia Regionale per la Protezione dell’Ambiente) tramite la piattaforma open data della Regione Lombardia mente i dati sugli ictus sono forniti, in forma anonimizzata, direttamente da AREU. Le informazioni demografiche sono reperite tramite il portale web pubblico messo a disposizione da ISTAT (Istituto nazionale di STATistica). I fenomeni indagati in questo elaborato sono: temperatura, umidità relativa, ozono, biossido di azoto, ossidi di azoto, monossido di carbonio, benzene, PM10 e PM2.5. La scelta è dettata dal fatto che quanto presentato corrisponda alla massima selezione di fenomeni possibile. I record all’interno del database AREU sono geolocalizzati e presentano le diverse posizioni degli eventi di ictus. I dati sono stati pre-processati in modo da attribuire a ciascuno di questi record un valore per ognuna delle variabili ambientali sotto esame. E’ stato attribuito un valore a tutte le variabili studiate per ognuno dei 5 giorni di lag period antecedenti all’evento; tale scelta è da ricondurre agli studi in letteratura, ed in particolare a [Guo P. et al. 2017], che individua in 5 il numero massimo di giorni antecedenti all’ictus entro cui si individuano correlazioni significative con i parametri studiati. Nella fase di analisi si sono valutate innanzitutto le percentuali di incidenza degli eventi di ictus in relazione alla provincia di residenza, al sesso e all’età del paziente. In seguito si sono studiati i trend caratteristici del fenomeno, scomponendolo secondo tre diverse granularità: oraria, giornaliera e mensile, in modo da mettere in luce eventuali ciclicità. XV In queste prime due fasi dell’analisi, il dataset fornito da AREU è stato utilizzato nella sua completezza e i dati sono stati elaborati su base regionale in quanto le operazioni non risultano inficiate dalla qualità delle interpolazioni per le variabili atmosferiche. L’ultimo spunto d’analisi ha invece visto protagonista l’analisi di correlazione tra gli eventi di ictus ed i dati ambientali interpolati con metodo Kriging a partire dalle centraline ARPA. Per quest’ultima fase dell’analisi si è deciso di effettuare un focus specifico sulla città di Milano, che grazie all’elevata densità di centraline presenti sul territorio consente di ottenere interpolazioni di grande precisione e allo stesso tempo conta una popolazione campione adatta allo scopo. L’analisi di correlazione è stata eseguita con tre granularità differenti: dapprima si è correlato il numero di ictus giornaliero con la media calcolata sulla base dei valori interpolati e associati a ciascuno dei record (per ognuno dei lag period). Questa analisi preliminare ha permesso di verificare se sussistesse un’associazione tra l’insorgenza di ictus ed i valori istantanei delle variabili. In secondo luogo si è proceduto nel relazionare il numero di ictus alle medie giornaliere della città per verificare se fosse invece l’esposizione giornaliera a svolgere un ruolo determinante nella manifestazione dei sintomi. Anche in questo caso si è tenuto conto dei 5 giorni di lag period antecedenti alla chiamata al 112. In ultima istanza si è invece proceduto ad associare il conteggio dei casi aggregati su base mensile alle medie, sempre mensili, dei diversi fenomeni monitorati. Quest’ultima fase ha lo scopo di verificare se l’insorgenza della patologia non sia dovuta ad un’interazione con le variabili ambientali che ecceda i 5 giorni noti in letteratura e sia dunque da ascrivere ad un’esposizione più duratura nel tempo. Tutte le analisi di correlazione, visto il dominio discreto delle variabili in esame, sono state verificate usando la correlazione a ranghi di Spearman. I risultati ottenuti mostrano un’incidenza in costante aumento durante il triennio 2015-2017 in pressoché tutte le province lombarde e le donne risultano essere più interessate dal fenomeno rispetto agli uomini. Entrando nello specifico si evidenziano due comportamenti distinti, che vedono la popolazione maschile più colpita nelle fasce d’età al di sotto dei 77 anni mentre superati i 78 anni la situazione si inverte. Le fasce orarie più attive per quanto riguarda gli interventi erogati dal 112 sono quelle della prima mattinata, periodo in cui verosimilmente ci si accorge dei sintomi dopo la notte. Il trend giornaliero vede una predominanza dell’incidenza nei giorni lavorativi mentre nel fine settimana si assiste ad un calo dell’8% nel numero dei casi. Annualmente si assiste ad una distribuzione che vede i picchi massimi nel periodo freddo dell’anno, da ottobre a marzo, mentre si assiste ad un minimo in corrispondenza di agosto, XVI mese nel quale si registra tuttavia un forte aumento nelle partenze dei vacanzieri, fenomeno che contribuisce a ridurre la popolazione campione. Per quanto riguarda l’analisi di correlazione ci si trova di fronte a correlazioni deboli in tutti i casi valutati su base giornaliera, con al più una leggera indicazione di causalità data dagli inquinanti quali NO2, NOx, benzene, PM10 e PM2.5, che sebbene risultino essere i medesimi inquinanti riportati in letteratura, non forniscono numeri tali da poter considerare indicativi i risultati ottenuti. L’analisi effettuata su base mensile mostra invece correlazioni moderate con le variabili sopra citate, segno che effettivamente la correlazione è da ricercarsi più in un ‘esposizione a lungo termine piuttosto che non nei 5 giorni precedenti all’ictus. In conclusione, si è sviluppato un framework di Health Geomatics per la ricerca di correlazione tra i dati clinici e le variabili ambientali, presentando nel dettaglio l’applicazione al caso degli ictus in Lombardia nel triennio 2015-2017. I risultati mostrano come la componente puramente ambientale non sia il solo fattore scatenante della patologia, che come indicano i dati sull’incidenza giornaliera, potrebbe trovare terreno fertile nell’esposizione a stress lavorativo o di altra natura accumulato in settimana. Si è mostrato come, tra le granularità analizzate, quella relativa all’esposizione a lungo termine risulti tuttavia la strada verso cui dirigere futuri ed ulteriori approfondimenti, legando possibilmente le analisi territoriali ai dati biometrici e alle valutazioni sullo stress personale.

Sviluppo di un framework di Health Geomatics per la correlazione di variabili ambientali ed eventi clinici : il caso ictus in Lombardia

CATTANEO, DAVIDE
2017/2018

Abstract

The ischemic stroke in Lombardy represents the second cause of emergency call to the national emergency number (112) and affects every about 18,000 people every year, over a total population of 10 million inhabitants. The disease manifests itself following the formation of a thrombus, due to arteriosclerosis or cardiac embolism, which occludes arterial vessels inside the brain, preventing the oxygenation of tissues. This condition is treatable through specific fibrinolytic therapies or by mechanical asportation of the thrombus performed in hospitals having a Stroke Unit and thus qualified for surgery. In the case of rapid action, ie within 4-6 hours, death can be prevented. In non-fatal cases, however, the patients can face permanent disabilities that lead to incalculable economic and human damage. Only the intervention carried out within one hour from the onset of symptoms is able to ward off long-term handikap and guarantee an almost certain recovery. Stroke death occurs as a result of cerebral anoxia, which damages the frontal lobe of the brain, being responsible for controlling the heartbeat. The disease is notoriously associated with a higher incidence in the population over 65 years and in a historical period in which the average age of the population is constantly increasing, the recorded cases of stroke, according to the data, seem to follow the same increasing trend. Therefore, the detailed study of this phenomenon assumes particular importance in relation to the possible triggering causes, so to circumscribe the areas at risk, draw up effective action plans and possibly predict the cases. In the literature, particular interest has been given to the identification of a link between stroke, meteorological factors and pollutants. The first researches in this sense date back to the beginning of the 2000s and in particular are attributable to [Hong Y. et al. 2002], which, by observing the data collected in the city of Seoul in the period between 1991 and 1997, concluded that TSP (total suspended particulate), SO2, NO2, CO and O3 were significantly attributable to an increase in the risk linked to onset of stroke due to the inflammatory action these pollutants exert on the organism. Other research work followed and other cities in the world were used as a basis for analysis. Most of these are roughly in agreement with what was discovered by [Hong Y. et al. 2002]. XVIII The aim of this thesis work, carried out in collaboration with AREU (Agenzia Regionale Emergenze Urgenze), is to propose an innovative approach in clinical studies. A Health Geomatics (namely the science that studies the medical phenomena associated with the territory ) framework is proposed to associate information on demography and atmospheric variables sampled in the reference environment directly to the patients’ records. A methodology typical of geomatics is used to try to obtain more reliable data from the qualitative point of view, using the resources available to offer a broader and more detailed view of the phenomena under investigation. This methodology is applied to the case of stroke registered in Lombardy in the years 2015-2017 and, in particular, it investigates the phenomenon by restricting it to the area of the city of Milan, which, counting on a population of over one million inhabitants, is particularly affected by the phenomenon. The territorial data used for the analysis are provided by ARPA (Agenzia Regionale per la Protezione dell’Ambiente) through the open data platform held by Regione Lombardia, while the data about strokes are provided, in an anonymised form, directly by AREU. The demographic information is obtained through the public web portal made available by ISTAT (Istituto Nazionale di STATistica). The phenomena investigated in this paper are: temperature, relative humidity, ozone, nitrogen dioxide, nitrogen oxides, carbon monoxide, benzene, PM10 and PM2.5. The choice is dictated by the fact that what is presented corresponds to the maximum selection of available variables. The records within the AREU database are geolocated and present the different locations of stroke events. The data were pre-processed in such a way as to give each of these records a value for each of the environmental variables under examination. A value has been assigned to all the variables studied for each of the 5 days of lag period prior to the event; this choice is due to studies in the literature, and in particular to [Guo P. et al. 2017], which identifies in the number 5 the maximum amount of days prior to the stroke within which significant correlations are identified with the studied parameters. In the analysis phase, the percentages of incidence of stroke events were assessed in relation to the province of residence, sex and age of the patient. Subsequently, the characteristic trends of the phenomenon were studied on he basis of three different granularities: hourly, daily and monthly, in order to highlight any cyclicity. In these first two phases of the analysis, the dataset provided by AREU was used in its entirety and the data were processed on a regional basis as the operations are not affected by the quality of interpolations for atmospheric variables. XIX On the other hand, the last analysis was focused on the correlation analysis between the stroke events and the environmental data interpolated with the Kriging method starting from the ARPA stations. For this last phase of the analysis it was decided to carry out a specific focus on the city of Milan, which thanks to the high density of environmental station present on the territory allows to obtain interpolations of great precision and at the same time counts a sample population suitable for the purpose. The correlation analysis was performed with three different granularities: first the daily stroke number was correlated with the average of the variables calculated on the basis of the interpolated values associated with each of the records (for each of the lag periods). This preliminary analysis allowed to verify if there was an association between the onset of stroke and the instantaneous values of the monitored parameters. Secondly, the number of strokes was reported to the daily averages of the city to see if daily exposure would play a decisive role in the manifestation of symptoms. Also in this case the 5 days of lag period prior to the call to 112 were taken into account. As a last resort, the aggregate cases count on a monthly basis was associated with the monthly average of the different monitored phenomena. This last phase aims to verify the existance of a dependency relation to be ascribed to a longer lasting exposure over time. All correlation analyzes, given the discrete domain of the variables under examination, were verified using Spearman's rank correlation. The obtained results show an increasing incidence during the three year period 2015-2017 in almost all the provinces in Lombardy and also prove that women are more interested in the phenomenon than men do. Specifically, it worth to highlight two distinct behaviors, which see the male population most affected in the age groups below 77 years, while over 78 years the situation is reversed. The most active time slots for the interventions provided by the 112 are those of the early morning, a period in which one most likely notice the symptoms after the night. The daily trend sees a predominance of the incidence in the working days while at the weekend there is a decrease of 8% in the number of cases. Yearly distribution of the events sees the maximum peak in the cold period of the year, from October to March, while there is a minimum in August, a month in which there is a strong increase in the departures for vacationers, a phenomenon that helps to reduce the sample population. Analysis results report a weak correlations in all the cases assessed on a daily basis, with at the very least a slight indication of causality given by pollutants such as NO2, NOx, benzene, PM10 and PM2.5, which although they appear to be the same pollutants reported in the XX literature, do not provide numbers high enough to be able to consider the results as indicative. On the other hand, the analysis carried out on a monthly basis shows moderate correlations with the variables previously mentioned, a sign that the correlation is to be found more in a long-term exposure rather than in the 5 days preceding the stroke. In conclusion, a Health Geomatics framework was developed for the correlation research between clinical data and environmental variables, presenting in detail the application to the case of stroke in Lombardy in the 2015-2017 three-year period. The results show that the purely environmental component is not the only triggering factor of the disease, which, as the data on the daily incidence indicate, could find fertile ground in exposure to work stress or other stress accumulated during the week. It has been shown that, among the analyzed granularities, that relating to long-term exposure, is the one to direct future and further investigations, possibly linking territorial analysis to biometric data and assessments on personal stress.
ING - Scuola di Ingegneria Industriale e dell'Informazione
20-dic-2018
2017/2018
L’ictus ischemico in Lombardia rappresenta la seconda causa di chiamata al numero unico di emergenza (112) e colpisce ogni anno circa 18.000 persone su una popolazione totale di 10 milioni di abitanti. La patologia si manifesta in seguito alla formazione di un trombo, dovuto ad arteriosclerosi o ad embolia cardiaca, che occlude vasi arteriosi all’interno del cervello, impedendo di fatto l’ossigenazione dei tessuti. Questa condizione è trattabile tramite apposite terapie fibrinolitiche o mediante asportazione meccanica del trombo effettuata in ospedali attrezzati con Stroke Unit e dunque abilitati all’intervento. In caso di azione rapida, cioè entro 4-6 ore, si riesce a prevenire il decesso. Nei casi non fatali ci si trova comunque a dover affrontare disabilità permanenti che portano a danni economici ed umani incalcolabili. Solo la disostruzione effettuata entro al più un’ora dall’insorgenza dei sintomi è in grado di scongiurare handikap a lungo termine e di garantire un recupero prossimo al 100%. La morte per ictus sopraggiunge in seguito all’anossia cerebrale che danneggia il lobo frontale del cervello, responsabile delle attività di controllo del cuore. La malattia è notoriamente associata ad un’incidenza superiore nella popolazione over 65 anni e in un periodo storico in cui l’età media della popolazione è in costante aumento, i casi di ictus registrati, stando ai dati, sembrano seguire il medesimo andamento crescente. Assume dunque una particolare importanza lo studio dettagliato di questo fenomeno in relazione alle possibili cause scatenanti, così da circoscrivere le aree a rischio, stilare piani d’intervento efficaci e possibilmente predire i casi. In letteratura, particolare interesse è stato dato all’individuazione di un legame tra ictus, fattori meteorologici ed agenti inquinanti. Le prime ricerche in tal senso risalgono agli inizia degli anni 2000 ed in particolare sono attribuibili a [Hong Y. et al. 2002], che osservando i dati raccolti nella città di Seoul nel periodo compreso tra il 1991 e il 1997 giungeva alla conclusione che TSP (particolato totale sospeso), SO2, NO2, CO e O3 fossero significativamente riconducibili ad un incremento del rischio collegato all’insorgenza di ictus per via dell’azione infiammatoria che questi inquinanti esercitano sull’organismo. XIV Altri lavori di ricerca si sono succeduti ed altre città del mondo sono state utilizzate come base per le analisi. La maggior parte di queste si trova grossomodo concorde con quanto scoperto da [Hong Y. et al. 2002]. Lo scopo di questo lavoro di tesi, svolto in collaborazione con AREU (Agenzia Regionale Emergenze urgenze), è quello di proporre un approccio innovativo nell’ambito degli studi clinici. Si propone infatti un framework di Health Geomatics, ossia la scienza che studia i fenomeni medici associati al territorio, che riconduca ai record dei pazienti informazioni sulla demografia e sulle variabili atmosferiche campionate nell’ambiente di riferimento. Si usano metodologie tipiche della geomatica per cercare di ottenere dati più affidabili dal punto di vista qualitativo, sfruttando le risorse a disposizione per offrire una visione più ampia e dettagliata dei fenomeni sotto indagine. Questa metodologia viene applicata al caso degli ictus registrati in Lombardia negli anni 2015-2017 ed in particolare indaga il fenomeno restringendolo all’area della città di Milano, che con una popolazione di oltre un milione di abitanti risulta particolarmente interessata dal fenomeno. I dati territoriali utilizzati sono forniti da ARPA (Agenzia Regionale per la Protezione dell’Ambiente) tramite la piattaforma open data della Regione Lombardia mente i dati sugli ictus sono forniti, in forma anonimizzata, direttamente da AREU. Le informazioni demografiche sono reperite tramite il portale web pubblico messo a disposizione da ISTAT (Istituto nazionale di STATistica). I fenomeni indagati in questo elaborato sono: temperatura, umidità relativa, ozono, biossido di azoto, ossidi di azoto, monossido di carbonio, benzene, PM10 e PM2.5. La scelta è dettata dal fatto che quanto presentato corrisponda alla massima selezione di fenomeni possibile. I record all’interno del database AREU sono geolocalizzati e presentano le diverse posizioni degli eventi di ictus. I dati sono stati pre-processati in modo da attribuire a ciascuno di questi record un valore per ognuna delle variabili ambientali sotto esame. E’ stato attribuito un valore a tutte le variabili studiate per ognuno dei 5 giorni di lag period antecedenti all’evento; tale scelta è da ricondurre agli studi in letteratura, ed in particolare a [Guo P. et al. 2017], che individua in 5 il numero massimo di giorni antecedenti all’ictus entro cui si individuano correlazioni significative con i parametri studiati. Nella fase di analisi si sono valutate innanzitutto le percentuali di incidenza degli eventi di ictus in relazione alla provincia di residenza, al sesso e all’età del paziente. In seguito si sono studiati i trend caratteristici del fenomeno, scomponendolo secondo tre diverse granularità: oraria, giornaliera e mensile, in modo da mettere in luce eventuali ciclicità. XV In queste prime due fasi dell’analisi, il dataset fornito da AREU è stato utilizzato nella sua completezza e i dati sono stati elaborati su base regionale in quanto le operazioni non risultano inficiate dalla qualità delle interpolazioni per le variabili atmosferiche. L’ultimo spunto d’analisi ha invece visto protagonista l’analisi di correlazione tra gli eventi di ictus ed i dati ambientali interpolati con metodo Kriging a partire dalle centraline ARPA. Per quest’ultima fase dell’analisi si è deciso di effettuare un focus specifico sulla città di Milano, che grazie all’elevata densità di centraline presenti sul territorio consente di ottenere interpolazioni di grande precisione e allo stesso tempo conta una popolazione campione adatta allo scopo. L’analisi di correlazione è stata eseguita con tre granularità differenti: dapprima si è correlato il numero di ictus giornaliero con la media calcolata sulla base dei valori interpolati e associati a ciascuno dei record (per ognuno dei lag period). Questa analisi preliminare ha permesso di verificare se sussistesse un’associazione tra l’insorgenza di ictus ed i valori istantanei delle variabili. In secondo luogo si è proceduto nel relazionare il numero di ictus alle medie giornaliere della città per verificare se fosse invece l’esposizione giornaliera a svolgere un ruolo determinante nella manifestazione dei sintomi. Anche in questo caso si è tenuto conto dei 5 giorni di lag period antecedenti alla chiamata al 112. In ultima istanza si è invece proceduto ad associare il conteggio dei casi aggregati su base mensile alle medie, sempre mensili, dei diversi fenomeni monitorati. Quest’ultima fase ha lo scopo di verificare se l’insorgenza della patologia non sia dovuta ad un’interazione con le variabili ambientali che ecceda i 5 giorni noti in letteratura e sia dunque da ascrivere ad un’esposizione più duratura nel tempo. Tutte le analisi di correlazione, visto il dominio discreto delle variabili in esame, sono state verificate usando la correlazione a ranghi di Spearman. I risultati ottenuti mostrano un’incidenza in costante aumento durante il triennio 2015-2017 in pressoché tutte le province lombarde e le donne risultano essere più interessate dal fenomeno rispetto agli uomini. Entrando nello specifico si evidenziano due comportamenti distinti, che vedono la popolazione maschile più colpita nelle fasce d’età al di sotto dei 77 anni mentre superati i 78 anni la situazione si inverte. Le fasce orarie più attive per quanto riguarda gli interventi erogati dal 112 sono quelle della prima mattinata, periodo in cui verosimilmente ci si accorge dei sintomi dopo la notte. Il trend giornaliero vede una predominanza dell’incidenza nei giorni lavorativi mentre nel fine settimana si assiste ad un calo dell’8% nel numero dei casi. Annualmente si assiste ad una distribuzione che vede i picchi massimi nel periodo freddo dell’anno, da ottobre a marzo, mentre si assiste ad un minimo in corrispondenza di agosto, XVI mese nel quale si registra tuttavia un forte aumento nelle partenze dei vacanzieri, fenomeno che contribuisce a ridurre la popolazione campione. Per quanto riguarda l’analisi di correlazione ci si trova di fronte a correlazioni deboli in tutti i casi valutati su base giornaliera, con al più una leggera indicazione di causalità data dagli inquinanti quali NO2, NOx, benzene, PM10 e PM2.5, che sebbene risultino essere i medesimi inquinanti riportati in letteratura, non forniscono numeri tali da poter considerare indicativi i risultati ottenuti. L’analisi effettuata su base mensile mostra invece correlazioni moderate con le variabili sopra citate, segno che effettivamente la correlazione è da ricercarsi più in un ‘esposizione a lungo termine piuttosto che non nei 5 giorni precedenti all’ictus. In conclusione, si è sviluppato un framework di Health Geomatics per la ricerca di correlazione tra i dati clinici e le variabili ambientali, presentando nel dettaglio l’applicazione al caso degli ictus in Lombardia nel triennio 2015-2017. I risultati mostrano come la componente puramente ambientale non sia il solo fattore scatenante della patologia, che come indicano i dati sull’incidenza giornaliera, potrebbe trovare terreno fertile nell’esposizione a stress lavorativo o di altra natura accumulato in settimana. Si è mostrato come, tra le granularità analizzate, quella relativa all’esposizione a lungo termine risulti tuttavia la strada verso cui dirigere futuri ed ulteriori approfondimenti, legando possibilmente le analisi territoriali ai dati biometrici e alle valutazioni sullo stress personale.
Tesi di laurea Magistrale
File allegati
File Dimensione Formato  
2018_12_Cattaneo.pdf

accessibile in internet per tutti

Descrizione: Testo della tesi
Dimensione 5.55 MB
Formato Adobe PDF
5.55 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/144821