This paper refers to several mainstream mechanical learning methods to predict the occurrence of landslides. Based on the prediction and comparison of safety factor (FOS) by different machine learning methods, the most suitable machine learning method is found to predict the occurrence of landslide. The data of this study is mainly generated by the TRIGRS model, and the data set includes eight characteristics, including unit weight, cohesion, internal friction angle, slope angle, slope height, pore-water pressure ratio, rainfall duration and rainfall density. The whole machine learning (ML) model is mainly divided into data preprocessing and model evaluation. In data preprocessing, the linear transformation of the original data makes the result fall to the [0,1] interval to realize the standardization of the data. The evaluation 8 ML method is to learn the model based on a combination of different input parameters. Through evaluation indicators such as coefficient of determination (R^2), mean absolute error (MAE) and mean squared error (MSE). At the same time, the result of SLIP model as the reference to each ML method. Random forest (RF), adaboost regression (ABR) and gradient boosting decision trees (GBDT) were found to be the best prediction results. Moreover, the performance and reliability of nonlinear regression methods are generally better than those of linear regression methods. For the sensitivity of the parameters of the input model, the GBDT method was used to analyze and found that the slope angle was the most sensitive parameter. Finally, the area under the receiver operating characteristic (ROC) curve area under the curve (AUC) value, accuracy, and F-score are used to compare the models. GBDT has the highest AUC value, accuracy and F-score.

Il presente lavoro fa riferimento a diversi metodi di apprendimento meccanico mainstream per prevedere il verificarsi di frane. Sulla base della previsione e del confronto del fattore di sicurezza (FOS) con diversi metodi di apprendimento automatico, è stato individuato il metodo di apprendimento automatico più adatto per prevedere il verificarsi di una frana. I dati di questo studio sono generati principalmente dal modello TRIGRS e l'insieme dei dati comprende otto caratteristiche, tra cui il peso unitario, la coesione, l'angolo di attrito interno, l'angolo di pendenza, l'altezza del pendio, il rapporto di pressione dell'acqua di poro, la durata delle precipitazioni e la densità delle precipitazioni. L'intero modello di apprendimento automatico (ML) si divide principalmente in pre-elaborazione dei dati e valutazione del modello. Nella pre-elaborazione dei dati, la trasformazione lineare dei dati originali fa sì che il risultato ricada nell'intervallo [0,1] per realizzare la standardizzazione dei dati. La valutazione del metodo ML consiste nell'apprendere il modello sulla base di una combinazione di diversi parametri di input. Attraverso indicatori di valutazione come il coefficiente di determinazione (R^2), l'errore assoluto medio (MAE) e l'errore quadratico medio (MSE). Allo stesso tempo, il risultato del modello SLIP è stato preso come riferimento per ogni metodo ML. Random forest (RF), adaboost regression (ABR) e gradient boosting decision trees (GBDT) sono risultati i migliori risultati di previsione. Inoltre, le prestazioni e l'affidabilità dei metodi di regressione non lineare sono generalmente migliori di quelle dei metodi di regressione lineare. Per quanto riguarda la sensibilità dei parametri del modello di input, è stato utilizzato il metodo GBDT per l'analisi e si è riscontrato che l'angolo di pendenza è il parametro più sensibile. Infine, per confrontare i modelli sono stati utilizzati il valore dell'area sotto la curva caratteristica operativa del ricevitore (ROC), l'accuratezza e l'F-score. Il GBDT ha il valore AUC, l'accuratezza e l'F-score più elevati.

landslide prediction based on mechine learning methods

Jin, Zhuo
2022/2023

Abstract

This paper refers to several mainstream mechanical learning methods to predict the occurrence of landslides. Based on the prediction and comparison of safety factor (FOS) by different machine learning methods, the most suitable machine learning method is found to predict the occurrence of landslide. The data of this study is mainly generated by the TRIGRS model, and the data set includes eight characteristics, including unit weight, cohesion, internal friction angle, slope angle, slope height, pore-water pressure ratio, rainfall duration and rainfall density. The whole machine learning (ML) model is mainly divided into data preprocessing and model evaluation. In data preprocessing, the linear transformation of the original data makes the result fall to the [0,1] interval to realize the standardization of the data. The evaluation 8 ML method is to learn the model based on a combination of different input parameters. Through evaluation indicators such as coefficient of determination (R^2), mean absolute error (MAE) and mean squared error (MSE). At the same time, the result of SLIP model as the reference to each ML method. Random forest (RF), adaboost regression (ABR) and gradient boosting decision trees (GBDT) were found to be the best prediction results. Moreover, the performance and reliability of nonlinear regression methods are generally better than those of linear regression methods. For the sensitivity of the parameters of the input model, the GBDT method was used to analyze and found that the slope angle was the most sensitive parameter. Finally, the area under the receiver operating characteristic (ROC) curve area under the curve (AUC) value, accuracy, and F-score are used to compare the models. GBDT has the highest AUC value, accuracy and F-score.
ING I - Scuola di Ingegneria Civile, Ambientale e Territoriale
3-mag-2023
2022/2023
Il presente lavoro fa riferimento a diversi metodi di apprendimento meccanico mainstream per prevedere il verificarsi di frane. Sulla base della previsione e del confronto del fattore di sicurezza (FOS) con diversi metodi di apprendimento automatico, è stato individuato il metodo di apprendimento automatico più adatto per prevedere il verificarsi di una frana. I dati di questo studio sono generati principalmente dal modello TRIGRS e l'insieme dei dati comprende otto caratteristiche, tra cui il peso unitario, la coesione, l'angolo di attrito interno, l'angolo di pendenza, l'altezza del pendio, il rapporto di pressione dell'acqua di poro, la durata delle precipitazioni e la densità delle precipitazioni. L'intero modello di apprendimento automatico (ML) si divide principalmente in pre-elaborazione dei dati e valutazione del modello. Nella pre-elaborazione dei dati, la trasformazione lineare dei dati originali fa sì che il risultato ricada nell'intervallo [0,1] per realizzare la standardizzazione dei dati. La valutazione del metodo ML consiste nell'apprendere il modello sulla base di una combinazione di diversi parametri di input. Attraverso indicatori di valutazione come il coefficiente di determinazione (R^2), l'errore assoluto medio (MAE) e l'errore quadratico medio (MSE). Allo stesso tempo, il risultato del modello SLIP è stato preso come riferimento per ogni metodo ML. Random forest (RF), adaboost regression (ABR) e gradient boosting decision trees (GBDT) sono risultati i migliori risultati di previsione. Inoltre, le prestazioni e l'affidabilità dei metodi di regressione non lineare sono generalmente migliori di quelle dei metodi di regressione lineare. Per quanto riguarda la sensibilità dei parametri del modello di input, è stato utilizzato il metodo GBDT per l'analisi e si è riscontrato che l'angolo di pendenza è il parametro più sensibile. Infine, per confrontare i modelli sono stati utilizzati il valore dell'area sotto la curva caratteristica operativa del ricevitore (ROC), l'accuratezza e l'F-score. Il GBDT ha il valore AUC, l'accuratezza e l'F-score più elevati.
File allegati
File Dimensione Formato  
JIN ZHUO_Landslide prediction based on machine learning methods.pdf

Open Access dal 18/04/2024

Dimensione 2.33 MB
Formato Adobe PDF
2.33 MB Adobe PDF Visualizza/Apri

I documenti in POLITesi sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10589/199078