基于蜘蛛蜂算法优化
机器学习模型的
滑坡易发性评价方法

Spider Wasp Optimizer for Landslide Susceptibility Assessment

研究背景与意义

应用场景

以黑龙江省亚雪公路沿线边坡为研究对象,该旅游公路是冬季冰雪经济的重要交通枢纽。公路修建形成大量路堑边坡,一旦发生滑坡灾害将导致交通中断,直接影响游客安全和公路运营。

核心挑战

机器学习模型性能高度依赖于超参数选择,传统网格搜索算法计算效率低,而贝叶斯优化和进化算法在高维配置空间和有限评估预算下仍面临效率瓶颈。

蜘蛛蜂优化算法(SWO)

Spider Wasp Optimizer Algorithm

蜘蛛蜂优化算法是2023年提出的元启发式算法,具有强大的全局搜索和快速收敛能力,在避免模型陷入局部最优解方面表现出色。通过权衡概率(TR)动态调整狩猎、筑巢与交配行为,实现探索与开发阶段的良好平衡。

狩猎与筑巢

Hunting & Nesting

当随机数r < TR时,执行狩猎和筑巢行为,进行全局搜索,探索更广阔的解空间

交配行为

Mating Behavior

当随机数r ≥ TR时,执行交配行为,促使算法进行解的优化与精细搜索

动态平衡

Dynamic Balance

通过TR动态调整,在不同阶段有效平衡全局搜索与局部优化,加快收敛性能

研究方法框架

1

数据准备

  • • 收集487个滑坡样本点
  • • 提取8项评价因子
  • • 皮尔逊相关性筛选
  • • 信息量法选取负样本
2

超参数优化

  • • SWO优化RF模型
  • • SWO优化LightGBM
  • • SWO优化CatBoost
  • • 五折交叉验证
3

模型集成

  • • Stacking集成方法
  • • 4种组合形式
  • • 逻辑回归元学习器
  • • 性能对比评估
4

可解释性

  • • SHAP算法分析
  • • 全局特征重要性
  • • 局部样本解释
  • • 特征交互分析

优化后的机器学习模型

SWO-RF

基学习器数量:201

树的最大深度:9

最大特征数:1.0

AUC提升:2.2%

SWO-LightGBM

叶子节点数:82

学习率:0.2449

树的最大深度:9

AUC提升:2.4% ⭐最优

SWO-CatBoost

学习率:0.2357

树的最大深度:10

L2正则化:3.8595

AUC提升:1.6%

滑坡易发性评价因子体系

通过皮尔逊相关性分析筛选,从初始12个因子中剔除地形起伏度、地形粗糙度、年平均温度差异、高程等高相关性因子,最终确定8项评价因子作为评价指标体系。

坡度

主导因子,平均重要性最高

距道路距离

道路扩建切坡加剧失稳风险

年平均降雨量

关键诱发因素,增强失稳风险

距河流距离

地下水位抬升易引发滑坡

坡向

影响光照和水分分布

平面曲率

反映坡面形态特征

剖面曲率

凸型坡不易汇集地表水

岩性

花岗岩风化层厚度差异大

实验结果与性能评估

Experimental Results & Performance Evaluation

SWO-LightGBM

AUC值 0.939

⭐ 最优模型

准确率 0.865
精确率 0.890
召回率 0.832

SWO-CatBoost

AUC值 0.931
准确率 0.856
精确率 0.854
召回率 0.876

SWO-RF

AUC值 0.937
准确率 0.860
精确率 0.871
召回率 0.844

Stacking集成模型性能

Stacking1

0.924

RF + CatBoost

Stacking2

0.935

RF + LightGBM

Stacking3

0.932

LightGBM + CatBoost

Stacking4

0.933

RF + LightGBM + CatBoost

所有Stacking模型AUC值均低于SWO-LightGBM单模型(0.939)

SHAP可解释性分析

全局可解释性

特征重要性排序

  1. 1. 坡度(主导因子)
  2. 2. 距道路距离
  3. 3. 年平均降雨量
  4. 4. 距河流距离

特征交互分析

  • • 坡度↑ + 降雨量↑ → 正贡献
  • • 距道路近 + 降雨高 → 强协同
  • • 距河流远 + 降雨量 → 交互弱

局部可解释性

单个样本SHAP值分析

坡度 +2.92
距道路距离 +0.94
距河流距离 +0.77
平面曲率 +0.68

基准值-0.716,累加所有特征贡献后,模型准确预测该样本为滑坡样本

滑坡易发性空间分布特征

易发区面积占比(SWO-LightGBM)

低易发区 42.8%
较低易发区 19.2%
中易发区 13.7%
较高易发区 12.1%
高易发区 11.9%

距道路距离与易发性关系

以Ⅴ亚区为例,高易发区面积占比随距离变化:

0-100m 31.4%
100-200m 30.5%
200-300m 逐渐下降
>500m 1.4%