森林火灾具有强动态性、多要素耦合的特征。在复杂的山地环境中,地形起伏、植被密度以及火势蔓延过程共同影响人员的通行效率与生命安全。本研究旨在开发一种面向森林火灾动态场景的速度—风险耦合场驱动路径规划方法(HNP-DuelingDQN)。该方法通过整合地形、植被、消防员速度场和火场蔓延风险,构建多源环境模型,协同优化路径的可行性、安全性与通行效率,为应急救援提供可量化的决策支撑。
传统的路径规划方法在面对快速演化的森林火灾时,存在明显的局限性,难以满足应急救援的动态安全需求。
A*、Dijkstra、蚁群算法(ACO)等传统算法多基于静态代价栅格,难以实时响应火场的快速蔓延与环境变化。
现有研究多侧重于空间风险或环境约束,未能系统刻画人员运动过程与火场蔓延之间的复杂时空耦合关系。
路径安全性往往被隐式假定,缺乏显式考虑人员到达时间与火场蔓延到达时间之间的相对关系,导致高危风险。
整合地形、植被、消防员速度场和火场蔓延风险,协同优化路径的可行性、安全性与通行效率。
研究通过整合地形、植被、气象等多源空间数据,构建了人员通行速度场和火场蔓延安全因子,量化时空风险。
V 为行进速度 (m/s),受灌木盖度 (density) 和地形坡度 (slope) 影响。障碍物区域速度设为 0。
量化人员与火头到达某点的时间裕度。FSSF ≤ 0.5 为安全鲁棒区间;FSSF > 0.5 为高危临界区间。
采用决斗深度 Q 网络(Dueling DQN)作为基础架构,并引入多项核心改进以提升在复杂火场环境中的收敛速度和策略质量。
在 ε-贪婪策略基础上引入启发式引导。探索时以 80% 概率选择随机动作,20% 概率选择朝向目标的启发式动作,平衡探索与利用。
将未来 n 步的累计奖励作为学习目标,加速延迟奖励信号的传播;根据 TD 误差确定样本优先级,重点学习高价值、难预测的经验。
提取包含坡度、速度、FSSF 等的局部 Patch 进行卷积特征提取。奖励函数融合了目标引导、通行速度、路径安全(惩罚低安全裕度)及事件完成状态。
选取福建省两处真实历史火场数据(德化县、大田县)进行验证,对比传统方法,展现出显著的性能优势。
| 评估指标 | HNP-DuelingDQN 表现 | 相较于 HNP-DQN/ACO/A* 的优化 |
|---|---|---|
| 最大 FSSF (风险) | 环境一: 0.190; 环境二: 0.060 | 风险降低约 17.4% ~ 57.8% |
| 平均速度 (效率) | 环境一: 0.596 m/s; 环境二: 0.523 m/s | 速度提升约 13.4% ~ 28.3% |
| 平均坡度 (地形) | 环境一: 17.93°; 环境二: 19.03° | 坡度降低约 11.0% ~ 29.9% |
本研究提出的方法在森林火灾场景下的路径规划中实现了多项目标的协同优化,具有极高的实战应用潜力。
通过 FSSF 显式表达了人火时空竞争关系,使安全性评估从静态空间转向动态过程。
成功平衡了避险(安全)、提速(效率)与顺势(地形适应性)三大应急救援核心需求。
极短的决策耗时(4.28 ms)和对动态环境的强鲁棒性,证明了该方法在实际消防应急指挥中的应用潜力。