耦合多源环境速度场与动态火势风险的森林火灾安全路径规划方法

李建微 · 邓腾龙 · 张惠光 · 等地球信息科学学报 · 2026 · Vol.28 No.5 · pp.1187-1202 DOI: 10.12082/dqxxkx.2026.250598

森林火灾具有强动态性、多要素耦合的特征。在复杂的山地环境中，地形起伏、植被密度以及火势蔓延过程共同影响人员的通行效率与生命安全。本研究旨在开发一种面向森林火灾动态场景的速度—风险耦合场驱动路径规划方法（HNP-DuelingDQN）。该方法通过整合地形、植被、消防员速度场和火场蔓延风险，构建多源环境模型，协同优化路径的可行性、安全性与通行效率，为应急救援提供可量化的决策支撑。

森林火灾路径规划深度强化学习决斗网络速度场建模动态火势风险

向下滚动阅读

01 · 研究背景

森林火灾路径规划的挑战

传统的路径规划方法在面对快速演化的森林火灾时，存在明显的局限性，难以满足应急救援的动态安全需求。

静态性

难以响应快速演化

A*、Dijkstra、蚁群算法（ACO）等传统算法多基于静态代价栅格，难以实时响应火场的快速蔓延与环境变化。

维度单一

缺乏时空耦合刻画

现有研究多侧重于空间风险或环境约束，未能系统刻画人员运动过程与火场蔓延之间的复杂时空耦合关系。

安全性模糊

相对关系未显式考虑

路径安全性往往被隐式假定，缺乏显式考虑人员到达时间与火场蔓延到达时间之间的相对关系，导致高危风险。

本文目标

速度—风险耦合场驱动

整合地形、植被、消防员速度场和火场蔓延风险，协同优化路径的可行性、安全性与通行效率。

02 · 多源环境建模

时空耦合的环境场构建

研究通过整合地形、植被、气象等多源空间数据，构建了人员通行速度场和火场蔓延安全因子，量化时空风险。

人员行进速度场 (Velocity Field)

V = 1.662 - 1.076 × density - (5.191 × 10⁻³ × slope) - (1.127 × 10⁻³ × slope²)

V 为行进速度 (m/s)，受灌木盖度 (density) 和地形坡度 (slope) 影响。障碍物区域速度设为 0。

火场蔓延安全因子 (FSSF)

FSSF(x, y) = max { 0, τ_safe + T_agent(x, y) - T_fire(x, y) }

量化人员与火头到达某点的时间裕度。FSSF ≤ 0.5 为安全鲁棒区间；FSSF > 0.5 为高危临界区间。

03 · 强化学习框架

改进的 HNP-DuelingDQN 算法

采用决斗深度 Q 网络（Dueling DQN）作为基础架构，并引入多项核心改进以提升在复杂火场环境中的收敛速度和策略质量。

M1

HAS 启发式动作选择

在 ε-贪婪策略基础上引入启发式引导。探索时以 80% 概率选择随机动作，20% 概率选择朝向目标的启发式动作，平衡探索与利用。

Heuristic Action Selectionε-贪婪

M2

N-PER 优先经验回放

将未来 n 步的累计奖励作为学习目标，加速延迟奖励信号的传播；根据 TD 误差确定样本优先级，重点学习高价值、难预测的经验。

N-step 回报TD 误差

M3

CNN 局部感受块与复合奖励

提取包含坡度、速度、FSSF 等的局部 Patch 进行卷积特征提取。奖励函数融合了目标引导、通行速度、路径安全（惩罚低安全裕度）及事件完成状态。

局部感知复合奖励机制

04 · 实验设计与结果

性能对比与动态鲁棒性

选取福建省两处真实历史火场数据（德化县、大田县）进行验证，对比传统方法，展现出显著的性能优势。

17.4%~57.8%

最大 FSSF (风险) 降低

避险能力显著增强

13.4%~28.3%

平均速度 (效率) 提升

优先选择低植被低坡度

4.28 ms

单步在线决策耗时

满足实时响应需求

静态环境对比实验结果 (KPI)

评估指标	HNP-DuelingDQN 表现	相较于 HNP-DQN/ACO/A* 的优化
最大 FSSF (风险)	环境一: 0.190; 环境二: 0.060	风险降低约 17.4% ~ 57.8%
平均速度 (效率)	环境一: 0.596 m/s; 环境二: 0.523 m/s	速度提升约 13.4% ~ 28.3%
平均坡度 (地形)	环境一: 17.93°; 环境二: 19.03°	坡度降低约 11.0% ~ 29.9%

"在极高危动态环境下，HNP-DuelingDQN 算法表现出'以速度换安全'的智能策略，虽然速度略降，但安全裕度提升显著，且单步决策仅需 4.28 ms。"

05 · 结论与展望

核心突破与工程价值

本研究提出的方法在森林火灾场景下的路径规划中实现了多项目标的协同优化，具有极高的实战应用潜力。

时空耦合建模

通过 FSSF 显式表达了人火时空竞争关系，使安全性评估从静态空间转向动态过程。

多目标协同优化

成功平衡了避险（安全）、提速（效率）与顺势（地形适应性）三大应急救援核心需求。

极高工程价值

极短的决策耗时（4.28 ms）和对动态环境的强鲁棒性，证明了该方法在实际消防应急指挥中的应用潜力。

局限与未来展望

当前局限

目前模型主要在二维栅格环境中进行验证，未充分考虑三维地形的复杂立体结构。
模型依赖于预先获取的多源空间数据，对实时突发环境变化的直接感知能力有限。

未来展望

扩展至三维地形与更大空间尺度，提升模型的空间适应性。
结合无人机、激光雷达等实时感知数据，进一步提升模型的动态避障与实战化能力。