DBF-Net:双主干特征动态融合的

遥感影像水体提取方法

研究背景与挑战

水体提取重要性

  • 水资源管理的基础
  • 洪涝灾害监测关键
  • 生态环境保护支撑
  • 气候变化研究基础

技术挑战

  • 水体形态差异大(河流、湖泊)
  • 阴影、沥青易混淆
  • 细小水体边界断裂
  • 复杂光照条件干扰

现有方法局限性

光谱指数法

代表方法

NDWI、MNDWI、AWEI

局限性

固定光谱先验、阈值敏感、泛化能力差

传统机器学习

代表方法

SVM、随机森林

局限性

浅层特征、依赖人工设计、语义信息不足

单一深度学习

代表方法

CNN、Transformer

局限性

CNN缺全局、Transformer缺细节

DBF-Net创新架构

Dual Backbone Fusion Network

基于双主干特征动态融合的语义分割模型,采用编码器-解码器架构,实现局部细节与全局语义的协同建模。

1

异构双主干

MobileNetV3 + Swin Transformer

2

动态融合模块

自适应加权特征对齐

3

链式ASPP

多尺度上下文聚合

三大核心创新

创新① 异构双流主干网络

MobileNetV3分支

轻量级CNN,提取高频局部空间细节与边界信息

Swin Transformer分支

层次化架构,捕获长程全局语义上下文

创新② 动态融合模块(DFM)

自适应加权机制

选择性强调有效特征,抑制噪声

异构特征对齐

解决CNN与Transformer特征域差异

创新③ 链式空洞空间金字塔池化(Chained-ASPP)

级联空洞卷积

不同膨胀率的空洞卷积级联

多尺度聚合

高效聚合多尺度上下文,增强鲁棒性

双主干架构优势对比

MobileNetV3优势

  • 强大的局部细节捕获能力
  • 高频边界信息提取
  • 轻量级设计,计算高效
  • 感受野受限,缺乏全局建模

Swin Transformer优势

  • 卓越的全局语义建模能力
  • 长程依赖关系捕获
  • 层次化特征表示
  • 缺乏归纳偏置,细节保留不足

协同效应

双主干并行设计有效弥补单一架构的表征缺陷,实现局部细节与全局语义的互补融合,显著提升复杂场景下的水体提取精度。

实验验证结果

ESWKB(多样水体类型)GID(复杂地表覆盖)两个公开数据集上,与6种SOTA方法进行对比验证。

ESWKB数据集

总体精度(OA)

99.15%

交并比(IoU)

96.34%

性能提升

IoU提升 0.15%~3.38%

GID数据集

总体精度(OA)

96.47%

交并比(IoU)

86.78%

性能提升

IoU提升 0.72%~4.45%

消融实验验证

在ESWKB数据集上验证双主干设计的有效性,对比单主干基线模型性能。

MobileNetV3单主干

基线模型

IoU提升

+2.16%

Swin Transformer单主干

基线模型

IoU提升

+2.07%

DBF-Net双主干

完整模型

最优性能

96.34%

视觉分析验证

显著改进

  • 微小河流拓扑连通性显著提升
  • 细长水系完整性增强
  • 边界分割更加精细

抗干扰能力

  • 有效抑制城市建筑阴影误检
  • 减少山体阴影假阳性
  • 复杂场景鲁棒性强

核心优势与创新

Core Advantages and Innovations

架构创新

  • 异构双主干并行设计
  • CNN与Transformer优势互补
  • 局部细节与全局语义协同

融合创新

  • 动态融合模块(DFM)
  • 自适应加权特征对齐
  • 异构特征深度互补

多尺度创新

  • 链式ASPP模块
  • 级联空洞卷积
  • 高效上下文聚合

性能对比优势

全面领先

相比Swin-Unet、SegFormer、CMTFNet等6种SOTA方法,在所有评价指标上均取得最优性能

鲁棒性强

在复杂城市、山地场景下有效抑制阴影干扰,显著提升细小水体提取精度