现有方法局限性
光谱指数法
代表方法
NDWI、MNDWI、AWEI
局限性
固定光谱先验、阈值敏感、泛化能力差
传统机器学习
代表方法
SVM、随机森林
局限性
浅层特征、依赖人工设计、语义信息不足
单一深度学习
代表方法
CNN、Transformer
局限性
CNN缺全局、Transformer缺细节
DBF-Net创新架构
Dual Backbone Fusion Network
基于双主干特征动态融合的语义分割模型,采用编码器-解码器架构,实现局部细节与全局语义的协同建模。
异构双主干
MobileNetV3 + Swin Transformer
动态融合模块
自适应加权特征对齐
链式ASPP
多尺度上下文聚合
三大核心创新
创新① 异构双流主干网络
MobileNetV3分支
轻量级CNN,提取高频局部空间细节与边界信息
Swin Transformer分支
层次化架构,捕获长程全局语义上下文
创新② 动态融合模块(DFM)
自适应加权机制
选择性强调有效特征,抑制噪声
异构特征对齐
解决CNN与Transformer特征域差异
创新③ 链式空洞空间金字塔池化(Chained-ASPP)
级联空洞卷积
不同膨胀率的空洞卷积级联
多尺度聚合
高效聚合多尺度上下文,增强鲁棒性
双主干架构优势对比
MobileNetV3优势
- 强大的局部细节捕获能力
- 高频边界信息提取
- 轻量级设计,计算高效
- 感受野受限,缺乏全局建模
Swin Transformer优势
- 卓越的全局语义建模能力
- 长程依赖关系捕获
- 层次化特征表示
- 缺乏归纳偏置,细节保留不足
协同效应
双主干并行设计有效弥补单一架构的表征缺陷,实现局部细节与全局语义的互补融合,显著提升复杂场景下的水体提取精度。
实验验证结果
在ESWKB(多样水体类型)和GID(复杂地表覆盖)两个公开数据集上,与6种SOTA方法进行对比验证。
ESWKB数据集
总体精度(OA)
99.15%
交并比(IoU)
96.34%
性能提升
IoU提升 0.15%~3.38%
GID数据集
总体精度(OA)
96.47%
交并比(IoU)
86.78%
性能提升
IoU提升 0.72%~4.45%
消融实验验证
在ESWKB数据集上验证双主干设计的有效性,对比单主干基线模型性能。
MobileNetV3单主干
基线模型
IoU提升
+2.16%
Swin Transformer单主干
基线模型
IoU提升
+2.07%
DBF-Net双主干
完整模型
最优性能
96.34%
视觉分析验证
显著改进
- 微小河流拓扑连通性显著提升
- 细长水系完整性增强
- 边界分割更加精细
抗干扰能力
- 有效抑制城市建筑阴影误检
- 减少山体阴影假阳性
- 复杂场景鲁棒性强