基于YOLOv11框架的
多尺度特征协同与情景感知
遥感目标检测算法

Multi-scale Feature Collaboration & Context-Aware Remote Sensing Detection

研究背景与挑战

核心挑战

  • 小目标检测:高分辨率遥感图像中小目标特征易被噪声淹没
  • 复杂背景处理:背景与目标在频谱分布高度重叠
  • 密集目标分布:目标尺度差异大,定位精度要求高

现有方法局限

  • 多尺度特征融合对小目标的特征增强不足
  • 注意力机制对跨维度依赖关系建模能力有限
  • 空间感知与定位回归效率待优化

三大创新模块

Three Core Innovation Modules

1

PKFFM

Parallel Kernel Feature Fusion Module

多核特征融合模块

  • 四分体并行卷积结构
  • 跨尺度特征整合
  • 增强特征表示能力
2

CDBAM

Cascaded Dual-Branch Attention Module

级联双分支注意力模块

  • 通道-空间协同注意力
  • 跨维度交互机制
  • 优化特征提取
3

SAM

Scenario-Aware Module

情景感知模块

  • 多粒度空间信息捕捉
  • 全局上下文信息利用
  • 自适应特征校准

模块详细设计

PKFFM - 多核特征融合模块

核心机制

  • 小核:聚焦精细局部特征
  • 中核:提取中等尺度结构
  • 大核:建模长程上下文关系
  • 混合池化:生成空间敏感权重

技术优势

  • • 突破传统卷积核尺度约束
  • • 跨层级特征互补策略
  • • 有效抑制语义衰减
  • • 保障特征完整性

CDBAM - 级联双分支注意力模块

设计思想

  • • 引入GAM跨维度交互思想
  • • 单一通道→通道-空间协同
  • • 精准捕捉跨通道空间依赖
  • • 构建通道-空间联合分布

核心功能

  • • 抑制冗余通道响应
  • • 捕捉像素级长程依赖
  • • 增强目标与背景可区分性
  • • 优化特征提取质量

SAM - 情景感知模块

应用位置

  • • 在检测头前引入
  • • 对P3-P5特征图处理
  • • 提取不同感受野局部特征
  • • 自适应特征校准

关键作用

  • • 捕捉多粒度空间信息
  • • 动态融合多粒度空间线索
  • • 增强全局上下文理解
  • • 减少误回归问题

RS-WIoU损失函数

Remote Sensing Wise Intersection over Union (RS-WIoU) 损失函数专门针对高分辨率遥感图像设计,通过多粒度边界框回归优化,更好地适应目标尺度变化,实现更精准的定位,显著提升整体检测性能。

精准定位

针对遥感图像特点优化边界框回归策略

尺度适应

有效处理高分辨率图像中的目标尺度差异

性能提升

显著提升整体检测精度和鲁棒性

整体框架架构

主干网络 Backbone

  • • 卷积模块堆叠逐级下采样
  • • 生成P1/2到P5/32共5层特征图
  • • 嵌入PKFFM和CDBAM模块
  • • 增强多尺度特征捕获能力

颈部网络 Neck

  • • C3-P3/8、C4-P4/16、C5-P5/32
  • • 高阶语义与浅层信息双向融合
  • • C3k2完成通道重排
  • • 实现深浅特征高效耦合

检测头 Head

  • • 3个检测层级引入SAM
  • • 对P3-P5特征图自适应校准
  • • Detect检测头同步定位与分类
  • • 多尺度协同检测机制

实验结果与性能评估

Experimental Results & Performance Evaluation

TGRS-HRRSD

平均精度 (mP) 97.3%

相比基线提升 2.1%

mAP50-95 +3.0%

NWPU VHR-10

平均精度 (mP) 87.3%

相比基线提升 3.8%

mAP50-95 +1.2%

DOTA-v1.0

平均精度 (mP) 84.3%

相比基线提升 2.9%

mAP50-95 +1.5%

核心优势

高精度

显著超越基线YOLOv11模型

轻量化

保持模型轻量化特性

强鲁棒性

适应复杂背景和密集分布

SOTA性能

优于其他先进检测算法