DSNR-YOLO:用于遥感目标检测的
轻量化注意力残差增强架构

研究背景与核心挑战

遥感目标检测是地理信息智能解译的核心技术。随着卫星和航空平台分辨率的提升,遥感图像呈现出背景复杂、目标尺度变化剧烈、小目标密集分布等特点。

DSNR-YOLO通过深度可分离卷积、归一化注意力机制和双向特征金字塔,在降低计算复杂度的同时,显著提升了对多尺度目标(尤其是小目标)的检测精度。

边缘设备部署的三大瓶颈

硬件限制

无人机、卫星载荷、手持终端的算力、内存和功耗严格受限,传统深度学习模型参数量庞大,难以部署。

实时性需求

应急响应和军事任务要求模型具备极高的推理速度,传统模型推理延迟过高。

小目标检测困难

遥感图像中小目标像素占比极低,特征稀疏,容易被背景噪声掩盖。

DSNR-YOLO核心模块

1

DSNRblock(核心特征提取)

结合深度可分离卷积、基于归一化的注意力模块(NAM)和残差连接,在不增加参数的前提下抑制背景噪声,凸显小目标特征。

NAM注意力机制公式

weight = frac{|bn.weight|}{sum_{i} |bn.weight_i|}

x_{out} = sigma(weight odot x) odot x

2

GhostConv(幽灵卷积)

通过简单的线性运算生成"冗余"特征图,先使用少量卷积核生成部分特征图,再利用廉价的线性变换获得相似的特征。

在保持特征多样性的同时削减功耗,参数量减少24.2%

3

BiFPN(双向特征金字塔)

构建上采样和下采样的双向路径,实现高低分辨率特征的高效交互,自适应加权融合避免小目标特征在深层传递中被稀释。

针对不同输入特征的重要性分配权重,应对遥感图像目标尺度多变的痛点

4

自适应权重混合损失函数

自动平衡ATFL(难易样本动态聚焦)和SLIDE(基于IoU的质量分层优化)损失,实现无需人工调参的智能优化。

total\_loss = omega_1 cdot ATFL\_loss + omega_2 cdot SLIDE\_loss + alpha + beta

实验数据集与尺度分类

SIMD数据集

  • 5000张卫星图像
  • 15类目标(车辆、飞机、船只等)
  • 特点:小尺寸目标密集

DIOR数据集

  • 23,463张图像
  • 20个类别
  • 特点:目标尺度变化剧烈

尺度分类标准

小目标

相对面积比 ≤ 0.1%

中目标

0.1% ~ 0.5%

大目标

> 0.5%

SOTA性能突破

89.0%
mAP50
DIOR数据集
7.15M
参数量
减少24.2%
18.3
GFLOPs
减少14.9%
128
FPS
满足实时需求

在参数量减少24.2%、计算量减少14.9%的情况下,mAP反而提升了0.7%,实现了精度与轻量化的完美平衡。

与先进检测网络对比

DIOR数据集性能对比

模型 mAP50 (%) mAP (%) GFLOPs Params (M) 模型大小 (MB)
YOLO-SSP 87.3 64.7 - 28.3 113.2
YOLOv8s 87.6 65.4 28.6 11.1 44.4
YOLOv10s 87.7 66.0 24.7 8.06 32.2
YOLOv12s 88.8 67.2 19.4 9.12 36.5
DSNR-YOLO 89.0 66.9 18.3 7.15 28.6

性能分析

DSNR-YOLO在计算量(18.3 GFLOPs)最低的情况下,mAP50达到了最高值(89.0%),且模型体积仅为28.6MB,非常适合嵌入式部署。

消融实验分析

各模块有效性验证(DIOR数据集)

模型 DSNRblock GhostConv BiFPN Loss mAP50 (%) GFLOPs Params (M)
YOLOv11s - - - - 88.4 21.5 9.43
中间模型1 - - - 88.4 18.9 8.00
中间模型2 - - 87.8 16.1 6.69
DSNR-YOLO 89.0 18.3 7.15

移除局部分支(w/o Local)

RMSE显著上升,说明局部传导机制对处理高流量区域至关重要

移除ConvNeXt

替换为传统ResNet后误差升高,证明了ConvNeXt提取空间特征的优越性

多尺度验证

同时使用3×3, 5×5, 7×7邻域的效果优于任何单一尺度,证明交通流具有多尺度传播特性

研究价值与未来方向

技术创新

DSNRblock通过双支路选择策略和NAM注意力,有效解决了小目标特征稀疏和背景噪声干扰问题,为轻量化目标检测提供了新思路。

三位一体框架

结合GhostConv压缩冗余、BiFPN强化多尺度融合、自适应损失优化学习强度,构建了完整的轻量化方案。

实战价值

实验证明模型在SIMD和DIOR数据集上表现优异,FPS达到128,满足实时检测需求,且精度领先于同类轻量化网络。

未来方向

可针对目标高度密集重叠的场景进一步优化BiFPN,引入自适应去噪模块提升恶劣气象条件下的检测能力,探索多模态融合检测。