研究背景与核心挑战
遥感目标检测是地理信息智能解译的核心技术。随着卫星和航空平台分辨率的提升,遥感图像呈现出背景复杂、目标尺度变化剧烈、小目标密集分布等特点。
DSNR-YOLO通过深度可分离卷积、归一化注意力机制和双向特征金字塔,在降低计算复杂度的同时,显著提升了对多尺度目标(尤其是小目标)的检测精度。
边缘设备部署的三大瓶颈
硬件限制
无人机、卫星载荷、手持终端的算力、内存和功耗严格受限,传统深度学习模型参数量庞大,难以部署。
实时性需求
应急响应和军事任务要求模型具备极高的推理速度,传统模型推理延迟过高。
小目标检测困难
遥感图像中小目标像素占比极低,特征稀疏,容易被背景噪声掩盖。
DSNR-YOLO核心模块
DSNRblock(核心特征提取)
结合深度可分离卷积、基于归一化的注意力模块(NAM)和残差连接,在不增加参数的前提下抑制背景噪声,凸显小目标特征。
NAM注意力机制公式
weight = frac{|bn.weight|}{sum_{i} |bn.weight_i|}
x_{out} = sigma(weight odot x) odot x
GhostConv(幽灵卷积)
通过简单的线性运算生成"冗余"特征图,先使用少量卷积核生成部分特征图,再利用廉价的线性变换获得相似的特征。
在保持特征多样性的同时削减功耗,参数量减少24.2%
BiFPN(双向特征金字塔)
构建上采样和下采样的双向路径,实现高低分辨率特征的高效交互,自适应加权融合避免小目标特征在深层传递中被稀释。
针对不同输入特征的重要性分配权重,应对遥感图像目标尺度多变的痛点
自适应权重混合损失函数
自动平衡ATFL(难易样本动态聚焦)和SLIDE(基于IoU的质量分层优化)损失,实现无需人工调参的智能优化。
total\_loss = omega_1 cdot ATFL\_loss + omega_2 cdot SLIDE\_loss + alpha + beta
实验数据集与尺度分类
SIMD数据集
- 5000张卫星图像
- 15类目标(车辆、飞机、船只等)
- 特点:小尺寸目标密集
DIOR数据集
- 23,463张图像
- 20个类别
- 特点:目标尺度变化剧烈
尺度分类标准
小目标
相对面积比 ≤ 0.1%
中目标
0.1% ~ 0.5%
大目标
> 0.5%