几何-方向联合频域表征的
遥感影像旋转目标检测方法

Geometry-Orientation Joint Frequency Domain Characterization for Oriented Object Detection

研究背景与挑战

核心挑战

  • 边界不连续问题:角度参数在定义域边界处发生数值跳变
  • 形状多样性问题:细长型与类正方形目标表征能力不足
  • 角度预测不稳定:回归损失函数在边界处产生突变

应用价值

旋转目标检测在遥感影像目视解译中发挥着重要作用,通过包含角度信息的矩形框精确刻画目标的空间位置与轮廓特征,能够显著提升密集排列、长宽比悬殊目标的定位精度,对军事侦察、灾害评估、城市规划等应用具有重要价值。

FGAF-RCNN框架

Frequency-domain Geometric and Angular Fusion RCNN

本文提出的频域空间内几何与角度耦合的旋转目标检测方法,通过将几何特性与角度信息分别映射至频域空间进行耦合,实现几何与角度在频域空间中的联合表征,从而有效解决边界不连续问题,并增强模型对多形状目标的感知能力。

1

SA2M

Shape-Adaptive Amplitude Modeling

形状自适应振幅建模模块

  • 频域振幅作为形状间接表征
  • 长宽比动态映射至振幅编码
  • 精准隐式建模目标形状
2

RASOM

Rotation-Adaptive Spectrum Optimization

旋转自适应频谱优化模块

  • 角度映射到频谱相位分量
  • 形状和方位耦合统一表示
  • 傅立叶去噪解决边界不连续

核心模块详解

SA2M - 形状自适应振幅建模

核心思想

  • • 不同形状目标在频域具有独特特征分布
  • • 细长型目标采用 ω=2 编码策略(180°范围)
  • • 类正方形目标采用 ω=4 编码(90°对称性)
  • • 振幅表征目标在该方向上的形状显著性

技术实现

  • • 长宽比 r > 1.2 划分为细长型
  • • 利用MLP对长宽比进行非线性映射
  • • 生成振幅调制因子 A
  • • 动态调整频率参数适配目标形状

RASOM - 旋转自适应频谱优化

角度编码策略

  • • 将角度信息编码至相位分量
  • • 引入几何先验的频率参数
  • • 振幅作为几何调制权重
  • • 约束相位表示的多解模糊

频域优化

  • • 振幅与相位耦合形成联合表征
  • • 傅立叶去噪平滑处理
  • • 解决边界不连续问题
  • • 提升角度预测稳定性

频域表征的优势

频域信号本身具有的周期性与角度的周期性在结构上具有相似性。通过将问题从空间域转换至频域,可以利用频域的天然周期性特征来表征角度信息,从而从根本上解决边界不连续问题

周期性匹配

频域振荡周期性与角度周期性自然对应,实现直接转换

振幅-相位耦合

振幅和相位内在关联,形状和角度统一表征

傅立叶去噪

频域平滑处理,消除边界突变,稳定回归目标

形状多样性处理策略

细长型目标

典型对象:船舶、桥梁、跑道

特征:显著的方向主轴,需覆盖180°范围

编码策略:ω=2,增强方向鲁棒性

振幅特性:主方向振幅响应强,能量集中

类正方形目标

典型对象:储油罐、广场、棒球场

特征:90°旋转对称性,各方向特征均匀

编码策略:ω=4,保持角度灵敏度

振幅特性:各方向能量分布均匀,调制因子趋近1

实验结果与性能评估

Experimental Results & Performance Evaluation

DOTA-v1.0

平均精度 (mAP) 77.4%

相比基线提升 2.3%

平均方向误差 (mAOE) 7.37

HRSC2016

平均精度 (mAP) 97.2%

相比基线提升 0.7%

船舶检测专用数据集,验证算法在特定场景的有效性

DIOR-R

平均精度 (mAP) 64.3%

泛化能力测试,展示在复杂场景中的优越检测性能

核心优势

高精度

SOTA级别检测精度

角度准确

有效降低方向误差

形状适应

适配多样化目标形状

强鲁棒性

复杂场景稳定检测