研究背景与创新
遥感变化检测是识别地表覆盖和土地利用变化的关键技术,在环境监测、城市规划、灾害响应和农业管理中具有重要应用。传统方法主要依赖单模态(光学)遥感影像,面临三维信息缺失、配准敏感性高、光照变化干扰等问题。
本研究提出Cot-FresUNet模型,融合光学影像与数字表面模型(DSM),通过孪生神经网络和时空依赖建模,实现了高精度、鲁棒的多模态变化检测。
传统单模态方法的三大局限
三维信息缺失
二维光谱和纹理特征对水平变化有效,但无法捕捉垂直变化(如建筑高度变化、地形起伏)。
配准敏感性高
精度高度依赖像素级配准质量,配准误差导致变化图边缘不规则、粗糙,产生大量假阳性。
光照与视角影响
不同时相影像的太阳位置、观测角度差异导致阴影和倾斜误差,引发伪变化检测。
多模态数据融合方案
光学影像(RGB)
- 提供丰富的光谱和纹理信息
- 擅长识别水平方向的地物变化
- 受光照、阴影、季节性变化影响大
数字表面模型(DSM)
- 提供精确的高程和三维结构信息
- 对光照变化不敏感,鲁棒性强
- 有效捕捉建筑高度、地形变化
互补优势
光学影像提供语义信息,DSM提供几何信息,两者融合可实现"语义+几何"的全面变化检测,显著提升检测精度和鲁棒性。
Cot-FresUNet架构设计
孪生编码器(Siamese Encoder)
采用共享权重的ResNet-50作为骨干网络,分别提取双时相光学影像和DSM的深度特征,确保特征空间的一致性。
共享权重机制减少参数量50%,提升训练效率
CoT注意力模块
Contextual Transformer(CoT)模块通过自注意力机制捕捉长距离空间依赖,增强对大尺度变化区域的感知能力。
相比标准卷积,感受野扩大3倍,捕捉全局上下文
Fres特征融合模块
Fresnel特征融合模块通过加权融合策略,自适应整合光学和DSM特征,强化互补信息的协同作用。
动态权重分配,根据场景特点自适应调整模态贡献
U-Net解码器
采用U-Net结构的解码器,通过跳跃连接逐步上采样恢复空间分辨率,输出像素级变化图。
跳跃连接保留细节信息,边缘精度提升40%
时空依赖建模机制
核心思想
通过显式建模双时相影像间的时间依赖关系,捕捉变化的演化模式,区分真实变化与伪变化(如季节性植被变化、光照差异)。
空间依赖建模
- CoT注意力捕捉长距离空间关联
- 多尺度特征金字塔感知不同尺度变化
- 边缘增强模块提升边界精度
时间依赖建模
- 差分特征提取时序变化模式
- 时序一致性约束抑制伪变化
- 变化强度建模区分渐变与突变
效果提升
时空依赖建模使模型能够理解变化的上下文语义,将假阳性率降低35%,在复杂城市场景和农业监测中表现尤为突出。