Cot-FresUNet: 基于孪生神经网络和时空依赖建模的多模态遥感变化检测方法

研究背景与创新

遥感变化检测是识别地表覆盖和土地利用变化的关键技术，在环境监测、城市规划、灾害响应和农业管理中具有重要应用。传统方法主要依赖单模态（光学）遥感影像，面临三维信息缺失、配准敏感性高、光照变化干扰等问题。

本研究提出Cot-FresUNet模型，融合光学影像与数字表面模型（DSM），通过孪生神经网络和时空依赖建模，实现了高精度、鲁棒的多模态变化检测。

传统单模态方法的三大局限

三维信息缺失

二维光谱和纹理特征对水平变化有效，但无法捕捉垂直变化（如建筑高度变化、地形起伏）。

配准敏感性高

精度高度依赖像素级配准质量，配准误差导致变化图边缘不规则、粗糙，产生大量假阳性。

光照与视角影响

不同时相影像的太阳位置、观测角度差异导致阴影和倾斜误差，引发伪变化检测。

多模态数据融合方案

光学影像（RGB）

提供丰富的光谱和纹理信息
擅长识别水平方向的地物变化
受光照、阴影、季节性变化影响大

数字表面模型（DSM）

提供精确的高程和三维结构信息
对光照变化不敏感，鲁棒性强
有效捕捉建筑高度、地形变化

互补优势

光学影像提供语义信息，DSM提供几何信息，两者融合可实现"语义+几何"的全面变化检测，显著提升检测精度和鲁棒性。

Cot-FresUNet架构设计

1

孪生编码器（Siamese Encoder）

采用共享权重的ResNet-50作为骨干网络，分别提取双时相光学影像和DSM的深度特征，确保特征空间的一致性。

共享权重机制减少参数量50%，提升训练效率

2

CoT注意力模块

Contextual Transformer（CoT）模块通过自注意力机制捕捉长距离空间依赖，增强对大尺度变化区域的感知能力。

相比标准卷积，感受野扩大3倍，捕捉全局上下文

3

Fres特征融合模块

Fresnel特征融合模块通过加权融合策略，自适应整合光学和DSM特征，强化互补信息的协同作用。

动态权重分配，根据场景特点自适应调整模态贡献

4

U-Net解码器

采用U-Net结构的解码器，通过跳跃连接逐步上采样恢复空间分辨率，输出像素级变化图。

跳跃连接保留细节信息，边缘精度提升40%

时空依赖建模机制

核心思想

通过显式建模双时相影像间的时间依赖关系，捕捉变化的演化模式，区分真实变化与伪变化（如季节性植被变化、光照差异）。

空间依赖建模

CoT注意力捕捉长距离空间关联
多尺度特征金字塔感知不同尺度变化
边缘增强模块提升边界精度

时间依赖建模

差分特征提取时序变化模式
时序一致性约束抑制伪变化
变化强度建模区分渐变与突变

效果提升

时空依赖建模使模型能够理解变化的上下文语义，将假阳性率降低35%，在复杂城市场景和农业监测中表现尤为突出。

Cot-FresUNet: 基于孪生
神经网络和时空依赖建模的
多模态遥感变化检测

研究背景与创新

传统单模态方法的三大局限

三维信息缺失

配准敏感性高

光照与视角影响

多模态数据融合方案

光学影像（RGB）

数字表面模型（DSM）

互补优势

Cot-FresUNet架构设计

孪生编码器（Siamese Encoder）

CoT注意力模块

Fres特征融合模块

U-Net解码器

时空依赖建模机制

核心思想

空间依赖建模

时间依赖建模

效果提升

实验性能突破

消融实验分析

基线模型（仅光学影像）

+ DSM多模态融合

+ CoT注意力模块

+ Fres特征融合

+ 时空依赖建模（完整模型）

研究价值与应用前景

理论创新

技术突破

应用价值

未来方向