研究背景与动机
核心问题
- 未充分利用两类地物间的空间结构关系
- 忽视各自的形态结构特性
- 导致地物边界不清晰、小尺寸对象漏检
应用价值
- 城市规划 - 空间布局优化
- 灾害响应 - 应急救援支持
- 自动驾驶 - 高精度地图构建
- 智能交通 - 路网管理优化
核心方法创新
整体架构
采用编码器-解码器架构,以ResNet-50为骨干网络,包含两大核心模块
特征空间交互模块
FSIM - Feature Space Interaction Module
核心功能
捕获建筑物与道路的空间结构语义
实现机制
- • 查询引导的跨注意力机制
- • 双重跨注意力块(建筑物↔道路)
- • 残差连接保留空间细节
- • 通道拼接 + 1×1卷积融合
双分支解码模块
DBDM - Dual-Branch Decoding Module
建筑物分支 - AGB
- • 注意力引导块(Attention-Guided Block)
- • 网格注意力抑制背景干扰
- • 混合注意力(通道+空间)
- • 强化建筑物边界轮廓
道路分支 - DAB
- • 方向感知块(Direction-Aware Block)
- • 多尺度通道(不同卷积核)
- • 多方向条带卷积(水平/垂直/对角)
- • 增强道路线性结构提取
实验设计与数据集
Massachusetts 数据集
来源:美国波士顿地区航拍影像
分辨率:1m
样本量:3,527张(训练3,077 / 验证200 / 测试250)
尺寸:512×512像素
特点:涵盖城市、郊区、乡村多种场景
AIOI 数据集
来源:美国9个地区遥感影像
分辨率:0.15~0.30m
样本量:12,096张(训练9,552 / 测试2,544)
尺寸:512×512像素
特点:跨城市分布,场景类型丰富
评价指标体系
Precision
精度
Recall
召回率
F1 Score
F1分数
IoU
交并比
Avg IoU
平均交并比
对比基线方法
UNet
经典语义分割
DeepLabv3+
空洞卷积分割
SegFormer
Transformer分割
EfficientFormerV2
高效Transformer
VWFormer
可变窗口注意力
LOGCAN++
多类别分割
CRIN
协同提取方法
SACE-Net
本文方法 ⭐