Human Mobility · Disentangled Representation Learning

应用解耦表征学习的
人类出行流量生成建模

Interpretable Flow Generation via Disentangled Latent Codes

朱雨昂 · 张彤 · 王志鹏
武汉大学
2026年1月

人类出行流量生成的挑战

流量生成:在缺乏历史流量数据的情况下,基于起终点特征估算两点间出行流量

经典模型:重力模型、辐射模型等难以捕捉影响出行的复杂因素

深度学习:虽精度较高,但"黑箱"问题导致可解释性不足

流量生成 vs 流量预测

流量预测

• 基于历史流量数据和时空特征

• 预测未来时段的流量分布

• 需要完整时序观测数据

• 适用于短期交通管理等场景

• 关注时序依赖性

流量生成(本文)

缺乏历史流量数据

• 仅依靠起终点空间属性和社会经济特征

• 适用于新区域规划等无历史数据场景

• 关注宏观尺度稳态流量(如日常通勤)

• 受长期稳定的空间属性驱动

核心概念:解耦表征学习

什么是解耦表征学习?

通过分离数据生成过程中的潜在因子,提升模型透明度,揭示影响出行流量的潜在因素所发挥的作用

本文解耦策略

将影响出行流量生成的因素解耦为3类独立潜码

位置潜码 z₁

经纬度坐标等位置相关因素

非位置潜码 z₂

人口数量、POI分布等非位置因素

残差潜码 z₃

未被明确解耦但有影响的语义信息

方法框架:四大核心模块

1

位置因素编码器

处理经纬度坐标,生成位置潜码z₁

技术细节

• 采用单点直接位置编码策略

• 正弦余弦函数生成初始位置编码PE(p)

• 三层全连接网络(64→32→32)提取位置表征

• 计算OD对相对位置表征:Enc(pd) - Enc(po)

• MLP映射为8维位置潜码z₁

2

非位置因素编码器

处理人口数量、POI分布,生成非位置潜码z₂

技术细节

• 通过邻域内属性聚合处理非位置属性

• 分别处理出发地O和目的地D的非位置属性

• 捕捉区域社会经济特征的空间关联性

• 输出8维非位置潜码z₂

3

残差因素编码器

捕捉未被明确解耦的语义信息,生成残差潜码z₃

技术细节

• 输入包括OD对综合属性及z₁、z₂

• 计算综合潜码z与输入潜码的差异

• 采用互信息最小化策略约束潜码独立性

• 确保3类潜码的可分离性

4

注意力机制潜码融合模块

采用通道注意力机制融合3类潜码

技术细节

• 自动学习3类潜码对流量生成的具体偏好

• 实现3类潜码的加权融合

• 输出OD对综合表征

• 通过DeepGravity骨干网络生成流量

实验结果与性能对比

Experimental Results on New York & Pennsylvania Datasets

通勤者公共部分(CPC)指标

纽约州

0.773

本文方法

+4.47%

相较最优基线提升

宾夕法尼亚州

0.727

本文方法

+3.71%

相较最优基线提升

对比方法

• GM(重力模型)

• RM(辐射模型)

• RF(随机森林)

• GNN(图神经网络)

• DG(DeepGravity)

• SI-GCN

性能优势

流量生成精度最高

跨区域泛化能力强

可解释性显著提升

验证方法

消融实验

无监督解耦指标

SHAP分析

注意力权重量化

方法核心优势

🎯

精度提升

CPC指标分别提升4.47%和3.71%,优于所有基线方法

🔍

可解释性强

通过解耦表征揭示影响流量的潜在因素

🌐

泛化能力

跨区域场景中保持优异性能

应用价值与意义

城市规划

新区域规划中,无需历史数据即可估算出行流量

交通管理

支持交通需求预测与道路网络优化

商业布局

辅助商业选址决策与客流量评估

流行病防控

分析人口流动模式,支持疫情防控策略制定

三大技术创新

1

三类编码器

分别构建位置、非位置及残差因素编码器,实现因素解耦

2

互信息最小化

约束3类潜码的独立性和可分离性,确保有效解耦

3

注意力融合

通道注意力机制自动学习潜码权重,实现智能融合