人类出行流量生成的挑战
流量生成:在缺乏历史流量数据的情况下,基于起终点特征估算两点间出行流量
经典模型:重力模型、辐射模型等难以捕捉影响出行的复杂因素
深度学习:虽精度较高,但"黑箱"问题导致可解释性不足
流量生成 vs 流量预测
流量预测
• 基于历史流量数据和时空特征
• 预测未来时段的流量分布
• 需要完整时序观测数据
• 适用于短期交通管理等场景
• 关注时序依赖性
流量生成(本文)
• 缺乏历史流量数据
• 仅依靠起终点空间属性和社会经济特征
• 适用于新区域规划等无历史数据场景
• 关注宏观尺度稳态流量(如日常通勤)
• 受长期稳定的空间属性驱动
核心概念:解耦表征学习
什么是解耦表征学习?
通过分离数据生成过程中的潜在因子,提升模型透明度,揭示影响出行流量的潜在因素所发挥的作用
本文解耦策略
将影响出行流量生成的因素解耦为3类独立潜码:
位置潜码 z₁
经纬度坐标等位置相关因素
非位置潜码 z₂
人口数量、POI分布等非位置因素
残差潜码 z₃
未被明确解耦但有影响的语义信息
方法框架:四大核心模块
位置因素编码器
处理经纬度坐标,生成位置潜码z₁
技术细节
• 采用单点直接位置编码策略
• 正弦余弦函数生成初始位置编码PE(p)
• 三层全连接网络(64→32→32)提取位置表征
• 计算OD对相对位置表征:Enc(pd) - Enc(po)
• MLP映射为8维位置潜码z₁
非位置因素编码器
处理人口数量、POI分布,生成非位置潜码z₂
技术细节
• 通过邻域内属性聚合处理非位置属性
• 分别处理出发地O和目的地D的非位置属性
• 捕捉区域社会经济特征的空间关联性
• 输出8维非位置潜码z₂
残差因素编码器
捕捉未被明确解耦的语义信息,生成残差潜码z₃
技术细节
• 输入包括OD对综合属性及z₁、z₂
• 计算综合潜码z与输入潜码的差异
• 采用互信息最小化策略约束潜码独立性
• 确保3类潜码的可分离性
注意力机制潜码融合模块
采用通道注意力机制融合3类潜码
技术细节
• 自动学习3类潜码对流量生成的具体偏好
• 实现3类潜码的加权融合
• 输出OD对综合表征
• 通过DeepGravity骨干网络生成流量