Vehicle Trajectory · Local Self-Attention Transformer

基于局部自注意力Transformer的
长期车辆轨迹预测模型

TrajFormer: Long-Term Prediction with Local Attention

严利鑫 · 利健华 · 李黄承成 · 陶璐
华东交通大学 · 武汉大学
2026年1月

长期轨迹预测的挑战

城市交通环境复杂,交通流呈现高度非线性特征

现有模型在长时序和强噪声环境下存在长期依赖表征不足问题

多步预测时误差累积明显,难以准确实现长期预测

短期预测 vs 长期预测

短期预测

• 基于短时间窗口内的高频位置数据

• 预测数秒内的运动状态和轨迹

• 应用于碰撞预警等微观场景

• 时间尺度:秒级

长期预测(本文)

• 利用一段行驶轨迹预测未来位置

• 预测几十分钟至数小时的运动轨迹

• 应用于智能交通管理、位置推荐

• 时间尺度:分钟至小时级

现有方法的局限性

📊

传统统计方法

马尔可夫模型、序列模式挖掘等方法在面对大规模、高度非线性数据时能力受限

🔄

递归神经网络

RNN、LSTM等在长序列时面临梯度消失和难以捕捉长期依赖问题

🌐

全局Transformer

全局自注意力在捕捉局部细节时可能引入多余信息和噪声

核心创新:TrajFormer模型

局部自注意力机制

局部自注意力机制替代传统Transformer的全局自注意力结构,每个时间步仅关注前ω个轨迹点,从结构上抑制远距离不相关历史点的干扰

局部关注

仅关注固定时间窗口内的历史信息

噪声抑制

避免远距离无关点的干扰

细粒度建模

捕捉细粒度时序模式

TrajFormer三大核心模块

1

数据预处理与嵌入

采用离散高维嵌入增强输入轨迹的空间表达

技术细节

• 轨迹清洗、重采样、归一化

• 将连续经纬度离散化为网格索引

• 双独立嵌入层分别映射经纬度到高维空间

• 融合位置嵌入捕获时间顺序信息

2

局部自注意力主体

通过因果局部时间窗限制注意力范围

核心机制

• 预测当前位置时仅关注前ω个轨迹点

• 构建局部注意力掩码矩阵

• 多头注意力机制增强表征能力

• 前馈网络进一步提取特征

3

双独立解码输出

构建双独立解码结构提升坐标预测精度

输出设计

• 2个独立全连接层分别预测经纬度网格索引

• 还原为连续经纬度坐标

• 完成轨迹点位置预测

实验结果与性能对比

Experimental Results on Rome Taxi Dataset (320 Vehicles)

性能提升显著

平均位移误差(ADE)

↓41%

最大降幅

均方根误差(RMSE)

↓35%

最大降幅

实验数据集

320辆罗马出租车

连续一个月GPS轨迹

城市尺度真实场景

预测任务

短期预测(数分钟)

中期预测(十几分钟)

长期预测(数十分钟至小时)

局部时间窗大小的影响

最优时间窗:30分钟

30分钟(最优)

平衡了局部特征捕获与噪声抑制

35分钟

误差上升约3.78%

40分钟

误差上升约5.17%

过大的时间窗会引入额外噪声和冗余信息,削弱模型预测性能

应用价值与意义

个性化导航推荐

预测用户未来位置,提供个性化路线推荐和兴趣点建议

实时交通管理

支持智能交通系统进行流量预测和拥堵管理

轨迹数据恢复

修复GPS信号丢失导致的轨迹缺失

基于位置的服务(LBS)

广告精准投放、商业选址等提供数据支持

TrajFormer核心优势

🎯

精度提升

ADE和RMSE分别降低41%和35%

🛡️

噪声鲁棒

局部注意力有效抑制远距离噪声

数据需求低

仅需带时间戳的经纬度数据