研究核心
本研究提出了一种创新性的轨迹知识图谱构建方法,通过大语言模型的提示学习技术,显著降低了知识图谱构建的技术门槛,使非专业用户能够通过自然语言指令完成复杂的图谱构建任务。
传统的知识图谱构建方法依赖专业知识和繁重的数据处理工作,而本方法将复杂流程封装于提示模板与自动化工具中,实现了从"信息服务"到"知识服务"的跨越式转变。
核心创新点
自然语言驱动
支持以自然语言驱动的任务执行流程,用户无需掌握复杂的编程技能和深度语义理解能力。
智能代码生成
设计预处理任务提示策略,引导模型自动生成异常轨迹数据处理代码,大幅降低编程能力依赖。
两级提示策略
创新性的两级系统提示策略,实现轨迹实体关系抽取工具的精准匹配与自动调用。
技术架构
1 数据预处理阶段
- 设计"五步法"任务提示策略(任务需求、情景信息、数据说明、标准输出、样例数据)
- 自动生成Python预处理代码,处理位置、速度、方向等异常情况
- 支持用户通过自然语言设定异常阈值和类型参数
2 知识抽取阶段
- 第一级提示:任务类型识别(实体抽取 vs 关系抽取)
- 第二级提示:精准匹配并调用封装好的抽取工具
- 支持4种实体(User、Stop、Move、Geo)和4种关系的自动抽取
本体设计框架
核心概念体系
产生轨迹行为的主体实体
对象在时空范围内停止或小范围移动的状态
对象从一个停留段转换到另一停留段的移动状态
停留过程中所处的地理位置实体
关系设计
has_start_stop、has_end_stop 描述停留段与移动段的顺序
has_locatedat 关联停留段与地物要素的地理位置
has_move 将移动对象与其移动行为关联
基于Stop/Move模型的本体设计,通过"停留-移动-停留"状态序列,结构化表达移动对象的轨迹状态,并建立与地物的语义关联。
实验验证成果
数据集规模
模型表现
关键发现
- 01 在两种主流大语言模型上均达到75%和80%以上的准确率,验证了方法的有效性和泛化能力。
- 02 完整的五步提示策略对代码生成质量至关重要,缺少任何一个环节都会影响最终效果。
- 03 两级提示策略在实体抽取和关系抽取任务中均表现优异,F1值普遍超过80%。
- 04 方法在不同数据源(船舶轨迹、车辆轨迹)和不同干扰条件下均展现出良好的稳健性。