大语言模型在地理空间任务中的应用:Geo-LLM 当前进展与展望

杨雪 · 孙永华 · 许丁琳 · 等 地球信息科学学报 · 2026 · Vol.28 No.5 · pp.1296-1313

地理对象具有多要素耦合的复杂特征。传统的地理信息系统(GIS)存在工具分散、交互门槛高、决策缺失等局限。大语言模型(LLM)的出现为重构以语言为中心的人机交互提供了技术基础。将 LLM 与空间信息技术融合(即 Geo-LLM),旨在实现基于语义的地理执行自主性,优化空间分析决策效率,为地理信息科学(GIScience)开辟新方向。

大语言模型 地理空间人工智能 (GeoAI) 智能体 (Agent) 空间分析 检索增强生成 (RAG) 知识图谱 链式思考 (CoT)
向下滚动阅读

01 · 研究背景

从工具自动化到语义自主化

传统的 GIS 依赖预设流程和图形界面,难以适应复杂情境下的个性化需求,亟需引入大语言模型的推理与决策能力。

传统 GIS 的局限

交互门槛高与决策缺失

实现路径分散,依赖基于规则的操作。传统自动化流(如模型构建器)侧重数据处理,缺乏问题解析和策略制定的高层决策能力。

LLM 的优势

语义理解与任务抽象

LLM 在语义理解、任务抽象和推理方面表现出强大能力,为重构以自然语言为中心的人机交互提供了技术基础。

Geo-LLM 的愿景

地理执行自主性

将 LLM 与空间信息技术融合,实现基于语义的地理执行自主性,优化空间分析决策效率,推动 GIScience 的发展。


02 · 应用现状与能力框架

Geo-LLM 的应用场景与功能设计

Geo-LLM 的核心在于将通用 LLM 的语义能力迁移至地理领域,并扩展其执行能力,形成从知识问答到空间推理的功能金字塔。

F1
底层:地理知识问答

侧重于对地理事实、地名、空间实体属性的理解,以及基本空间关系的语义解析。

事实查询语义解析
F2
中层:空间数据处理

将自然语言转化为脚本(Python/SQL)或工具调用序列,处理矢量/栅格数据,实现 ReAct 范式和函数调用 (Function Calling)。

代码生成工具调用
F3
顶层:空间认知推理

强调多源信息整合、时空因果分析和多步骤规划,接近空间决策辅助代理 (Agent)。

多步规划因果分析
代表性 Geo-LLM 研究与数据集 (2023年以来)
任务类别 研究名称 主要用途 数据集特征
综合/问答 GeoQAMap 地理问题回答系统 900个问答对,涵盖地理知识、地图阅读、推理等
坤元 (KunYuan) 地理科学领域大模型 中国科学院发布,侧重地理科学专业知识
数据采集 GeoAgent 地址标准化智能体 7540 K 条地理编码数据,支持地址关联与标准化
EarthGPT 遥感图像理解 MMRS-1M 数据集,包含 100 万组多传感器图像-文本对
空间分析 GeoGPT 地理空间任务理解与处理 驱动地理空间工具链执行复杂任务
GeoTool-GPT GIS 工具掌握 1950 对命令-响应,覆盖 172 个 GIS 工具功能
可视化 MapGPT 制图智能体 包含 68 种专门用于控制地图元素细节的工具

03 · 关键技术路径

知识注入、工具增强与思维链

为缓解“地理空间幻觉”并提升执行稳定性,研究者在知识注入、多模态增强和推理链设计上进行了大量探索。

地理知识注入 (RAG & SFT)

通过向量检索和知识图谱(KG)增强提供外部知识约束;或通过特定语料库微调(SFT)将地理事实内化至模型参数。

数据与多模态工具增强

建立工具注册机制调度 GIS 工具;在多模态理解上,探索视觉编码器对齐或直接将轨迹向量编码为类 token 序列。

推理思维链 (CoT) 设计

从线性推理(CoT)向搜索推理(ToT/AoT)演进,结合多路径一致性和交互式修正(CoP),提升复杂决策的稳定性。


04 · 挑战与展望

迈向稳健的地理基础模型

尽管取得了显著进展,Geo-LLM 在空间结构推理、中间过程管理和稳健性评估等方面仍存在瓶颈。

当前面临的挑战
  • 语言表示与空间结构对齐:语义相近不等于地理邻近。LLM 缺乏显式的拓扑结构表示,容易生成语义连贯但空间结构错误的答案。
  • 过程数据管理:空间任务涉及多个连续步骤,现有模型缺乏对中间几何数据的系统性建模,导致长工作流中数据复用困难。
  • 推理稳定性与评估:在演绎推理任务中表现波动大;现有评估指标侧重结果对齐,缺乏对推理链合理性和决策有效性的高层次评估。
未来研究方向展望
  • 地理空间智能体工作流管理:将多步操作表示为可执行流程图,引入过程记忆进行状态管理,避免跨步骤信息丢失。
  • 语言模型空间认知评价:评估模型内部是否形成了稳定的“认知地图”,测试其在参考系转换、地标锚定等方面的表现。
  • 地理基础模型 (GeoFM) 构建:不再仅将 LLM 视为工具增强,而是以空间结构为核心,构建“空间视觉层-空间感知层-语言交互层”的分层协同架构。