大语言模型在地理空间任务中的应用：Geo-LLM 当前进展与展望

杨雪 · 孙永华 · 许丁琳 · 等地球信息科学学报 · 2026 · Vol.28 No.5 · pp.1296-1313

地理对象具有多要素耦合的复杂特征。传统的地理信息系统（GIS）存在工具分散、交互门槛高、决策缺失等局限。大语言模型（LLM）的出现为重构以语言为中心的人机交互提供了技术基础。将 LLM 与空间信息技术融合（即 Geo-LLM），旨在实现基于语义的地理执行自主性，优化空间分析决策效率，为地理信息科学（GIScience）开辟新方向。

大语言模型地理空间人工智能 (GeoAI) 智能体 (Agent) 空间分析检索增强生成 (RAG) 知识图谱链式思考 (CoT)

向下滚动阅读

01 · 研究背景

从工具自动化到语义自主化

传统的 GIS 依赖预设流程和图形界面，难以适应复杂情境下的个性化需求，亟需引入大语言模型的推理与决策能力。

传统 GIS 的局限

交互门槛高与决策缺失

实现路径分散，依赖基于规则的操作。传统自动化流（如模型构建器）侧重数据处理，缺乏问题解析和策略制定的高层决策能力。

LLM 的优势

语义理解与任务抽象

LLM 在语义理解、任务抽象和推理方面表现出强大能力，为重构以自然语言为中心的人机交互提供了技术基础。

Geo-LLM 的愿景

地理执行自主性

将 LLM 与空间信息技术融合，实现基于语义的地理执行自主性，优化空间分析决策效率，推动 GIScience 的发展。

02 · 应用现状与能力框架

Geo-LLM 的应用场景与功能设计

Geo-LLM 的核心在于将通用 LLM 的语义能力迁移至地理领域，并扩展其执行能力，形成从知识问答到空间推理的功能金字塔。

F1

底层：地理知识问答

侧重于对地理事实、地名、空间实体属性的理解，以及基本空间关系的语义解析。

事实查询语义解析

F2

中层：空间数据处理

将自然语言转化为脚本（Python/SQL）或工具调用序列，处理矢量/栅格数据，实现 ReAct 范式和函数调用 (Function Calling)。

代码生成工具调用

F3

顶层：空间认知推理

强调多源信息整合、时空因果分析和多步骤规划，接近空间决策辅助代理 (Agent)。

多步规划因果分析

代表性 Geo-LLM 研究与数据集 (2023年以来)

任务类别	研究名称	主要用途	数据集特征
综合/问答	GeoQAMap	地理问题回答系统	900个问答对，涵盖地理知识、地图阅读、推理等
综合/问答	坤元 (KunYuan)	地理科学领域大模型	中国科学院发布，侧重地理科学专业知识
数据采集	GeoAgent	地址标准化智能体	7540 K 条地理编码数据，支持地址关联与标准化
数据采集	EarthGPT	遥感图像理解	MMRS-1M 数据集，包含 100 万组多传感器图像-文本对
空间分析	GeoGPT	地理空间任务理解与处理	驱动地理空间工具链执行复杂任务
空间分析	GeoTool-GPT	GIS 工具掌握	1950 对命令-响应，覆盖 172 个 GIS 工具功能
可视化	MapGPT	制图智能体	包含 68 种专门用于控制地图元素细节的工具

03 · 关键技术路径

知识注入、工具增强与思维链

为缓解“地理空间幻觉”并提升执行稳定性，研究者在知识注入、多模态增强和推理链设计上进行了大量探索。

地理知识注入 (RAG & SFT)

通过向量检索和知识图谱(KG)增强提供外部知识约束；或通过特定语料库微调(SFT)将地理事实内化至模型参数。

数据与多模态工具增强

建立工具注册机制调度 GIS 工具；在多模态理解上，探索视觉编码器对齐或直接将轨迹向量编码为类 token 序列。

推理思维链 (CoT) 设计

从线性推理(CoT)向搜索推理(ToT/AoT)演进，结合多路径一致性和交互式修正(CoP)，提升复杂决策的稳定性。

04 · 挑战与展望

迈向稳健的地理基础模型

尽管取得了显著进展，Geo-LLM 在空间结构推理、中间过程管理和稳健性评估等方面仍存在瓶颈。

当前面临的挑战

语言表示与空间结构对齐：语义相近不等于地理邻近。LLM 缺乏显式的拓扑结构表示，容易生成语义连贯但空间结构错误的答案。
过程数据管理：空间任务涉及多个连续步骤，现有模型缺乏对中间几何数据的系统性建模，导致长工作流中数据复用困难。
推理稳定性与评估：在演绎推理任务中表现波动大；现有评估指标侧重结果对齐，缺乏对推理链合理性和决策有效性的高层次评估。

未来研究方向展望

地理空间智能体工作流管理：将多步操作表示为可执行流程图，引入过程记忆进行状态管理，避免跨步骤信息丢失。
语言模型空间认知评价：评估模型内部是否形成了稳定的“认知地图”，测试其在参考系转换、地标锚定等方面的表现。
地理基础模型 (GeoFM) 构建：不再仅将 LLM 视为工具增强，而是以空间结构为核心，构建“空间视觉层-空间感知层-语言交互层”的分层协同架构。