大语言模型时代 GIS 空间分析代码:本体论证与展望

侯树洋 · 矫皓月 · 刘子琦 · 等 地球信息科学学报 · 2026 · Vol.28 No.6 · pp.1537-1552 DOI: 10.12082/dqxxkx.2026.260125

在大语言模型介入 GIS 空间分析的新范式下,用户交互正在从“工具-参数-执行”转向“自然语言-代码-空间分析”。本文从本体论与方法论角度论证:GIS 空间分析代码不仅是实现工具,更是连接自然语言意图与空间分析结果的形式化驱动机制,是空间分析可执行、可验证、可重放的最小完备单元。

GIS 空间分析 大语言模型 空间分析代码 方法论本体 可验证性 可重放性
向下滚动阅读

01 · GIS 交互范式的变革

从代码驱动、GUI 封装到自然语言生成代码

空间分析的科学有效性不只取决于结果,更取决于分析过程是否可执行、可验证与可重放。LLM 的出现使代码重新从工具后台走向方法前台。

早期阶段

用户直接编写代码

空间分析过程显性地体现为程序执行逻辑,用户需要理解数据结构、算法调用与流程控制,门槛较高但过程相对透明。

GUI 阶段

代码被工具箱封装

用户通过图形界面配置工具与参数,降低了使用门槛,但也弱化了对空间分析执行结构的理解。

LLM 阶段

自然语言-代码-空间分析

自然语言成为入口,代码成为中介,LLM 负责生成、解释或修正程序,使空间分析过程再次显性化。


02 · 本体论证

为什么代码是空间分析的“方法论本体”?

自然语言具备语义弹性,适合表达意图;程序代码具备形式化确定性,适合承担执行稳定性。因此,在 LLM 时代,代码是空间分析科学有效性的关键支点。

O1
代码具有确定语法与执行语义

GIS 空间分析代码以形式化符号体系表达地理空间对象、空间关系与分析操作。其执行逻辑可被计算机严格解释,不依赖自然语言上下文的模糊推断。

形式化表达执行语义
O2
代码承载完整空间分析过程

从数据读取、坐标参考处理、空间叠加、缓冲区分析、栅格计算到结果导出,代码记录了分析链条的每个关键步骤,是过程复现的核心载体。

过程记录流程控制
O3
代码是自然语言意图的可检验落点

LLM 生成的自然语言解释可能存在歧义或幻觉,而代码可通过运行、单元测试、结果比对和逻辑审查被验证,因而是空间分析可信性的最小完备单元。

可执行可验证可重放

新型交互链条

Natural Language → Code → Spatial Analysis → Result

自然语言负责表达目标,代码负责形式化执行,空间分析结果则必须通过代码逻辑获得可追溯解释。

科学有效性的三要素

Executability
+ Verifiability
+ Reproducibility

代码将空间分析从“能得到结果”提升为“能解释为何得到该结果、能否重复得到该结果”。


03 · 代码的计算主体地位

LLM 不是替代代码,而是重塑代码生产方式

LLM 的价值在于降低代码生成和理解门槛,但空间分析过程的稳定性仍需由代码机制承担。

NL
自然语言
表达任务意图
Code
空间分析代码
承担执行机制
GIS
空间分析引擎
实现算法调用
Trust
可信结果
依赖过程验证
LLM 带来的积极变化
  • 降低 GIS 空间分析编程门槛,使非专业用户也能通过自然语言表达复杂需求。
  • 促进代码解释、自动补全、错误定位与流程重构,提高空间分析效率。
  • 让隐藏在 GUI 后台的执行逻辑重新显性化,推动空间分析过程透明化。
必须警惕的核心风险
  • LLM 可能生成语法正确但空间语义错误的代码,如坐标系误用、单位混淆、拓扑关系误判。
  • 自然语言描述可能掩盖参数设置、数据预处理和边界条件等关键分析假设。
  • 若缺乏代码审查与验证机制,空间分析结果可能具有“看似可信”的风险。

04 · 展望与启示

面向可信 GIS 智能体的空间分析代码体系

未来 GIS 空间分析将从工具调用走向智能体协作,但无论交互入口如何变化,代码仍是确保分析可控、可信与可追溯的关键机制。

建立代码验证机制

应构建面向 GIS 空间语义的代码审查、单元测试与结果比对机制,特别关注坐标参考、空间拓扑、尺度效应和数据质量等关键问题。

建设可复用代码知识库

将经典空间分析任务沉淀为可复用、可组合、可解释的代码单元,有助于提升 LLM 生成代码的可靠性和领域适配性。

发展 GIS 智能体

面向未来的 GIS 智能体应具备任务理解、代码生成、执行监控、错误修复与结果解释能力,其中代码是智能体行动链条的核心中介。