大语言模型时代 GIS 空间分析代码：本体论证与展望

侯树洋 · 矫皓月 · 刘子琦 · 等地球信息科学学报 · 2026 · Vol.28 No.6 · pp.1537-1552 DOI: 10.12082/dqxxkx.2026.260125

在大语言模型介入 GIS 空间分析的新范式下，用户交互正在从“工具-参数-执行”转向“自然语言-代码-空间分析”。本文从本体论与方法论角度论证：GIS 空间分析代码不仅是实现工具，更是连接自然语言意图与空间分析结果的形式化驱动机制，是空间分析可执行、可验证、可重放的最小完备单元。

GIS 空间分析大语言模型空间分析代码方法论本体可验证性可重放性

向下滚动阅读

01 · GIS 交互范式的变革

从代码驱动、GUI 封装到自然语言生成代码

空间分析的科学有效性不只取决于结果，更取决于分析过程是否可执行、可验证与可重放。LLM 的出现使代码重新从工具后台走向方法前台。

早期阶段

用户直接编写代码

空间分析过程显性地体现为程序执行逻辑，用户需要理解数据结构、算法调用与流程控制，门槛较高但过程相对透明。

GUI 阶段

代码被工具箱封装

用户通过图形界面配置工具与参数，降低了使用门槛，但也弱化了对空间分析执行结构的理解。

LLM 阶段

自然语言-代码-空间分析

自然语言成为入口，代码成为中介，LLM 负责生成、解释或修正程序，使空间分析过程再次显性化。

02 · 本体论证

为什么代码是空间分析的“方法论本体”？

自然语言具备语义弹性，适合表达意图；程序代码具备形式化确定性，适合承担执行稳定性。因此，在 LLM 时代，代码是空间分析科学有效性的关键支点。

O1

代码具有确定语法与执行语义

GIS 空间分析代码以形式化符号体系表达地理空间对象、空间关系与分析操作。其执行逻辑可被计算机严格解释，不依赖自然语言上下文的模糊推断。

形式化表达执行语义

O2

代码承载完整空间分析过程

从数据读取、坐标参考处理、空间叠加、缓冲区分析、栅格计算到结果导出，代码记录了分析链条的每个关键步骤，是过程复现的核心载体。

过程记录流程控制

O3

代码是自然语言意图的可检验落点

LLM 生成的自然语言解释可能存在歧义或幻觉，而代码可通过运行、单元测试、结果比对和逻辑审查被验证，因而是空间分析可信性的最小完备单元。

可执行可验证可重放

新型交互链条

Natural Language → Code → Spatial Analysis → Result

自然语言负责表达目标，代码负责形式化执行，空间分析结果则必须通过代码逻辑获得可追溯解释。

科学有效性的三要素

Executability
+ Verifiability
+ Reproducibility

代码将空间分析从“能得到结果”提升为“能解释为何得到该结果、能否重复得到该结果”。

03 · 代码的计算主体地位

LLM 不是替代代码，而是重塑代码生产方式

LLM 的价值在于降低代码生成和理解门槛，但空间分析过程的稳定性仍需由代码机制承担。

NL

自然语言

表达任务意图

Code

空间分析代码

承担执行机制

GIS

空间分析引擎

实现算法调用

Trust

可信结果

依赖过程验证

LLM 带来的积极变化

降低 GIS 空间分析编程门槛，使非专业用户也能通过自然语言表达复杂需求。
促进代码解释、自动补全、错误定位与流程重构，提高空间分析效率。
让隐藏在 GUI 后台的执行逻辑重新显性化，推动空间分析过程透明化。

必须警惕的核心风险

LLM 可能生成语法正确但空间语义错误的代码，如坐标系误用、单位混淆、拓扑关系误判。
自然语言描述可能掩盖参数设置、数据预处理和边界条件等关键分析假设。
若缺乏代码审查与验证机制，空间分析结果可能具有“看似可信”的风险。

04 · 展望与启示

面向可信 GIS 智能体的空间分析代码体系

未来 GIS 空间分析将从工具调用走向智能体协作，但无论交互入口如何变化，代码仍是确保分析可控、可信与可追溯的关键机制。

建立代码验证机制

应构建面向 GIS 空间语义的代码审查、单元测试与结果比对机制，特别关注坐标参考、空间拓扑、尺度效应和数据质量等关键问题。

建设可复用代码知识库

将经典空间分析任务沉淀为可复用、可组合、可解释的代码单元，有助于提升 LLM 生成代码的可靠性和领域适配性。

发展 GIS 智能体

面向未来的 GIS 智能体应具备任务理解、代码生成、执行监控、错误修复与结果解释能力，其中代码是智能体行动链条的核心中介。