融合眼动追踪技术与机器学习的
地图定位认知负荷评估

王飞燕、郑束蕾、管弘俊地球信息科学学报 · 2026 · 28(6): 1689-1705 国家自然科学基金项目：42271464 地图认知 / 人机交互 / 自适应地图

本文面向地图定位任务中的认知负荷量化问题，将眼动追踪技术与机器学习算法融合，构建基于眼动特征的地图认知负荷自动评估模型。研究通过 2D 平面地图、3D 建筑地图和卫星影像地图三类定位任务采集被试眼动数据、响应时间和 NASA-TLX 主观评分，进一步提取瞳孔、注视、扫视和视线运动等多维特征，并比较逻辑回归、随机森林、支持向量机、LSTM 与 CNN 等模型性能，验证了随机森林在小样本地图认知负荷识别中的优势。

眼动追踪地图定位认知负荷机器学习随机森林自适应地图

↓ 向下滚动阅读

01 · 研究背景与问题

地图设计正在从“信息展示”转向“认知适配”

随着 GIS 进入智能交互阶段，地图不再只是静态信息载体，而是动态、个性化的空间交互界面。用户需要的不仅是“看见信息”，更是“高效理解信息”。因此，实时、客观、可量化地评估用户认知负荷，成为自适应地图系统的重要前提。

传统方法主观性强

常用问卷和访谈依赖用户自陈，易受记忆偏差、个体表达差异和任务后回顾影响，难以直接反映实时认知状态。

动态过程难以捕捉

任务正确率和响应时间可以反映结果，但难以解释用户在定位过程中如何搜索、判断、犹豫和调整注意力。

自适应地图需要实时感知

若地图系统能够识别用户负荷过高，就可自动简化符号、突出目标、降低信息密度或提供辅助导航提示。

02 · 实验设计与特征工程

用眼动数据刻画地图定位中的认知加工过程

研究采用组间实验设计，以地图类型作为自变量，以眼动指标、任务响应时间和 NASA-TLX 主观负荷评分作为因变量，系统比较不同地图表达方式带来的认知负荷差异。

E1

被试与分组控制

实验招募 30 名研究生，其中男性 15 名、女性 15 名。所有被试视力正常或矫正正常，均为右利手，具备系统地图读图训练背景，但对实验区域无先验知识。研究使用圣巴巴拉方向感量表评估空间认知能力，并据此平衡 2D、3D 和卫星影像三个实验组。

N = 30 SBSOD 组间设计空间能力控制

E2

地图定位任务

实验材料来自高德地图，选取同一地理区域的三种表达形态：2D 平面地图、3D 建筑地图和卫星影像地图。任务流程包括 6 秒自由浏览、根据提示圈定指定地理名称位置，以及完成 NASA-TLX 主观负荷评价。

2D Map 3D Map Satellite Image NASA-TLX

E3

眼动数据采集与预处理

使用七鑫易维 aSee Pro 桌面式眼动仪，采样率为 140 Hz。对瞳孔直径异常值采用 IQR 方法识别，并结合线性插值填补缺失；对视线移动速度进行插值和平滑处理，以降低噪声影响。

aSee Pro 140 Hz IQR 线性插值

E4

特征提取与筛选

研究以 0.5 秒为时间窗口提取 106 项眼动特征，包括瞳孔直径、瞳孔变化率、双眼差异、视线移动速度、注视时间、扫视时长、扫视振幅等。随后使用 Kruskal-Wallis 检验进行统计筛选，再用随机森林重要性与 Jenks 自然断点法保留 10 个核心特征。

0.5 s window 106 features Kruskal-Wallis Jenks

30

被试人数

3

地图类型

106

原始眼动特征

10

最终核心特征

03 · 结果与模型评估

卫星影像地图负荷最高，随机森林识别效果最优

研究从任务绩效、主观负荷、眼动特征和机器学习分类四个角度验证不同地图类型的认知负荷差异，并比较多类模型的分类性能。

低负荷：2D 平面地图

2D 地图符号化程度高、信息组织清晰，平均反应时间最短，为 115.23 秒；NASA-TLX 得分最低，为 39.35。

中负荷：3D 建筑地图

3D 地图增强空间直观性，但建筑立体结构也增加视觉复杂度。平均反应时间为 138.25 秒，NASA-TLX 得分为 41.06。

高负荷：卫星影像地图

卫星影像信息量大、纹理复杂、抽象程度低，平均反应时间最长，为 175.72 秒；NASA-TLX 得分最高，为 49.53。

模型	平均准确率	AUC 值	稳定性	结论
随机森林 RF	0.743	0.8748	±0.029	综合性能最优
支持向量机 SVM	0.672	0.4511	±0.024	准确率较高但 AUC 表现不足
卷积神经网络 CNN	0.589	0.7190	±0.036	受限于样本量和特征输入
长短期记忆网络 LSTM	0.582	0.7505	±0.028	时序优势未充分发挥
逻辑回归 LR	0.529	0.5909	±0.017	线性模型表达能力有限

眼动特征贡献

瞳孔直径及其动态变化率是反映认知负荷的敏感指标。
双眼瞳孔差异在特征重要性中占比突出。
注视与扫视特征可以揭示搜索路径、判断复杂度和视觉负担。
0.5 秒窗口有助于捕捉短时间尺度的认知波动。

性别差异发现

男性在反应时间、注视次数和扫视次数上普遍高于女性。
女性平均瞳孔直径显著高于男性，且任务反应时间更短。
结果提示女性在本实验地图定位任务中可能表现出更高认知效率。
该发现对“男性空间认知能力必然优于女性”的传统观点提出补充视角。

核心发现：在小样本、高解释性要求的地图认知负荷识别场景中，随机森林比深度学习模型更稳定；而瞳孔相关指标，尤其是双眼瞳孔差异，为认知负荷实时感知提供了重要线索。

04 · 结论与应用启示

眼动 + 机器学习为自适应地图系统提供了认知感知接口

本文证明，眼动追踪可以将地图阅读过程中的注意分配、搜索行为和生理反应转化为可建模特征，而机器学习能够进一步实现认知负荷等级的自动判别。这为地图设计、人机交互和智能导航系统提供了新的评价与优化工具。

方法可行

融合眼动追踪与机器学习的技术框架能够实现地图定位认知负荷的自动化、定量化评估。

特征有效

瞳孔直径、瞳孔变化率及双眼差异等生理指标对认知负荷变化具有较高敏感性。

模型优选

随机森林在小样本、多特征、非线性地图认知数据中表现稳定，适合构建实用评估模型。

应用前景

自适应地图：根据用户负荷动态调整符号复杂度和信息密度。
导航辅助：在用户负荷过高时提供语音提示或视觉简化。
个性化服务：面向不同空间能力和使用习惯提供差异化地图表达。
VR/AR 地理环境：优化虚拟场景中的地图信息呈现。

未来方向

扩大样本规模，覆盖不同年龄、专业背景和地图使用经验群体。
融合脑电、皮肤电、心电等多模态生理信号。
将静态定位任务扩展到动态交互、移动导航和实时决策场景。
在大样本数据基础上探索端到端深度学习特征提取。

融合眼动追踪技术与机器学习的地图定位认知负荷评估