本文面向地图定位任务中的认知负荷量化问题,将眼动追踪技术与机器学习算法融合,构建基于眼动特征的地图认知负荷自动评估模型。研究通过 2D 平面地图、3D 建筑地图和卫星影像地图三类定位任务采集被试眼动数据、响应时间和 NASA-TLX 主观评分,进一步提取瞳孔、注视、扫视和视线运动等多维特征,并比较逻辑回归、随机森林、支持向量机、LSTM 与 CNN 等模型性能,验证了随机森林在小样本地图认知负荷识别中的优势。
随着 GIS 进入智能交互阶段,地图不再只是静态信息载体,而是动态、个性化的空间交互界面。用户需要的不仅是“看见信息”,更是“高效理解信息”。因此,实时、客观、可量化地评估用户认知负荷,成为自适应地图系统的重要前提。
常用问卷和访谈依赖用户自陈,易受记忆偏差、个体表达差异和任务后回顾影响,难以直接反映实时认知状态。
任务正确率和响应时间可以反映结果,但难以解释用户在定位过程中如何搜索、判断、犹豫和调整注意力。
若地图系统能够识别用户负荷过高,就可自动简化符号、突出目标、降低信息密度或提供辅助导航提示。
研究采用组间实验设计,以地图类型作为自变量,以眼动指标、任务响应时间和 NASA-TLX 主观负荷评分作为因变量,系统比较不同地图表达方式带来的认知负荷差异。
实验招募 30 名研究生,其中男性 15 名、女性 15 名。所有被试视力正常或矫正正常,均为右利手,具备系统地图读图训练背景,但对实验区域无先验知识。研究使用圣巴巴拉方向感量表评估空间认知能力,并据此平衡 2D、3D 和卫星影像三个实验组。
实验材料来自高德地图,选取同一地理区域的三种表达形态:2D 平面地图、3D 建筑地图和卫星影像地图。任务流程包括 6 秒自由浏览、根据提示圈定指定地理名称位置,以及完成 NASA-TLX 主观负荷评价。
使用七鑫易维 aSee Pro 桌面式眼动仪,采样率为 140 Hz。对瞳孔直径异常值采用 IQR 方法识别,并结合线性插值填补缺失;对视线移动速度进行插值和平滑处理,以降低噪声影响。
研究以 0.5 秒为时间窗口提取 106 项眼动特征,包括瞳孔直径、瞳孔变化率、双眼差异、视线移动速度、注视时间、扫视时长、扫视振幅等。随后使用 Kruskal-Wallis 检验进行统计筛选,再用随机森林重要性与 Jenks 自然断点法保留 10 个核心特征。
研究从任务绩效、主观负荷、眼动特征和机器学习分类四个角度验证不同地图类型的认知负荷差异,并比较多类模型的分类性能。
2D 地图符号化程度高、信息组织清晰,平均反应时间最短,为 115.23 秒;NASA-TLX 得分最低,为 39.35。
3D 地图增强空间直观性,但建筑立体结构也增加视觉复杂度。平均反应时间为 138.25 秒,NASA-TLX 得分为 41.06。
卫星影像信息量大、纹理复杂、抽象程度低,平均反应时间最长,为 175.72 秒;NASA-TLX 得分最高,为 49.53。
| 模型 | 平均准确率 | AUC 值 | 稳定性 | 结论 |
|---|---|---|---|---|
| 随机森林 RF | 0.743 | 0.8748 | ±0.029 | 综合性能最优 |
| 支持向量机 SVM | 0.672 | 0.4511 | ±0.024 | 准确率较高但 AUC 表现不足 |
| 卷积神经网络 CNN | 0.589 | 0.7190 | ±0.036 | 受限于样本量和特征输入 |
| 长短期记忆网络 LSTM | 0.582 | 0.7505 | ±0.028 | 时序优势未充分发挥 |
| 逻辑回归 LR | 0.529 | 0.5909 | ±0.017 | 线性模型表达能力有限 |
本文证明,眼动追踪可以将地图阅读过程中的注意分配、搜索行为和生理反应转化为可建模特征,而机器学习能够进一步实现认知负荷等级的自动判别。这为地图设计、人机交互和智能导航系统提供了新的评价与优化工具。
融合眼动追踪与机器学习的技术框架能够实现地图定位认知负荷的自动化、定量化评估。
瞳孔直径、瞳孔变化率及双眼差异等生理指标对认知负荷变化具有较高敏感性。
随机森林在小样本、多特征、非线性地图认知数据中表现稳定,适合构建实用评估模型。