红色旅游典型线路识别及游客行为模式研究:基于 TF-IDF-KMeans 模型的实证分析

肖亮 · 柯日宏 · 王贶 · 等 地球信息科学学报 · 2026 · Vol.28 No.5 · pp.1395-1411

红色旅游是传承革命文化、推动区域经济发展的重要抓手。现有研究多依赖问卷调查,难以捕捉大规模游客的真实时空轨迹与“组合偏好”。本文以长沙市为例,依托大规模手机定位数据,构建 TF-IDF-KMeans 模型,系统识别典型红色旅游线路,剖析景区功能定位,并揭示不同属性游客的偏好差异,为红色旅游资源的整合优化提供科学依据。

红色旅游 游客行为模式 手机定位数据 TF-IDF-KMeans 典型线路识别 长沙市
向下滚动阅读

01 · 研究背景与目的

从单一景区到系统化线路挖掘

突破传统问卷调查的局限,利用大数据捕捉游客在景区选择上的真实“组合偏好”。

红色旅游重要性

传承文化与振兴经济

红色旅游不仅是爱国主义教育的核心载体,也是促进区域经济发展和乡村振兴的重要抓手,国家政策强调科学规划线路。

现有研究局限

数据与视角的双重瓶颈

传统研究多依赖小样本问卷,且集中于单一景区评价,缺乏从“线路”层面系统揭示形成逻辑及模式差异的研究。

研究目标

大数据驱动的模式识别

依托长沙市 707 万用户手机定位数据,构建 TF-IDF-KMeans 模型,识别典型线路、划分行为模式并剖析游客偏好。


02 · 研究方法

TF-IDF-KMeans 典型线路提取模型

通过引入文本挖掘中的 TF-IDF 权重机制,有效抑制通用型高频节点对聚类模型的干扰。

M1
出行链提取与游客识别

采用时空阈值法(100m, 10min)识别停留点。通过“夜间最大停留点法”区分本地与外地游客,最终筛选出外地红色游客 19.4 万人,本地 3.1 万人。

时空阈值法夜间最大停留点
M2
频繁旅游线路提取

使用 FP-Growth 算法进行频繁项集挖掘,提取在游客群体中高频共现的景区组合,构建初始线路集。

FP-Growth频繁项集
M3
TF-IDF 加权与 PSO-KMeans 聚类

计算游客对各线路的 TF-IDF 权重,赋予高频但分布广泛的热门线路较低权重。引入粒子群优化算法 (PSO) 优化 K-Means 初始中心,避免局部最优。

TF-IDF 加权PSO-KMeans

TF-IDF 加权特征向量

TF-IDF_{i,j} = (f_{i,j} / Σ_k f_{i,k}) · log(N / n_j)

逻辑:赋予访问频率高但分布广泛的热门线路较低权重,赋予低频但具区分度的线路较高权重,解决热门景区导致的聚类失真。

游客出行特征指标

• 轨迹时间跨度 (T)
• 活动半径 (Rg)
• 时间熵 (H1)
• 日均访问地点数量 (St)
• 行游比 (R(e/r))

从时间分配、空间范围、访问强度等维度全面量化游客行为模式。


03 · 实验结果与分析

6 大线路模式与游客群体偏好

基于最优聚类簇数 K=17,归纳出 6 种主要红色旅游模式,并揭示了显著的群体差异。

红色旅游线路主要模式划分
模式名称 核心景区示例 游客占比 特征描述
核心景区模式 橘子洲、岳麓山 55.97% 空间局限,多为单点/双点游,本地游客占比高,出行节奏规律。
红色+文化古迹 橘子洲、太平街、湖南博物院 21.91% 游玩周期长,强度大,时间利用效率高。
红色+休闲娱乐 橘子洲、世界之窗、海底世界 7.61% 复合型游玩,活动结构丰富。
红色教育 胡耀邦故里、刘少奇故里 7.45% 活动半径最大 (20.82 km),跨区域流动性强,行游比高,以纪念性参观为主。
红色+自然景观 橘子洲、洋湖湿地公园 5.58% 兼顾生态与红色文化。
红色+旅游度假 铜官窑、大王山旅游度假区 1.48% 活动半径大,访问地点多,但停留天数较短。
景区功能定位分化
  • 起点 (橘子洲): 多数线路的首选出发地,具有极强的吸引力。
  • 枢纽 (岳麓山): 承担行程中的衔接与中转,网络连通性强。
  • 终点/外围 (远郊景区): 如刘少奇故里,多作为远郊线路的起终点组合,发挥补充和延伸作用。
游客群体偏好差异
  • 性别: 男性偏好“红色教育”深度游;女性偏好“红色+休闲/自然”复合游。
  • 年龄: 青年注重高效率打卡;中年青睐教育意义;老年偏好知识性轻度游。
  • 地域: 外地游客偏好标志性景区全景体验;本地游客倾向短线日常休闲。

04 · 讨论与结论

理论贡献与实践指导意义

本研究不仅在方法论上优化了轨迹聚类,更为红色旅游的精细化管理与产品供给提供了实证支撑。

方法论创新

引入 TF-IDF 权重机制优化了传统轨迹聚类,有效解决了热门景区导致的聚类失真问题,更精准地识别出具有明确主题指向的出行链。

理论发现

验证了旅游节点的“多功能性”,并发现“体验显著性”能在一定程度上超越空间邻近性,解释了游客跨越长距离访问特定景区的动机。

实践建议

建议强化核心景区的辐射联动作用,推动分层次、差异化的产品供给(如针对青年的“特种兵式”组合游),并优化远郊景区的交通衔接。