红色旅游是传承革命文化、推动区域经济发展的重要抓手。现有研究多依赖问卷调查,难以捕捉大规模游客的真实时空轨迹与“组合偏好”。本文以长沙市为例,依托大规模手机定位数据,构建 TF-IDF-KMeans 模型,系统识别典型红色旅游线路,剖析景区功能定位,并揭示不同属性游客的偏好差异,为红色旅游资源的整合优化提供科学依据。
突破传统问卷调查的局限,利用大数据捕捉游客在景区选择上的真实“组合偏好”。
红色旅游不仅是爱国主义教育的核心载体,也是促进区域经济发展和乡村振兴的重要抓手,国家政策强调科学规划线路。
传统研究多依赖小样本问卷,且集中于单一景区评价,缺乏从“线路”层面系统揭示形成逻辑及模式差异的研究。
依托长沙市 707 万用户手机定位数据,构建 TF-IDF-KMeans 模型,识别典型线路、划分行为模式并剖析游客偏好。
通过引入文本挖掘中的 TF-IDF 权重机制,有效抑制通用型高频节点对聚类模型的干扰。
采用时空阈值法(100m, 10min)识别停留点。通过“夜间最大停留点法”区分本地与外地游客,最终筛选出外地红色游客 19.4 万人,本地 3.1 万人。
使用 FP-Growth 算法进行频繁项集挖掘,提取在游客群体中高频共现的景区组合,构建初始线路集。
计算游客对各线路的 TF-IDF 权重,赋予高频但分布广泛的热门线路较低权重。引入粒子群优化算法 (PSO) 优化 K-Means 初始中心,避免局部最优。
逻辑:赋予访问频率高但分布广泛的热门线路较低权重,赋予低频但具区分度的线路较高权重,解决热门景区导致的聚类失真。
从时间分配、空间范围、访问强度等维度全面量化游客行为模式。
基于最优聚类簇数 K=17,归纳出 6 种主要红色旅游模式,并揭示了显著的群体差异。
| 模式名称 | 核心景区示例 | 游客占比 | 特征描述 |
|---|---|---|---|
| 核心景区模式 | 橘子洲、岳麓山 | 55.97% | 空间局限,多为单点/双点游,本地游客占比高,出行节奏规律。 |
| 红色+文化古迹 | 橘子洲、太平街、湖南博物院 | 21.91% | 游玩周期长,强度大,时间利用效率高。 |
| 红色+休闲娱乐 | 橘子洲、世界之窗、海底世界 | 7.61% | 复合型游玩,活动结构丰富。 |
| 红色教育 | 胡耀邦故里、刘少奇故里 | 7.45% | 活动半径最大 (20.82 km),跨区域流动性强,行游比高,以纪念性参观为主。 |
| 红色+自然景观 | 橘子洲、洋湖湿地公园 | 5.58% | 兼顾生态与红色文化。 |
| 红色+旅游度假 | 铜官窑、大王山旅游度假区 | 1.48% | 活动半径大,访问地点多,但停留天数较短。 |
本研究不仅在方法论上优化了轨迹聚类,更为红色旅游的精细化管理与产品供给提供了实证支撑。
引入 TF-IDF 权重机制优化了传统轨迹聚类,有效解决了热门景区导致的聚类失真问题,更精准地识别出具有明确主题指向的出行链。
验证了旅游节点的“多功能性”,并发现“体验显著性”能在一定程度上超越空间邻近性,解释了游客跨越长距离访问特定景区的动机。
建议强化核心景区的辐射联动作用,推动分层次、差异化的产品供给(如针对青年的“特种兵式”组合游),并优化远郊景区的交通衔接。