大语言模型驱动的

街道空间感知评价与语义挖掘方法研究

研究背景与挑战

街道空间感知重要性

  • 理解城市环境特征的重要手段
  • 影响居民出行选择与活动范围
  • 塑造街道使用格局与社会结构
  • 物质、心理、社会空间的投影

传统方法局限

  • 问卷调研:成本高、样本受限
  • 社交媒体:人群偏差、空间定位不确定
  • 计算机视觉:停留在底层视觉特征
  • 难以揭示触发感知的关键语义线索

现有研究路径对比

路径①

问卷访谈实验

优势

贴近真实体验

劣势

成本高、样本受限、难以大规模应用

路径②

社交媒体文本

优势

自发性、丰富语义

劣势

人群偏差、语境噪声、定位不确定

路径③

街景影像视觉

优势

街道尺度量化识别

劣势

停留在底层视觉特征、单一维度

大语言模型核心优势

Core Advantages of Large Language Models

视觉信息与文本信息统一到同一语义表征空间,生成具备常识与价值判断的自然语言描述,充当可重复调用的虚拟市民角色

多模态融合

视觉+文本统一表征

语义理解

高层语义显化表达

虚拟观察者

可重复调用评价

可解释性

可追溯语义依据

级联分析框架

构建从街景影像→语义描述→量化感知→地理空间格局的级联分析框架,实现客观建成环境与主观感知评价的有机联通。

1

数据采集

  • • OSM路网
  • • 50m间距
  • • 百度时光机
  • • 122,264张影像
2

语义生成

  • • TBL提示词
  • • Qwen2-VL-72B
  • • 感知描述
  • • 情绪标签
3

感知量化

  • • BERT模型
  • • Bi-LSTM网络
  • • 连续评分
  • • 细粒度表征
4

空间分析

  • • TAZ聚合
  • • Moran's I
  • • 空间格局
  • • 语义挖掘

三重底线理论(TBL)

基于可持续发展三重底线理论,构建"生态-社会-经济"提示词体系,系统评估街道空间的多维感知特征。

生态维度

  • • 绿化覆盖率
  • • 环境整洁度
  • • 空气质量
  • • 自然景观

社会维度

  • • 安全感
  • • 秩序性
  • • 文化氛围
  • • 社会活力

经济维度

  • • 商业活力
  • • 设施完善度
  • • 功能效能
  • • 经济活跃度

语义挖掘技术

共词网络分析

识别高频关键词及其共现关系

LDA主题模型

提取潜在主题与语义结构

TF-IDF分析

量化词汇重要性与特征权重

文本知识图谱

构建语义实体关系网络

核心研究发现

正向感知区域

空间分布

主要集中于二、三环路

驱动因素

"协同效应":红墙、绿化、商业活力、文化符号

典型特征

高绿化、整洁有序、文化商业丰富

负向感知区域

空间分布

多位于城市外围及功能不完善片区

驱动因素

"短板效应":废墟、裸土、建筑垃圾、工业噪声

典型特征

设施缺失、噪声干扰、环境污染

四大主题驱动因素

自然生态

绿化、环境、空气质量

功能效能

设施完善、秩序性

历史文化

文化符号、历史氛围

商业活力

商业氛围、经济活跃

核心发现与洞察

Core Findings and Insights

协同效应

正向感知区域的品质提升源于多个积极因素的协同作用

  • 红墙、绿化、商业、文化多维度叠加
  • 整体环境质量的非线性提升
  • 多要素协同创造高品质空间

短板效应

负向感知区域的品质下降由特定负面因素主导

  • 废墟、裸土、垃圾等关键短板
  • 单一负面因素拖累整体感知
  • 消除短板比美化提升更关键

空间格局特征

中心-外围梯度

显著的递减分布格局

强空间集聚

正负感知区域显著聚类

历史商业关联

与保护区和商圈空间相关