街道空间感知评价与语义挖掘研究

研究背景与挑战

街道空间感知重要性

理解城市环境特征的重要手段
影响居民出行选择与活动范围
塑造街道使用格局与社会结构
物质、心理、社会空间的投影

传统方法局限

问卷调研：成本高、样本受限
社交媒体：人群偏差、空间定位不确定
计算机视觉：停留在底层视觉特征
难以揭示触发感知的关键语义线索

现有研究路径对比

路径①

问卷访谈实验

优势

贴近真实体验

劣势

成本高、样本受限、难以大规模应用

路径②

社交媒体文本

优势

自发性、丰富语义

劣势

人群偏差、语境噪声、定位不确定

路径③

街景影像视觉

优势

街道尺度量化识别

劣势

停留在底层视觉特征、单一维度

大语言模型核心优势

Core Advantages of Large Language Models

将视觉信息与文本信息统一到同一语义表征空间，生成具备常识与价值判断的自然语言描述，充当可重复调用的虚拟市民角色。

多模态融合

视觉+文本统一表征

语义理解

高层语义显化表达

虚拟观察者

可重复调用评价

可解释性

可追溯语义依据

级联分析框架

构建从街景影像→语义描述→量化感知→地理空间格局的级联分析框架，实现客观建成环境与主观感知评价的有机联通。

1

数据采集

• OSM路网
• 50m间距
• 百度时光机
• 122,264张影像

2

语义生成

• TBL提示词
• Qwen2-VL-72B
• 感知描述
• 情绪标签

3

感知量化

• BERT模型
• Bi-LSTM网络
• 连续评分
• 细粒度表征

4

空间分析

• TAZ聚合
• Moran's I
• 空间格局
• 语义挖掘

三重底线理论（TBL）

基于可持续发展三重底线理论，构建"生态-社会-经济"提示词体系，系统评估街道空间的多维感知特征。

生态维度

• 绿化覆盖率
• 环境整洁度
• 空气质量
• 自然景观

社会维度

• 安全感
• 秩序性
• 文化氛围
• 社会活力

经济维度

• 商业活力
• 设施完善度
• 功能效能
• 经济活跃度

语义挖掘技术

共词网络分析

识别高频关键词及其共现关系

LDA主题模型

提取潜在主题与语义结构

TF-IDF分析

量化词汇重要性与特征权重

文本知识图谱

构建语义实体关系网络

核心研究发现

正向感知区域

空间分布

主要集中于二、三环路

驱动因素

"协同效应"：红墙、绿化、商业活力、文化符号

典型特征

高绿化、整洁有序、文化商业丰富

负向感知区域

空间分布

多位于城市外围及功能不完善片区

驱动因素

"短板效应"：废墟、裸土、建筑垃圾、工业噪声

典型特征

设施缺失、噪声干扰、环境污染

四大主题驱动因素

自然生态

绿化、环境、空气质量

功能效能

设施完善、秩序性

历史文化

文化符号、历史氛围

商业活力

商业氛围、经济活跃