基于波谱形状匹配与随机森林的
农作物样本纯化方法

吴瑞娟、龚雪、钟旭珍地球信息科学学报 · 2026 · 28(6): 1732-1747 DOI: 10.12082/dqxxkx.2026.250263

高质量训练样本是农作物遥感精细分类的核心基础，但人工采样和目视解译成本高、效率低，历史底图或迁移样本又常含有噪声。本文面向多类农作物种植区，提出一种结合波谱形状匹配与随机森林的多阶段样本纯化方法：先利用历史农田矢量和多源作物栅格产品生成初始样本，再基于全生长季 Sentinel-2 时间序列特征，利用动态时间规整进行波谱形状筛选，并通过随机森林进一步剔除异常样本，最终提升深度学习作物分类精度。

农作物分类样本纯化 DTW 随机森林 Sentinel-2 全生长季

↓ 向下滚动阅读

01 · 研究背景与问题

自动生成样本的关键瓶颈是“噪声样本”

农作物分类依赖大量高质量样本。自动样本生成可降低人工成本，但历史底图、已有栅格产品和迁移样本常存在时相滞后、类别混淆、边界误差和作物轮作变化，若直接用于训练会显著影响分类模型性能。

成本高

人工样本采集难以规模化

实地调查和目视解译需要大量人力与专业知识，难以满足大范围、多作物、年度更新的训练样本需求。

噪声多

历史产品不等于当前真实样本

农作物存在轮作、改种和物候差异，历史农田矢量或已有作物产品生成的样本可能包含错标和混合像元。

相似强

多类作物光谱差异细微

玉米、水稻、大豆、小麦等作物在某些生长期光谱接近，单时相特征难以稳定区分，需要利用全生长季时序形状。

02 · 技术路线

从初始样本生成到 DTW 与 RF 双重纯化

研究技术路线包括特征提取、初始样本生成、波谱形状匹配纯化、随机森林筛选和深度学习分类五个环节。核心思想是先用物候曲线相似性剔除明显异常，再用分类器不确定性进一步筛查噪声。

M1

全生长季光谱与指数特征构建

基于 Sentinel-2 影像构建多时相光谱序列，并计算 NDVI 等 7 类植被或水体相关指数，以增强不同农作物在生长季内的区分度。

Sentinel-2NDVITime SeriesPhenology

M2

历史底图与多源产品生成初始样本

利用历史农田矢量数据和多源农作物栅格产品自动提取候选样本，形成覆盖多类作物的初始训练样本集。

Historical MapCrop ProductAuto Labeling

M3

DTW 波谱形状匹配与随机森林筛选

动态时间规整用于比较样本曲线与作物典型物候曲线的形状相似性，适应不同区域物候相位偏移；随机森林进一步基于特征空间分类置信度筛除异常样本。

DTWSpectral ShapeRandom ForestSample Filtering

样本纯化流程

Historical Farmland & Crop Products
→ Initial Samples
→ Sentinel-2 Temporal Features
→ DTW Shape Matching
→ RF Confidence Screening
→ Purified Training Samples

流程把“自动样本生成”的高效率与“多阶段质量控制”的稳健性结合起来。

DTW 的作用

Compare crop temporal curves
Allow phenological phase shifts
Measure shape similarity
Remove samples with abnormal growth curves

DTW 适合处理作物生长曲线在时间上略有提前或滞后的情况，比简单逐时相距离更适合物候匹配。

03 · 方法优势与应用价值

让自动样本更接近“可训练样本”

本文贡献不只是生成更多样本，而是强调样本质量控制。通过波谱形状匹配与机器学习筛选，能够在降低人工成本的同时，提高样本纯度和分类模型稳定性。

Auto

自动生成

减少人工标注

DTW

形状匹配

利用作物物候曲线

RF

机器筛选

剔除特征异常样本

DL

分类提升

服务深度学习训练

相对直接使用历史样本的改进

能够识别因轮作、改种、边界错位导致的错误样本。
基于全生长季曲线而非单时相影像，作物区分更稳健。
多阶段纯化降低噪声对深度学习分类模型的负面影响。

相对单一规则纯化的改进

DTW 负责物候曲线形状一致性判断，适应生长季相位差。
随机森林利用多维特征空间识别分类边界附近的不可靠样本。
二者互补，可同时处理时序异常和特征异常。

04 · 结论与启示

样本纯化是作物精细分类的重要前置环节

本文为多作物区域的自动样本生产提供了一条“历史数据生成—时序形状匹配—机器学习筛选—分类应用”的可迁移路径，尤其适合高分辨率遥感农作物年度制图任务。

提高样本纯度

DTW 与随机森林的组合能够有效剔除错标样本和异常样本，提升训练数据可靠性。

增强分类精度

纯化后的样本更符合目标年份和目标区域的真实物候特征，有助于提升深度学习分类表现。

具备推广潜力

该方法可迁移到不同农作物种植区，为大范围、低成本、年度化作物制图提供支撑。

基于波谱形状匹配与随机森林的农作物样本纯化方法