高质量训练样本是农作物遥感精细分类的核心基础,但人工采样和目视解译成本高、效率低,历史底图或迁移样本又常含有噪声。本文面向多类农作物种植区,提出一种结合波谱形状匹配与随机森林的多阶段样本纯化方法:先利用历史农田矢量和多源作物栅格产品生成初始样本,再基于全生长季 Sentinel-2 时间序列特征,利用动态时间规整进行波谱形状筛选,并通过随机森林进一步剔除异常样本,最终提升深度学习作物分类精度。
农作物分类依赖大量高质量样本。自动样本生成可降低人工成本,但历史底图、已有栅格产品和迁移样本常存在时相滞后、类别混淆、边界误差和作物轮作变化,若直接用于训练会显著影响分类模型性能。
实地调查和目视解译需要大量人力与专业知识,难以满足大范围、多作物、年度更新的训练样本需求。
农作物存在轮作、改种和物候差异,历史农田矢量或已有作物产品生成的样本可能包含错标和混合像元。
玉米、水稻、大豆、小麦等作物在某些生长期光谱接近,单时相特征难以稳定区分,需要利用全生长季时序形状。
研究技术路线包括特征提取、初始样本生成、波谱形状匹配纯化、随机森林筛选和深度学习分类五个环节。核心思想是先用物候曲线相似性剔除明显异常,再用分类器不确定性进一步筛查噪声。
基于 Sentinel-2 影像构建多时相光谱序列,并计算 NDVI 等 7 类植被或水体相关指数,以增强不同农作物在生长季内的区分度。
利用历史农田矢量数据和多源农作物栅格产品自动提取候选样本,形成覆盖多类作物的初始训练样本集。
动态时间规整用于比较样本曲线与作物典型物候曲线的形状相似性,适应不同区域物候相位偏移;随机森林进一步基于特征空间分类置信度筛除异常样本。
流程把“自动样本生成”的高效率与“多阶段质量控制”的稳健性结合起来。
DTW 适合处理作物生长曲线在时间上略有提前或滞后的情况,比简单逐时相距离更适合物候匹配。
本文贡献不只是生成更多样本,而是强调样本质量控制。通过波谱形状匹配与机器学习筛选,能够在降低人工成本的同时,提高样本纯度和分类模型稳定性。
本文为多作物区域的自动样本生产提供了一条“历史数据生成—时序形状匹配—机器学习筛选—分类应用”的可迁移路径,尤其适合高分辨率遥感农作物年度制图任务。
DTW 与随机森林的组合能够有效剔除错标样本和异常样本,提升训练数据可靠性。
纯化后的样本更符合目标年份和目标区域的真实物候特征,有助于提升深度学习分类表现。
该方法可迁移到不同农作物种植区,为大范围、低成本、年度化作物制图提供支撑。