在公共安全、民用经济及军事领域,无人机自主定位能力是核心支撑。传统 GNSS 在复杂环境下易受干扰、遮挡或攻击而失效。视觉绝对定位通过将无人机实时影像与带地理参考的先验数据(卫星影像、DEM、矢量地图等)进行映射,直接解算全局坐标系下的位姿,成为实现全时域、多场景鲁棒定位的关键替代方案。
无人机在低空、城市峡谷、战场对抗、灾害现场等环境中,常面临 GNSS 信号不稳定甚至不可用的问题,视觉绝对定位因此成为自主导航的重要方向。
卫星导航在复杂电磁环境、城市密集区、森林峡谷和室内外过渡区域中容易出现信号丢失或定位漂移。
通过实时机载影像与带地理参考的先验数据匹配,直接获得无人机在全局坐标系中的位置与姿态。
无人机影像与卫星影像、DEM 或地图数据在尺度、视角、光照、季节、传感器模态上差异显著,匹配难度大。
无人机 AVL 方法经历了从局部特征对齐、全局图像检索到深度学习语义匹配的发展过程,其核心是逐步增强跨域鲁棒性。
早期方法借鉴图像配准技术,利用 SIFT、SURF、ORB 等特征进行关键点提取、描述子匹配与几何一致性验证。该类方法可解释性强,但对剧烈视角变化、光照变化与跨模态差异较敏感。
将无人机当前视图作为查询影像,在大范围地理参考数据库中检索相似影像,再通过局部匹配或位姿估计完成定位。该思路适合大范围候选区域筛选,但数据库构建和高效索引是关键。
深度网络能够学习具有更强语义表达和跨域不变性的特征,从“特征对齐”转向“场景认知”。包括卷积网络、Transformer、对比学习、跨视角匹配和视觉-语言先验等方向。
视觉绝对定位的关键在于建立实时影像与先验地理数据之间的稳定映射关系。
不同先验数据提供互补信息:影像提供纹理,DEM 提供地形,矢量地图提供语义结构。
无人机 AVL 的难点并不只是图像匹配,而是要在真实飞行约束下同时保证定位精度、鲁棒性、实时性与可部署性。
未来无人机视觉绝对定位将从单一影像匹配走向多源地理先验协同,从离线高精度算法走向端侧实时智能定位。
融合卫星影像、DEM、矢量地图、三维场景与语义地图,可弥补单一数据源在遮挡、季节变化和纹理退化场景下的不足。
无人机平台对算力、功耗和载荷敏感,未来需发展模型压缩、知识蒸馏、轻量 Transformer 与硬件协同优化方法。
需要构建覆盖不同地貌、季节、传感器和飞行高度的标准化基准数据集,并形成面向任务风险的定位精度与可靠性评估体系。