北航高低无人机协同导航新范式:复杂环境不再迷航

北航团队高低无人机协同导航新范式,突破单机局限,复杂环境精准目标搜索有新解。

原文标题:一机迷航,双机成行!北航高低无人机协同导航方案:高空掌全局+低空查细节,复杂场景不迷航

原文作者:数据派THU

冷月清谈:

北航刘偲教授团队提出了一种创新的高低无人机协同导航方案——AeroDuo框架,旨在解决单台无人机在复杂、广阔环境中进行目标搜索和导航时面临的局限性。传统单机模式下,无人机在宏观感知与精细识别之间难以兼顾,容易迷失方向或错过目标。
该方案通过两台无人机的明确分工实现协同作战:高空无人机充当“全景指挥官”,负责全局环境感知、路径规划与粗略目标区域识别,为下方协作伙伴提供宏观指引;而低空无人机则扮演“地面侦察员”,执行精细化的导航、避障和最终目标识别任务。文章通过实例展示了其在查找指定汽车、小型宠物乃至带有特定标记物目标时的协同效率。
为支持这一创新模式,团队构建了包含高空无人机轨迹与感知数据的新型HaL-13k数据集,并在OpenUAV仿真环境中进行了严格测试。技术细节方面,高空无人机利用Pilot-LLM多模态统一框架进行推理,结合全局地图构建模块与轻量解码器优化环境理解与目标定位。低空无人机则采用三阶段导航搜索策略:基于高空预测规划航点、强化学习避障以及视觉语言模型进行目标检测。
该协同模式未来可轻松扩展至多机协作,并通过优化动作控制与补充真实环境数据,加速从仿真环境向现实场景的迁移。这一研究成果有望大幅提升无人机在复杂应用场景中的自主性与任务成功率。

怜星夜思:

1、这套高低无人机协同导航方案在仿真环境里效果显著,但如果真要投入到实际应用,比如灾后搜救、城市测绘或者野外巡逻,你觉得它最可能遇到哪些意想不到的“水土不服”?是天气、通信、还是法规障碍?
2、文章提到“双机成行”,相比于单台更先进、集成度更高的无人机,这种高低双机协同模式在总体成本(包括初期投入、维护、运营等)和能源消耗上,是更经济高效还是更昂贵复杂?它真正的优势体现在哪里?
3、除了文中所说的找车、找狗这类目标搜索,高低无人机协同技术还有哪些你觉得很有趣或者重要的潜在应用场景?同时,随着这种高精度、大范围的侦察能力提升,你觉得它可能引发哪些关于个人隐私或社会安全的讨论?

原文内容

图片
本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处
本文约1200字,建议阅读5分钟
无人机在复杂环境中不怕迷失方向了,迅速找到目标!


北航刘偲教授团队提出高低无人机协同导航新范式,两台无人机分工配合:高空无人机作为“全景指挥官”,负责全局感知与推理;低空无人机作为“地面侦察员”,执行精细导航与目标搜索,两者协同快速找到目标。

话不多说,来看实例。想让无人机“去湖边指定房子附近找到那辆停在树下的汽车”,单台无人机要么飞得太高,看不到树下的汽车;要么飞得太低,顾不上房子、湖泊这些宏观地标。单台无人机在复杂环境中容易迷失方向,但当高低空无人机协同作战,就能快速找到目标:

如下三张图分别从“前视图、高低无人机轨迹、概率预测图”角度,展示此方案如何工作:

图片

像找小狗这样的小型目标,也能快速配合完成定位:

图片

若目标物标有特定字母、文字描述也可精准匹配:

图片

依据目标人物周边环境的细节特征,也能完成精准识别:

图片

为支持该任务,团队基于UAV-Need-Help构建了HaL-13k数据集,并设计了协作框架AeroDuo。他们在Openuav仿真环境对AeroDuo测评,验证了其高低协同在环境覆盖、导航精度与自主性之间的有效平衡。

团队表示,本文研究成果将发表于ACM MM 2025。以下是更多细节。

数据集构建


考虑到UAV-Need-Help数据集中仅包含单无人机信息,研究团队在此基础上补充采集了高空无人机的轨迹与感知数据,并优化部分原始轨迹,构建出HaL-13k数据集。数据集构建示意图如下:

高空无人机规划策略


为提升高低无人机系统的感知与决策能力,研究团队构建了多模态统一框架Pilot-LLM,利用大语言模型进行多模态推理。

其中,为了更好地整合高空无人机历史信息,研究团队提出全局地图构建模块,通过正射投影消除畸变,并拼接历史图像生成统一坐标系下的地图,提升环境理解与目标定位能力。

此外,为避免精确坐标预测误差,采用轻量解码器生成目标概率分布图,兼顾探索能力与空间建模效果。

低空无人机导航搜寻策略


低空无人机采用三阶段导航搜索策略:首先,根据高空无人机的预测概率图选取高置信度区域的质心作为导航目标并结合A*算法规划关键航点;随后,利用基于强化学习的避障策略,实现安全灵活的路径执行;最后,通过视觉语言模型进行目标检测与定位。

团队表示,未来这套协同模式能轻松扩展到多机协作——在高空无人机预测出目标概率分布图后,它可以提取多个潜在目标位置,并借助优化算法(如匈牙利算法)将这些任务分配给各个低空无人机。

同时,通过优化动作控制确保安全避障,补充真实环境数据训练模型,也有助于将高低无人机系统从仿真环境中迁移到现实场景。

项目主页:https://rey-nard.github.io/AeroDuo_project/

编辑:文婧



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


实际部署最大的“水土不服”我认为是法规和公众接受度。尤其在中国,无人机飞行需要严格审批,双机同时作业在空域管理上会更复杂。另外,高空无人机可能会引发公众对隐私的担忧,即使是“正义”的搜救任务,也可能因为误解或恐慌而受阻。如何在技术验证的同时,与政策制定者和公众进行有效沟通,是其大规模应用的关键。

哇塞,这玩意儿要是民用化,想象空间太大了!比如大型户外活动的人流监控和寻人;探险队在复杂地形下的前行探路和营地选址;甚至是可以帮助影视制作团队快速找到最佳拍摄角度和取景地!当然,这种技术一旦落入不法分子手中,那简直是“偷拍神器”加“侦察利器”,想想就有点毛骨悚然。如何确保技术不被滥用,这比技术本身还难。

我觉得很重要的应用是“应急响应”和“环境监测”。比如地震、洪水后的灾情评估,高空机可以快速绘制受灾区域全貌,低空机深入废墟寻找幸存者或定位危险源。环境监测方面,高低配合可以更全面地监测大气污染扩散、水体富营养化等问题。至于隐私,这确实是所有高精度感知技术都绕不开的话题。核心在于“谁在使用”、“用于何种目的”,以及“是否获得了授权”。我们可能需要更健全的法律法规,就像现在摄像头遍布街头一样,关键是透明度和问责机制。

哈哈,我看最可能“水土不服”的就是——续航!双机一起飞,电池消耗肯定双倍甚至更多。万一低空机需要长时间精细搜索,高空机却没电了,那不就成了“空中放风筝”了嘛?还有,要是两台无人机在真实环境下不小心“撞车”了怎么办?仿真里可以无限重来,现实可就都是钱啊!

哥俩好,干活不累!你想啊,一个人既要看地图找大方向,又要低头找钥匙,肯定手忙脚乱。现在有一个“高个子”帮你指路,一个“矮个子”帮你钻草丛找东西,效率那不是蹭蹭往上涨?虽然买两台车肯定比买一台贵,但一台车可能根本到不了目的地,或者半路就抛锚了。所以,看最终能解决什么问题,以及解决问题的成功率和可靠性。有时候“贵”一点,但能顺利完成任务,就是最大的“经济高效”。

这种“分工合作”的模式,其真正的优势在于任务的“解耦”和“优化”。单台高度集成的无人机,其传感器、算力、续航都必须同时满足宏观和微观需求,这往往意味着性能上的妥协或更高的制造成本。而高低双机,高空机可以专注于大范围感知和路径规划,低空机则专注于局部细节捕捉和精准避障。这样可以选用更符合各自任务特性和成本效益的硬件,同时大大降低了单个系统的复杂性,提升了整体任务的效率和成功率。

潜在应用非常广阔,比如精准农业领域的病虫害识别与喷洒、森林防火的早期预警与火点侦察、基建巡检(高空总览结构,低空检查裂缝)、物流配送的“最后一公里”路径优化,甚至可以是户外广告投放的精确选址。然而,其强大的侦察能力确实可能引发隐私争议。高空机的大范围监控可能无意中获取大量个人住家或活动信息,低空机的精细识别又能捕捉到具体人脸或行为。如何界定“公共利益”与“个人隐私”的边界,制定清晰的数据采集、存储和使用规范,将是这类技术健康发展的关键挑战。

从总体成本看,初期投入两台无人机可能略高,但考虑到任务成功率的提升和单机无法完成的复杂任务,这种模式的“效费比”很可能更高。尤其是一旦一台无人机出现故障,另一台仍可继续执行或辅助撤离,提供了冗余和鲁棒性。能源消耗方面,专业化分工可能意味着每台无人机能更聚焦地完成任务,避免单机为了兼顾全局和细节而进行过多的飞行调整和重复探测,从长远看可能更高效。

现实环境的复杂性远超仿真。首先是恶劣天气条件对飞行稳定性、传感器的影响会非常大,比如强风、降雨、沙尘暴可能直接影响飞行安全和图像质量。其次是无线通信的可靠性,城市高楼、山体遮挡都会导致信号中断或降级,双机协同对通信带宽和延迟要求更高。最后,物理世界中电磁干扰源远比仿真多,可能导致各类传感器数据漂移甚至失效。