智驾突围:从L2.9999到VLA,端到端能否跨越安全鸿沟?

智驾安全成焦点,车企纷纷转向端到端方案。算法、数据闭环和算力成未来竞争关键,L3责任划分推动行业进步。

原文标题:从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?

原文作者:机器之心

冷月清谈:

本文深入探讨了自动驾驶领域从L2.9999向更高阶发展的挑战与机遇,特别关注了端到端智驾技术方案的演进。文章首先分析了各大厂商在智驾宣传上止步于L2.9999的现象,以及L3级别在责任划分上的特殊性。随着相关法规的逐步完善,车企面临着前所未有的安全压力,这推动了端到端解决方案成为主流。端到端架构通过减少信息传递损耗、快速响应突发场景和数据驱动的优化,在反应层面提升了自动驾驶系统的安全性。文章还指出,未来智驾车企的竞争将集中在算法领先性、数据闭环能力及云端算力资源上,而算法是智能驾驶系统的核心。

怜星夜思:

1、现在很多车企都在宣传自己的智驾系统是“无限接近L3”,但又不敢真正跨过那一步,你觉得除了法律责任之外,还有哪些因素导致了这种现象?
2、文章提到端到端智驾是未来的趋势,那么这种技术路线最大的优势和挑战分别是什么?它真的能解决目前智驾安全问题吗?
3、文章中说未来智驾车企的竞争集中在算法、数据和算力上,你认为这三者中哪个最重要?车企应该如何在这三个方面进行布局?

原文内容

机器之心PRO · 会员通讯 Week 20

--- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 ---

1. 从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?

各大厂商智驾宣传坚持「卡」在 L2.999...有何玄机?端到端为何会成为主流叙事?车企在谈论端到端的时候,到底在谈论的是什么?端到端智驾「说得比做得好」,存在哪些瓶颈?特斯拉为何被普遍认为领先市场?从 VLM 到 VLA,再到世界模型,自动驾驶技术正在如何演进?...

2. 争夺 Agent 市场,微软的押宝点竟是「情商」?

情商将微软 AI 的核心竞争力?微软的办公 Agent 和 AI 伴侣如何区分?语音交互能否让 Copilot 脱颖而出,成功超越工具属性?Suleyman 提出的「AI 个性工程」如何带来差异化优势?AI 算力的哪两个趋势正在发生?...


本期完整版通讯含 2 项专题解读 + 29 项 AI & Robotics 赛道要事速递,其中技术方面 12 项,国内方面 7 项,国外方面 10 项。
本期通讯总计 23569 字,可免费试读至 9% 
 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 


要事解读①  从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?

日期2025 年 5 月 16 日

引言:2025 年上半年,国内智驾安全问题逐步被公众所认知。以往的「闭眼开」 「L 2.9999」 「自动驾驶」 「有路的地方都能开」等一系列浮夸宣传已行不通。各大厂商的智驾宣传坚持「卡」在「L2.9999」有何玄机?车企在谈论端到端的时候,到底在谈论的是什么?端到端智驾「说得比做得好」,存在哪些瓶颈?

大厂智驾宣传坚持「卡」在「L2.9999」有何玄机?L3 为何是个特殊的存在

1、根据我国《汽车驾驶自动化分级标准》,汽车驾驶自动化分级从 L0 到 L5,共六个级别。L0 至 L2 属辅助驾驶,需人工全程监管;L3 至 L5 则逐步实现系统主导,其中 L5 为完全无人驾驶。目前,真正意义上的自动驾驶车辆仍处于从示范运营到小规模试点的过渡阶段。[1-1]

2、在国标自动化出台前,国际上常用的汽车自动驾驶技术分级标准主要有美国高速公路安全管理局(NHTSA)和国际自动机工程师学会(SAE)的两个标准。

① SAE 与国标差别不大,但存在细微不同:SAE 将 AEB 等安全辅助功能和非驾驶自动化功能均放在 0 级,归为 「无驾驶自动化」。

② 而中国《汽车驾驶自动化分级》将其称为 「应急辅助」,与非驾驶自动化功能分开。此外,中国版标准在 「3 级驾驶自动化」 中明确增加了对驾驶员接管能力监测和风险减缓策略的要求。[1-2]

3、 L3 级别将驾驶任务的 「主要责任」 从人转移到系统,制造商须对系统在自动驾驶模式下的行为承担法律责任。这与 L2 及以下级别由驾驶员承担责任有本质区别。

① SAE 对 L3 级的定义是:在部分场景中,无人驾驶系统可以完成所有操作,根据系统要求,人类提供适当应答。这意味着驾驶操作的主体和监控车辆周边环境的主体是无人驾驶系统,人类驾驶员仅需提供适当支持。

② 世界经济论坛的报告指出,SAE L3 及以上级别的事故责任将由制造商承担,而 L2 及以下则由驾驶员承担,二者的法律风险天差地别。在 L3 模式下若发生碰撞,原本由驾驶员自行承担的事故赔偿,将转变为产品质量和安全责任,这会令车企面临更为严厉的法律诉讼和监管审查。[1-3]

4、国标 L2 指半自动驾驶,可帮助驾驶员完成部分操作,但出现问题时,责任完全由驾驶人承担。L3 则针对车辆在特定环境下实现部分自动驾驶,允许驾驶员脱手,但事故责任界定模糊。若自动驾驶系统在特定条件下判断有风险并要求驾驶员接管,而驾驶员未及时响应,最终发生事故,责任归属难以明确。事故责任界定是 L2 和 L3 的核心区别。

5、北京市十六届人大常委会第十四次会议通过的《北京市自动驾驶汽车条例》将于 2025 年 4 月 1 日起实施,首次针对 L3 级以上级别的个人乘用车自动驾驶测试上路做出具体规定,并对自动驾驶车辆事故责任划分进行细化,明确可追究软件开发及车辆制造方的相关责任。[1-4]

6、同样,将于 2025 年 3 月 1 日起实施的《武汉市智能网联汽车发展促进条例》,也明确了智能网联汽车和 L3 及以上等级自动驾驶汽车在武汉运营时的具体规定及事故时的责任划分与赔偿责任(车企承担)。[1-5]

7、轻舟智航联合创始人、CEO 于骞认为,衡量是不是真正的 L3,在于出事故后车企敢不敢赔付。L3 不应是营销口号,无论技术如何冗余、法规如何要求,若车企不敢承诺事故赔付,本质上仍是 L2 水平。[1-6]

跨越 L3,端到端为何会成为主流叙事?

1、随着 L3 自动驾驶权责划分的逐步明确,车企面临着前所未有的压力与挑战,而这直接推动了车企对智能驾驶安全的重视。

① 广汽集团董事长冯兴亚强调,作为车企,不能只谈体验,却忽略安全。体验可以交给用户定义,但是安全必须要由车企定义,离开安全谈智驾,就是本末倒置。当责任的界限被清晰划分,车企不得不将安全置于智能驾驶发展的核心位置。[1-8]

② 监管机构也以更严格的标准审视车企的智能驾驶技术。工信部发布新规,明确了测试验证、宣传规范、OTA 管理及事故报告等强制性要求,标志着智能驾驶行业进入强监管时代。[1-9]

2、自动驾驶的安全性是技术进步与社会协同的共同产物。目前法律与伦理框架正逐渐完善,车企也将在平衡创新与风险的过程中,不断优化技术解决方案,增加智驾安全的可实现性。

3、未来智驾车企竞争的方向主要集中在算法领先性、数据闭环能力及云端算力资源。其中,算法领先性、数据闭环能力是车企在技术上争先发力的核心。[1-7]

4、智驾技术中,算法是智能驾驶系统的 「大脑」,决定车辆如何感知环境、理解路况以及作出决策。不同算法设计和优化程度直接影响车辆对复杂场景的识别准确率、反应速度和决策拟人性,而这些指标又与安全性紧密相关。

5、在算法的整体架构上,端到端通过减少信息传递损耗、快速响应突发场景和数据驱动的优化等特点,在反应层面显著提升了自动驾驶系统的安全性,也成为了各车企内卷的主要方向。

我觉得是消费者接受度的问题。很多消费者对自动驾驶技术还不够信任,总觉得把生命交给机器不靠谱。如果车企贸然推出L3,万一出了事故,肯定会影响品牌形象。所以,车企需要慢慢培养消费者的信任感,让他们逐渐接受自动驾驶技术。

从工程角度看,算力是瓶颈。算法再牛,没有足够的算力支持,也跑不起来。所以,车企应该积极与芯片厂商合作,定制高性能的智驾芯片。同时,也要关注云计算、边缘计算等技术,构建强大的算力平台。

我觉得除了法律责任,技术成熟度也是一个重要原因。现在的智驾系统在corner case的处理上还不够完美,很多时候还是需要人工干预。万一在高速上突然遇到恶劣天气或者复杂的交通状况,系统hold不住,驾驶员又没能及时接管,那就容易出事。而且,不同地区的道路状况、驾驶习惯差异很大,一个模型很难cover所有情况。

优势是帅啊!想想以后车自己就能搞定一切,多酷!挑战就是贵啊!算力、数据,哪一样不要砸钱?能不能解决安全问题?我觉得悬,毕竟AI再厉害,也防不住马路杀手。还是得人自己注意安全。

当然是算法最重要!数据和算力都是为算法服务的。算法不行,再多的数据和算力也是白搭。车企应该大力投入算法研发,吸引顶尖人才,打造自己的核心算法竞争力。我觉得搞个算法大赛挺好,能吸引人才,还能宣传品牌。

法律法规是明面上的原因,更深层的是成本考量。要实现真正的L3,需要大量的传感器、高性能的芯片和复杂的算法,这些都会增加车辆的制造成本。而现在汽车市场竞争激烈,价格战打得火热,车企为了控制成本,自然不敢轻易冒险。

学术角度讲,端到端模型避免了传统模块化方案中各个模块之间的信息损失和误差累积,理论上性能上限更高。然而,端到端需要海量数据进行训练,对数据质量和计算资源的要求非常高。另外,这种模型的可解释性也比较差,难以进行安全验证。个人认为,端到端是未来的方向,但需要结合传统方法,才能更好地保证安全性和可靠性。

我觉得三者都很重要,缺一不可,但数据是最基础的。没有高质量的数据,再好的算法和算力也发挥不出来。车企应该建立完善的数据采集、清洗和标注体系,形成数据闭环。同时,也要积极探索数据增强、迁移学习等技术,降低数据需求。

端到端最大的优势是可以减少人工干预,让机器自己学习和决策,避免人为设定的规则带来的局限性。但是,它最大的挑战也是在于“黑盒”特性,我们很难理解模型内部的运行机制,出了问题也很难debug,这在安全性要求极高的智驾领域是一个很大的隐患。至于能否解决安全问题,我觉得它能提升智驾的整体水平,但不能完全杜绝事故的发生。