发布日期:2024-10-01 浏览次数:
近来,“端到端”在车圈火了!特斯拉基于“端到端”FSDV12(完全自动驾驶)方案形成的标杆示范效应,叠加了中国传闻,带动了“蔚小理”等汽车公司和华为、地平线等服务商纷纷转向,增加了端到端的自动驾驶技术。
所谓“端到端”,实际上是一个来自深度学习的概念,英语是“End—to—End(E2E)",是指通过AI模型,只需输入原始数据即可输出最终结果。应用于自动驾驶领域,意味着摄像头、毫米波雷达、激光雷达等传感器收集到的感知信息只需要一个模型,就可以转换成具体的操作指令,如车辆方向盘的旋转角度、加速踏板的踩踏深度、刹车强度等。,这样汽车就可以实现自动驾驶。据小鹏汽车创始人何小鹏介绍,表现得“非常丝滑”,更像是“人类司机驾驶”。
此前,市场上大多数自动驾驶系统都是传统的模块化方式,即人工和智能的混合系统:依靠神经网络感知,人类手动设计的算法用于规划和控制。该系统的优点是分工明确,易于分模块检查和解决缺陷。但问题是,这种模块化的自动驾驶系统在相对简单的驾驶任务中表现良好,其天花板在复杂的驾驶任务面前是显而易见的。即使是被称为遥遥领先的城市高阶智驾功能,仍然会有机械感,也会在汇入高速公路、通过大型路口时停机。
考虑到自动驾驶的核心挑战是解决无尽的边缘场景,难以估计有限人力解决无限长尾问题的成本和时间,数据化和模型化已经成为必然趋势。然而,端到端,也是一项高难度的技术活动,需要老师傅精心打磨。
另一方面,端到端需要大量高质量的数据“投喂”训练。不像大语言模型可以在因特网上爬取大量的文字数据进行训练,端到端智驾所需的视频数据获取成本和难度极高。以特斯拉为例。目前,FSD已经学习了2000多万个人类驾驶视频片段,而这一规模的数据只需要50亿到80亿元就能收集到。
另外一方面,端到端需要强大的计算能力支持。自动化驾驶涉及激光雷达、图像感知、V2X车路协同等技术和解决方案。强大的计算能力不仅有利于海量数据的实时处理,减少数据传输的延迟,还能更好地支持智能城市、智能交通、高水平自动驾驶等全场景。不过,华为汽车BU、目前,百度极越、蔚来、理想、吉利、长城、小鹏等国内企业的计算能力增长都面临着较大的瓶颈。
另一个问题是,计算能力和数据的制约将对算法的发展产生重大影响。虽然国内学术界提出的端到端自动驾驶模型UniAD获得了2023年CPVR最佳论文奖,为国内企业提供了参考方向,但在开环验证系统和小规模样本数据下开发的UniAD需要一定的工程改造和大规模的数据培训才能上车。
另外,端到端会同时放大自动驾驶系统的上限和下限。由于端到端构建了一个神经网络黑箱,在获得更高上限的过程中,使一些传统模块方案具有可解释性。如何在自动驾驶系统中保持可解释性,也将是控制工程师的重要课题,比如不闯红灯,在神经网络中表现出来,保证端到端能够安全应用和进化。
攀登珠峰有两条路线:一条是中国西藏的北坡,另一条是尼泊尔的南坡。无论是从南坡还是从北坡攀登,最终都会达到同样的高峰。它类似于当前自动驾驶的发展路径。尽管目前仍难以判断端到端是自动驾驶的最佳解决方案或最终解决方案,但这并不妨碍企业的创新探索。归根结底,端到端可以比传统的模块化方法更好地处理极端案例,并代表了一种更有效的减少人工编码依赖的思路。基于这条路径,也许自动驾驶可以进入更高的阶段。