智能驾驶赛道近期广受市场关注,尤其是国外的特斯拉的FSD以及国内的蔚来汽车、小鹏汽车以及理想汽车等。
这些车企在智能驾驶领域都取得了比较快的进展。
本次访谈的专家是车企供应链的算法专家。
01各家车企在智能驾驶赛道的发展趋势——
国内的头部车企都在仿效特斯拉的智能驾驶方案。
特斯拉的智能驾驶方案落地速度并没有那么快,而且各家车企的优势和劣势也不一样,进度也存在区别。
特斯拉的方案是高精度方案。
有的车企坚持走无图的方案,有的车企还在高精和无图的方案中间犹豫徘徊。
在智能驾驶方面,理想汽车是比较坚决地沿用特斯拉的方案路线,但同时也会结合自身的实际情况进行改造。
方案要能够落地,这样才可以在自己的车型上实现量产理想汽车在2023年的发布会上提出了NPN网络的概念,这是指车端在训练量不够的情况下,在感知方面仍然能够获得不错的效果。
NPN网络可以提前提取道路的特征,车辆的运行会更加平稳,也能够实现无图智查微信功能驾驶方案的效果。
理想汽车最近不太推动高精智能驾驶方案的原因主要是在2023年年初的时候,整个公司的中层管理层去美国进行实地调研。
美国都很认同特斯拉的方案,所以理想也在紧锣密鼓地推动这套方案落地,引入了非常多的行业内的优秀人才,比如引入了华为的人才,引入神经网络AI方面的专家,目前可以不再采用高精方案。
小鹏汽车内部的管理比较混乱,一直有政治站队的问题,内部部门的职责分工存在不明确的问题。
人事方面的问题也映射到了产品的策略方面。
支持高精路线的部门和支持特斯拉无图方案路线的部门还存在着公司资源方面的竞争关系。
目前小鹏汽车在无图方案上的推进速度稍微慢一些,小鹏汽车在感知方面的算法上积累程度是比较深厚的。
这两年小鹏汽车的销售量下滑比较明显,经营压力也比较大。
因此在无图方案上的研发投入不得不有所削减,在外部的直观感受是招聘力度不是很强。
招聘的人员一直围绕发展G6方面的产品,在这个量产的车型中做规则的工作,对无图方案的开拓性不强。
一部分人在坚持做高精的方案。
在无图方案上,小鹏汽车做出来的效果和其他车企相差不大。
小鹏汽车对车道线的静态路网信息识别效果是不错的,但对于识别障碍物的网络效果还非常一般,在稳定性和误差方面的表现都不算好,决策规划方面做得不好,很难应用到量产的车型上,在这点上也是各家车企希望有所突破的地方。
北上广深这几个城市当中上海的智能驾驶高精产业发展得相对更好一些。
过去五六年行业中投入了大量精力对决策规划系统进行研发。
华为是在2022年就意识到需要往无图的智能驾驶方案上进行转换,也在和其他企业合作,争取早点把无图方案用在量产车型上。
华为和小鹏汽车、理想汽车的差异相对比较大。
华为内部的一些人希望靠销售汽车进步巩固华为在行业中的地位,但就是自研的无图方案起步比较晚。
华为目前在推进无图和高精两条技术路线,相关的产业合作也保留了下来。
小鹏和华为都表示2023年要完善无图的方案,在第三季度或者第四季度在全国40个城市进行推广。
02使用高精地图智能驾驶方案中
可能存在的问题——
高精的方案量产进度比较慢。
使用高精地图有个风险,就是高精地图当中可能存在错误。
高精地图并不是所有的内容都绘制得非常准确。
而这种错误目前并没有很好的手段能够把它校验出来。
当车辆行驶到某个路段,表现不太好,也有可能是高精地图本身出了问题。
要依靠研发人员把车上出现问题的数据都收集起来再想办法解决。
地图当中比较多的问题是版本方面的问题。
还有就是对公交车道这种场景如何进行处理的问题,可以考虑让车辆尽量地避让公交车道,这就需要人为的设置一些规则。
远离公交车道也不一定就非常安全,有可能还会遇到其他障碍。
软件版本也不一定能够及时更新。
因为一旦更新以后,就意味着以前的那些效果很稳定的场景可能也会引入新的问题。
到了一定程度后,研发不再改动软件算法,而是对高精地图进行调整,高精智能驾驶的研发速度这时就会慢下来。
有时会出现高精地图本身没有问题,而软件算法本身的版本存在问题。
高精地图智能驾驶方案更多是线性地发展而不思指数级的发展。
2023年下半年高精智能驾驶会渗透一部分城市,但不会特别快。
无图网络2023年落地的效果一般。
智能驾驶对路网、对斑马线的感知能力已经提高了,但目前还不足以应用到量产车型上。
无图技术人员流动比较少,相关企业披露的信息目前不是特别多。
理想汽车和小鹏汽车也会逐渐往无图的技术路线上发展。
03在智能驾驶方面做得比较好的公司——
值得一提的公司是大疆卓驭,在智能驾驶方面做得非常好,有自己的量产项目,纯机器视觉纯无图的,也在车上量产应用了,自动驾驶解决方案售价不是很高,对算力的要求也不算特别高,在从低端市场上往高端市场的方向进行升级,未来会应用在更多车型上,在宝骏车型上已经有比较好的运用,积累的经验会越来越丰富。
圆融在2023年3月就放出了自己的纯无图方案效果的视频。
这个方案还可以进一步改进。
Momenta在L4上花费了太多精力了,人员投入和其他资源投入都比较多,实现量产,转向L2和纯DEV感知的产品,难度不算大,自身储备了几百辆车,算力也有几千个GPU,面临的问题是要不要彻底转向无图的方案。
其实最好的方式是两条腿走路,争取跟行业内各个车企都能够合作。
04问答环节——
Q: DEVTransformer和占用网络,智能驾驶的算法未来发展趋势是什么? 国内各家企业的主流算法目前大概是什么情况?
A:DV是鸟瞰的坐标系,是x,y,z、e这样的坐标系。
它意味着是多个摄像头,通过每个摄像头看到的些环境的信息都输入到坐标系当中并进行融合,形成一整套解决方法或者范式。
Transformer是跟算法相关的。
特斯拉有8个摄像头,每个摄像头都要对环境进行感知,提取图片信息,获取数据,基于Recknet和8FPN做特征提取,每一张图都会转换成标准的图像,对冷暖色调这些信息都要进行处理,把图像里物体的轮廓信息进行抽取,之后是要输入神经网络的。
8个摄像头提取的信息是要做时间和空间上的融合,融合的算法就是Transformer。空间的融合就是每一时刻,车停在什么位置,对空间中的每个物体都要进行感知,摄像头要进行拍照。
比如空间中有一个花坛,每个摄像头拍照的角度都不一样,但是这个花坛在空间中的位置是唯一的。
摄像头要对花坛的坐标点进行预测,要对摄像的要素进行分析、加权。
每个物体都这样去映射,最后形成对整个空间的感知。
做完空间维度的感知,再做时间维度的感知,对多帧进行感知,有的车会和其他的物体相互阻挡,多帧之间的关系要进行处理。
空间信息要进行卷积,卷积到人能认识的维度,这就涉及到空间的占用双络,涉及到运动的交通流。
如果认识到这个物体是车,就不用占用网络去表达,如果是一个无法被认识到的物体,就用占用网络去表达。
特斯拉的这一套做法的Dev和Transformer和占用网络这几件事情,国内企业也想这样做。
特斯拉的环境感知已经达到了很好的效果,有邻线的模型去做三维重建,做完三维重建以后得到非常高质量的静态的路网的增值数据。
举个例子,在北京某个路口有多辆车都在这里开过,然后特斯拉拿到了这多辆车的视频数据,基于这些视频数据通过自己的算法处理出来这个路口的三维高精度的结果,增值数据传输到后台,如果这个路口有新的数据,也会进行处理。
对3D的高精度结果进行标注,哪些是车道线,哪些是运动的车辆,哪些是不认识的物体在什么地方。
特斯拉后面在车端的算法需要升级的时候,就去数据仓库里面去调,然后把这些数据都调用起来去训练车端的模型,这样训练出来的模型会比较好。
特斯拉做车端的模型的时候,大量的数据是在离线的云端。
三维重建和自动标注的质量都比较高。
国内企业做高精方案的逻辑,基本上都是路网感知,依靠高精地图进行感知。
哪怕车上有对车道线的感知,对障碍物的感知都是处于弃用的状态。
障碍物的感知是需要跟激光雷达扫到的结果做融合的,再对车道线感知进行训练。
国内企业纯视觉感知启动后,很多工作都交给了硬件激光雷达去完成,认知也依赖于已有的地图。
工作重点放在了高精度的定位上。
纯视觉工作方面,国内企业是落后国外企业的。
三维重建的工作,目前国内企业很难开展。
理想、小鹏、华为目前都只能做到DV车道线的感知。
激光雷达的像素效果一般,像素的含义是什么,对这方面缺乏进一步的认识。
Q:有图方案和无图方案的主要区别是什么? 国内企业无图方案的进展怎么样?
A:有图方案和无图方案在算法上的区别会比较大。
高精地图是纯静态的图,任何时候都是不动的。
在交通很拥堵的情况下,车道线被挡住了,对于车辆而言,一会只能看到左边的线,一会只能看到右边的线,无法形成对环境的稳定感知。
无图的方案当中定位目前做得又不好,因为没有全球定位的地图可以参考。
需要解决的关键问题是要对动态的环境形成稳定的感知。
车道线会时不时地被其他物体遮挡,但输出的车道线感知要是稳定的,即使被挡住,也依然可以被车辆感知到。
在车道线的基础上要延伸形成对路口状况的感知。
如果对路口停止线的感知不及时,可能车辆就会过线。
目前情况下纯无图方案下面每一顿的感知都有不确定性。
在不同的时间去经过同一个路口,效果都会不一样。
如果感知错误,在这个基础上去做决策规划难度就很大。
各家企业要尽量先把感知的工作做好,再考虑决策规划的事情,堵住各种漏洞,最后才能实现量产。
消费者目前也不是很认可产品。
无图方案的硬件成本会比有图方案低比较多。
有图方案要靠激光雷达辅助定位,纯GPS定位会有遮挡问题车的位置和地图的相对位置变了,控车效果就很差。
激光雷达可以扫描静态的物体帮助定位。
上汽通用五菱KV的车型上有一套自动驾驶方案,摄像头安装很少,主要就靠激光雷达,行车效果一般,没带MOA的功能,但是成本是够低的。
Q:不同的城市之间无图方案推进起来有什么区别吗?
A:在不同的城市之间进行推广,要对当地城市的状况有非常高精度的认知,精确刻画道路特征。
比如有一个城市之前从来没去过,比如无锡的道路特征和广州的道路特征有一部分是重叠的,这种认知是可以复用的。
在做高精方案的时候,要注重对道路特征的提取,可以用更多的指标进行衡量,未来在城市中的应用量可以快速增长。
Q:特斯拉离线的云端三维重建不再通过网络去提取道路特征,这种情况下做驾驶决策规划是可以实现的吗?
A:并不是说高精地图有可能定期更新,就要存储在车机上。
特斯拉的重建数据是放在后台的。
新的数据也会传输到后台,为了更好得解析道路特征,比如红绿灯发生变化了,车道线变了。
要用高质量的动态的数据去训练车端模型,车可以调用这个模型。
车机里面不需要再放高精度地图,调用离线地图就能实施决策。
Q: 国内车企标注的方式和特斯拉相比有什么差异?
A:特斯拉先做重建,再做标注,质量很好,可以持续迭代。
2018年特斯拉标注二维图片,一开始是人工标注,后来慢慢实现了自动标注。
标注这一件事情上,特斯拉也是不断进步的。
目前的自动标注是三维重建,要解决之前没有标注好的地方。
之前有一些场景可能会标错,要提高模型的自动标注能力。
国内企业的自动标注也在进步,能标注车道线,也能标注障碍物,之后再考虑感知,数据闭环和决策规划的问题。
目前国内企业的标注效果没有特斯拉好。激光雷达扫描标注会有误差。
国内企业自动标注的效果还要进一步观察。
Q: 算力在云端,国内企业的GPU能跟得上吗?
A:自动标注大模型是需要很多算力的。
特斯拉2022年有两万张A100的卡。
国内企业的训练算力和效率比不上特斯拉。
算力需要进步,国内的华为算力比较强。
小鹏、比亚迪、理想这些车上的GPU的卡会比较少。
国内企业的产能如何还要观察。
Q:智能驾驶方面的人才是不是都被龙头企业垄断了?其他公司是不是只能代工?
A:自动驾驶的头部企业都会去挖一些领军人物。
小鹏、理想都会从美国挖人。
高端人才在北美和中国之间流动。
很多车企在北美设立分公司,组建自己的团队。
新势力车企也并不是简单地代工,是在往量产的解决方案上发展。
Q: 国内车企的算法都在用Transformer吗? 以后智能驾驶软硬件解耦是趋势吗?
A:是的,但是输出效果不是很好,不是因为对算法理解不到位,而是增值数据这方面关注不够。
标注的数据质量会影响Transformer的质量。
FSD如果要进中国,其实是要去重新收集国内的视频数据的,然后重建,再进行训练。
国内政府可能会有一定的管控,所以进度没有那么快。
以后智能驾驶软硬件解翘并不一定是趋势。
深度趣合才是趋势,软硬件要进行一体化设计。
解翘就会有很多问题解决不了。
比如纯视觉方案下,摄像头不能调焦距,可能就会做出错误决策,对交通信号灯的颜色可能也会判断错。
人的眼球是可以旋转和调焦距的,车也要有这样的功能。
基于transformer里的intention的机制意识到的环境里面,哪些物体是关键的,就发送给硬件。
特斯拉对硬件要进行自研,尽可能地发挥好软件的效果。
德赛西威的芯片是CPO的,算力需求比较大,决策规划会往模型化方向发展,用AI运算。
免责声明:
文章内容仅供参考,文章中的信息或所表述的意见不构成任何投资建议,花椒财经不对因使用本文章所采取的任何行动承担任何责任!