对话复睿微首席AI科学家：自动驾驶走向“群体智能的社会计算”，大算力芯片如何突破？

作者 | 集微网2023-03-20

随着智能化时代的到来，汽车产业正在经历深刻变革。回顾中国近十年的产业发展，新能源汽车已经取得了显著成绩。而在未来十年中，智能化技术将为中国汽车产业提供更大的想象空间。

在汽车智能化的下半场竞争中，不仅是激光雷达等硬件设备之间的竞争，更是AI新技术革命时代下芯片算力之间群雄逐鹿。市场上，在后摩尔工艺更新性能放缓、延续性创新边际效益递减的情况下，新型高算力架构陆续涌现，并且驾驶AI算法也在快速迭代演进。因此，在未来5-10年内可能会为后来者提供非常奇妙直线超越机会窗口。

复睿微电子成立于2022年1月，是由世界500强企业复星集团出资设立的先进科技型企业。其目标是成为全球领先的智能出行时代大算力方案提供商，并致力于为汽车电子、人工智能、通用计算等领域提供以高性能芯片为基础的解决方案。目前主要从事汽车智能座舱和ADS/ADAS芯片研发，并通过领先设计水平和人工智能算法赋权底层技术推动汽车产业创新发展并提升用户体验质量。

近日，集微网采访到复睿微电子英国剑桥研究所首席AI科学家Dr. Luo，从中深度了解到他对自动驾驶的底层精髓思考，以及公司在AI算法与芯片架构方面的底蕴与优势。

集微网：谈谈您与智能驾驶的缘分，在该领域的经历和重点研究方向，以及在复睿微主要负责的工作？

Dr. Luo：我本人是东南大学工学博士、英国布里斯托大学博士后，拥有二十余年的芯片和产品研发、技术团队组织建设、科技公司管理经验，并长期从事科学研究和机器视觉先进产品开发，对视频分析、AI算法架构、AI芯片设计，以及平安城市、智能驾驶、智能交通行业等都有深刻理解，成功设计交付过若干智能分析芯片和平安城市重大项目，在国际核心刊物上发表过数十篇学术论文和技术专利。

在企业工作期间，我先后担任视频监控首席架构师、设计部部长、首席技术规划师，机器视觉首席科学家、研发部长、董事等职位。

2022年3月，我有幸应邀加盟复睿微担任公司首席AI科学家，并组建了复睿微Genesys Research UK英国公司，随后负责主持英国分公司AI算法和芯片架构研发。期间，在国内科技媒体平台先后发表了10余篇行业洞察技术文章，组织完成了若干技术洞察和技术预研核心项目，并领导GRUK团队持续构建复睿微有竞争优势的ADS先进算法和芯片先进架构。

集微网：对目前智能驾驶行业的发展有何看法？入局这一赛道，复睿微的定位是什么？有哪些技术竞争优势？

Dr. Luo：2022年可谓是ADS（高阶自动驾驶）的L3自动驾驶元年。近几年，行业的数字化和行业的AI化，推动ADS向阳而生。从单车智能维度，L2部分功能已经成为行业标配：2022年前五个月的搭载率25.5%，几个主流车厂的新车款的搭载率甚至到70%以上。在硬件预埋(大算力芯片 + Multi-View Camera + LiDAR + Radar)的趋势驱动和最新的ADS行业准入法规政策驱动下，L2+快速向L3演进已经是大势所驱，今明两年，可以预测城市级L3+将会在国内迅速普及。

从场景来看，自动驾驶ADS主要是由高速场景向城市道路场景演进来落地领航辅助NOA功能，AI与场景的深度融合推动ADS逐步实现从低速到高速，从载物到载人，从商用到民用，从阶段一提供L2高级辅助驾驶和L3拥堵高速公路副驾驶，发展到阶段二可以提供L3拥堵公路自动驾驶和L4高速公路自动驾驶，最终实现阶段三的L4城郊与市区自动驾驶和L5商用无人驾驶等。

毫无疑问，智能驾驶的技术演进需要大算力芯片的支撑。因此，复睿微的定位是成为世界领先的智能出行时代的大算力方案提供商，并构建整个生态的通用大算力和人工智能大算力的基础平台。我们以提升客户体验为使命，在后摩尔定律时代持续通过先进封装、先进制程和解决方案提升算力，与合作伙伴共同面对汽车智能化的新时代。

至于技术竞争优势，我们通过与客户的深度交流与合作，以客户和市场需求为核心，同时以英国剑桥研究中心做为前沿技术发力点，确保在关键技术上能够做到持续领先，在产品开发上，也将采用发布一代、开发一代、预研一代的方法，保证我们在核心算法、关键架构和IP上自研技术的优势。

集微网：车规大算力芯片的竞争日趋白热化，如何平衡AI芯片的算力与性能？

Dr. Luo：对比CPU百级的并行处理单元和GPU上万级的并行处理单元，NPU会有百万级的并行计算单元，可以采用Spatial加速器架构来实现，即Spatial PE空间单元阵列通过NoC，数据总线，或跨PE的互联来实现矩阵乘运算（全卷积计算或全连接FC计算）、数据流高速交互、以及运算数据共享。

我们认为，理论算力不是越大越好，而是实际部署的的推理效率Efficiency和计算阵列的利用效率utilization，即如何解决内存墙和功耗墙的问题，在数据通道和计算单元的整体利用率保持最优。

集微网：对自动驾驶而言，AI芯片是基石，其所承载的算法与软件也同样重要。而人工智能与自动驾驶的软件算法会持续地进化，芯片架构如何应对这些变化？

Dr. Luo：对于自动驾驶ADS行业，我们也许可以将其核心演进趋势定义为群体智能的社会计算，简单表述为，用GPU/NPU大算力和去中心化计算来虚拟化驾驶环境，通过数字化智能体(自动驾驶车辆AV)的多模感知交互(社交)决策，以及车车协同，车路协同，车云协同，通过跨模数据融合、高清地图重建、云端远程智驾等可信计算来构建元宇宙中ADS的社会计算能力。

ADS算法从Compute-bound（矩阵-矩阵乘）向Memory-bound（矩阵-矢量乘）演进，从偏计算走向偏存取。

当前市场上主流算力NPU芯片，都存在几个共性问题，一是算法效率低，多数只针对CNN（例如3x3卷积）优化；二是内存墙问题，处理单元PE存算分离，数据共享难；三是能耗墙问题，数据重复搬移，耗能增加>30%-70%。所以，当前针对某些特定算法的芯片，无法解决未来ADS 2.0的需求。

从工程实践上看，ADS 2.0算法需通过“硬件预埋，算法迭代，算力均衡”提供一个向前兼容的解决方案，以通用大算力（CPU的5-10倍性能提升，NPU的20-100倍性能提升）来解决未来不确定性的算法演进。具体体现在：一是底层架构的演进：从存算分离到近内存计算，最终走向内存计算；二是数据通道与模型：高速数据接口+数据压缩+模型压缩+低精度逼近计算+稀疏计算加速；三是并行的顶层架构：模型-硬件联合设计，以及硬设计可配置+硬件调度+软运行可编程调度引擎。

未来，自动驾驶算法不会止步于ADS 2.0，而能够真正支持人类自动驾驶梦想的算法ADS 3.0趋势，我们估计会采用一个DNN网络来进行端到端学习。设想一下，有足够的专家驾驶数据用来做模仿学习或采用RL自学习模式，可以有效降低数据标注的信息瓶颈与严重依赖，从而能够从多模多样化数据层面进行非直接的推理或者博弈类的对抗学习。而目前来看，ADS 3.0模型的可信与可解释程度依然远低于预期。

集微网：如何看待自动驾驶路线之争，即纯视觉方案VS多传感器融合方案？能否从算法和架构方面弥补传感器的不足，提升驾乘安全？

Dr. Luo：ADS部署的传感器在极端恶劣场景(雨雪雾、低照度、高度遮挡、传感器部分失效、主动或被动场景攻击等)的影响程度是不一样的。

业内常提及的“长尾问题”，是自动驾驶商业化的主要制约因素。“长尾问题”没有一个很明确的定义，一般指AVs即使经历了交通公路百万公里数的路况测试，对每个AI算法模块而言，包括感知层和决策层(预测+规划)，仍不能完全覆盖各种各样的低概率安全至关重要的复合驾驶场景，即所谓的“Curse of Rarity(CoR)稀缺问题”。

业界对如何实现一个通用的任意目标种类的检测器或者是一个通用的运动目标检测器，依旧是一个未解的技术难题。如何定义和分析这些稀有场景，也可以有助于更好理解目标检测识别语义理解预测决策算法性能的提升，从而加速安全可靠的ADS解决方案的开发与部署。

当前自动驾驶算法主要是针对Camera/LiDAR/Radar海量数据流进行特征提取，DL网络主流趋势是卷积CNN+Transformer的组合架构，在统一的BEV特征空间实现多模感知，特征融合共享以及多任务来提升算力的整体效率。而多模态的互补融合有助于减少状态的不确定性从而使3D目标检测任务更加具有鲁棒性。

我们认为，3D潜在空间的特征表达，即多分辨率场景语义理解所带来的行驶风险和不确定性描述，对安全决策来驱动感知的设计来说，可以比以目标为中心的的设计，提供更高分辨率的细节来有效避免碰撞的风险，尤其是行车附近和前行中的危险区域。3D体素的占用状态、表面语义和运动状态等信息本身也是一种固有的碰撞概率呈现，是对环境状态的一种天然表征，也易于实现基于采样的ADS运动规划。

因此，多模态部署和融合是趋势，但受LiDAR成本因素制约，在应用上，中高端车型逐步采用4D毫米波雷达，低端车型仍将采用3D毫米波雷达。短期内4D毫米波雷达在性能上无法替代激光雷达，但可在穿透性的优势上与激光雷达形成互补关系，4D毫米波雷达的成像效果与低线数激光雷达相当，但不如百线激光雷达，而车载激光雷达正向高线数方向发展，4D毫米波雷达与激光雷达竞争关系弱化。

集微网：近期火热的ChatGPT，将会给自动驾驶技术带来哪些颠覆式的创新？对于未来与车规AI芯片融合有哪些展望？

Dr. Luo：人类对于超低功耗的人脑如何能够在日常工作生活中从机械性激励学习到演绎归纳举一反三，再到产生独立意识流和无穷的创造力，可以说依旧处于一个认知的起步期。

哲学家维特根斯坦说过：“The limits of my language mean the limits of my world”，语言的边界即是世界的边界，语言构成了我们对世界的认知和表达。Transformer是生成式AI的技术核心底座，语言大模型ChatGPT能够从量变到质变，即模型达到一定规模后的所谓浪涌效应，推动了AI行业的发展快速进入知识归纳与推理决策、常识理解和交互认知、链式推理和可信解释的新时代，这其中主要几个因素来自于：超大模型+海量数据+预置训练+反馈学习+自我改进。

ChatGPT采用自底而上进行学习，而人脑采用自顶向下和自底向上的语言学习模式，所以后ChatGPT时代下的语言模型如何演变，何时能够推动人类进入通用人工智能AGI的时间点目前依旧处于不确定状态，但对自动驾驶ADS行业AI化的加速，我们期望可以通过模型的反馈学习训练方法、数据和场景的交互生成、多模态数据的交互学习和潜在特征空间的分布理解、以及可理解可解释的输出等功能来加速自动驾驶ADS感知和决策的端到端开发进程。

写在最后

Dr. Luo在采访中的见解令人印象深刻。他将自动驾驶的核心演进趋势定义为“群体智能的社会计算”，其中高性能芯片将扮演“中央大脑”的角色。与此同时，复睿微正在全力研发ADS先进算法和芯片架构作为“技术底座”，可以充分利用高性能芯片的性能，提高系统效率并不断满足客户和市场需求。

自动驾驶

评论代码