汽车的地平线,瞄准了云中的英伟达

日期:2022-10-29 15:02:03 / 人气:105



你有GPU,我有DSA。


说到AI芯片,最近的一个事件是10月13日,地平线与大众旗下的软件公司CARIAD合作。双方成立合资公司,CARIAD持股60%,投资约24亿欧元,预计2023年上半年完成。


这是迄今为止最重大的合作。而一个小插曲是,仅仅半年前地平线宣布第三代产品征途5的首次定点合作,以比亚迪为终点,2023年上车。不过有趣的是,比亚迪还将投产搭载NVIDIA DRIVE Orin计算平台的车型。

公社C元的最新文章《英伟达不要的,地平线要的》,也介绍了地平线与英伟达在汽车领域AI芯片应用上的竞争。所以,在这篇文章里,我们来科普一下。这两家公司在竞争什么,车企选择的背后有什么考虑?

都是AI芯片。有什么区别?

说到双方,他们的产品都是用于自动驾驶领域的AI芯片。但是还是有很大的区别。


AI芯片的应用场景主要分为云端、终端和边缘。目前,云应用越来越成熟。另外,云应用可以分为训练和推理两种,其中训练的市场规模相对较高。

云应用的霸主是英伟达。但在云(服务器、数字中心)和终端(手机、智能汽车等移动终端)的应用场景中,AI芯片的运行模式有本质的区别。

例如,当云处理一次到达的大量累积数据(批量大小)时,可以等到数据“足够”后再进行处理。但是车载芯片需要处理流数据,随着行驶(时间)接踵而至的数据;计算需要实时完成,尽可能减少延迟。

对于交互性,终端要求更高。云任务本身仅限于虚拟世界,没有考虑与现实世界的交互。终端在现实世界中,每个任务都需要考虑交互性。


此外,在车端AI芯片的考量中,功耗和成本也占据了较重的分量。可见,对于汽车终端来说,AI芯片除了保证计算能效外,还有低功耗、低延迟、低成本的要求。

目前AI芯片有三种,分别是通用GPU、可定制FPGA、专用ASIC。英伟达的Orin芯片基于通用GPU。Horizon的Journey 5既是ASIC芯片,也是DSA(Domain Specific Architecture)芯片。值得注意的是,Orin芯片的核心GPU架构依然是云架构。

但是对于车企来说,芯片的兼容性越强越好,因为车企可以一步到位,不需要从零开始做验证。一个芯片就可以实现未来高级智能驾驶的硬件嵌入,为未来更高级的智能驾驶做准备。这也是很多品牌愿意选择NVIDIA Orin芯片的原因。


而地平线则采用针对特定场景的软硬件结合的方法论来设计芯片,即DSA芯片,大大提高了芯片的有效计算能力。但是,我们的疑问是,到了征途5的极限之后,更高层次的自动驾驶需求会被换到征途6。那么,谁来为这种变化的综合成本买单呢?

除了算力,还有FPS。

除了通用和定制的区别,目前业内还有一种“唯计算论”。似乎芯片的计算能力越高越好。其实这是有失偏颇的。其实还是要看FPS(每秒帧数)。

一般来说,FPS是指动画或视频每秒的帧数。FPS是用于保存和显示动态视频的信息量的度量。简单来说,FPS值越大,性能越好。对于自动驾驶所有应用的计算平台,FPS被认为是衡量高级算法运行效率的评价标准之一。


例如,在芯片计算能力方面,单芯片NVIDIA Orin和Journey 5的计算能力分别为254TOPS(每秒万亿次计算)和128TOPS,功率分别为45W和30W,功耗比分别为4.6TOPS/W和4.2TOPS/W。5路程只有英伟达奥林的一半。

然而《征途5》的FPS(每秒帧数)是1283。远高于Orin的1001FPS(基于同样安培架构的Nvidia RTX3090调整后计算)。Horizon 5的视频传输流畅度明显比NVIDIA Orin好。难怪地平线BPU算法的负责人罗恒说,“在能源效率方面,我们(与Orin相比,Journey 5)提高了6倍以上。”

其实FPS里不只是视界算。2017年自主研发的FSD芯片发布时,特斯拉创始人马斯克将其与之前应用的NVIDIA Drive PX2进行了对比。计算能力方面,FSD是Drive PX2的3倍,但FPS是Drive PX2的21倍。

此外,低延迟性能也是衡量AI芯片性能的关键指标。因为延误问题直接关系到驾照的安全。比如紧急制动场景,100毫秒意味着近1.7~3.3米的制动距离。


据Horizon报道,目前《征途5》8M单机的视知觉结构化输出延迟小于60ms,比Nvidia ORIN的延迟表现要好。而Orin芯片的低延迟数据是未知的。

所以在FPS、低延迟、低成本方面,地平线在汽车领域还是有很大的发展机会的。目前已有20多家车企的70多款车型应用了Journey系列芯片,这也是地平线通过定制路线收获“攻略”的成果。

建筑,决定性的胜利

在第五次浪潮的计算浪潮下,芯片的核心当然是架构。因为架构是芯片企业最底层的核心技术,迭代成本巨大,也是最有价值的技术。


作为提出DSA架构的泰山北斗,约翰·汉尼斯和大卫·帕特森在获得2017年图灵奖时的获奖感言中指出“未来十年将是计算机架构的黄金时代”。这是一个很好的注脚。

地平线的Journey系列芯片经历了命名为Gauss、Bernoulli和Bayes的三代BPU(Brain Processing Unit,大脑处理单元)架构,是地平线自主设计研发的高效人工智能处理器架构。

从低到高,高斯架构主要处理感知,即图像识别,摄像机、雷达、传感器等的图像识别。,采用40nm技术。伯努利架构增加了深度学习,20nm技术。贝叶斯架构是加入贝叶斯网络,结合深度学习来提高AI的准确率,16nm工艺。

作者:杏耀注册登录测速平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT © 杏耀注册登录测速平台 版权所有