文 |RoboX

2019年,特斯拉切换FSD 3.0时,智能驾驶芯片第一次变成关注重点。

当时,马斯克用有些「落后」的三星14nm工艺,做出了一款比英伟达Xavier(12nm)面积更小的芯片,算力还高出了一倍以上。

就是这个时候,智能驾驶芯片第一次抢了传感器、算法,甚至是最终系统表现的风头,成为了特斯拉车主的心头好。这一转变可能连特斯拉都没料到,否则后面也不会发生减配风波。

随后,英伟达开始在智驾芯片领域快速发力。2021年OrinX上车量产,单片算力256TOPS,是特斯拉FSD 3.0芯片的3.2倍。同年又发布了Thor,单片算力1000TOPS,差距拉大到14倍,但要明年才能量产。

如今的智驾芯片早已不是当年那么匮乏,除了英伟达、高通等大厂外,国内的地平线征程6也势如破竹,黑芝麻武当C1200也即将量产。但另一边,车企已经纷纷加入了自研芯片的行列。

此前,蔚来、吉利已经发布了首款量产智驾芯片,小鹏也传出已在去年年底回片。

为什么要自研?

对于为何自研智驾芯片的问题,可能很容易就能给出诸如“掌握核心技术、供应安全、定制化、降低成本”等理由。

但更早一步布局的特斯拉,想法其实还要更加简单:当时算力真的不够,而且方案非常不灵活。

回看特斯拉HW 1.0-2.5阶段。最初,它也和其它车企一样,采用供应商黑盒方案,Mobileye EyeQ3和仅有前向远距离感知能力的组合,不但表现一般,还支持软硬件捆绑销售。面对这家所向披靡的巨头,车企对此没有任何插手能力。

直到HW 2.0,特斯拉转向了英伟达Drive PX2芯片。至此,特斯拉才有权限拿到传感器数据,将自研软件落地,并在后期版本更新里做出了支持自动变道的高速导航辅助。

特斯拉也正是在这时,向外界展示了智驾野心。其在HW 2.0上,已经把FSD完全自动驾驶作为最终目标,给它配上了8个摄像头,1个前向毫米波雷达,12个超声波雷达。

这种布局方案到HW3.0时代依旧在沿用,只是具体的传感器规格有所调整。后来,特斯拉还不增反减,取消了毫米波雷达和超声波雷达,到HW 4.0又取消了一个前视摄像头。

可以看见,这些年困扰特斯拉的并不是感知方案,后面的几次大迭代,几乎都是在围绕算力展开。

在HW 2.0上,特斯拉选择的英伟达Drive PX2芯片,已经是2016年能上车的最高算力智驾芯片,但也就只有24TOPS。

特斯拉也是在当年启动了FSD芯片项目,其双片144TOPS算力布局在2019年上车时,已经是极为夸张的性能。

但随着智驾功能迭代,依旧无法满足FSD后续的升级需求,即使其为了降低算力占用,重新给优化了最底层的C代码,进行了编译器重写。

在最新的HW 4.0上,特斯拉又将单片算力提升5倍。

困难依旧存在

其实,在英伟达智驾芯片发力后,近几年其性能已经开始飞速提升。

2020年,小鹏P7首搭的Xavier只有30 TOPS,两年后就推出了有256 TOPS的OrinX,明年还会有1000 TOPS的Thor进行量产。

如今,性能不再是阻碍投入英伟达阵营的原因,但车企依旧存在其它顾虑。

这其中,最直观的是供应问题。回看蔚小理组建芯片团队的时间,基本都是在芯片危机阶段。

当时,哪怕是有智驾芯片布局的华为,也因为MDC 810的生产问题,导致极狐阿尔法S先行版一再跳票。

而只能向外采购芯片的车企,情况还要更加糟糕。不只智驾芯片短缺,雷达也面临无芯可用的情况。有些车企被逼无奈,只能采用先交付车辆,后补装雷达的应急手段。

2023年,芯片荒已经结束,但随后出现的智驾内卷,又让英伟达OrinX需求量激增,使其再度供不应求。

有爆料称,当时OrinX交付周期已经从原来的一个月,拉长到三个月,部分订单甚至要等到一年后才能交付。

伴随周期延长而来的,还有价格飞涨——OrinX价格在5个月的时间内,累计涨幅已经达到37.5%,超过了三分之一。

面对英伟达一家独大的市场,车企丧失了议价能力,自然也会产生自研芯片的想法。而且从长期主义来看,自研芯片也有很大降本空间

曾经机构对特斯拉进行测算,HW 2.5的芯片成本大约为280美元,而HW 3.0仅为190美元。假设投入1.5亿美元研发,生产167万辆车就能回本,还不到去年一年的销量。

蔚来汽车创始人、董事长、CEO李斌曾提到,在芯片等核心领域,蔚来的目标是建立全栈自研能力,公司相信核心研发能力有助于应对产业政策变化风险,也可以提升毛利率及技术竞争力。

高投入,高收益

除了长期的经济收益外,自研芯片在技术层面,也有不小优势。

马斯克在发布FSD 3.0芯片时曾经指出,英伟达采用的通用GPU架构,并不是专门为无人驾驶系统打造的,还有很大改进空间来提升运算速度。

事实上,FSD芯片就没有像传统通用计算那般优先布置CPU和GPU,反而将专为神经网络打造的NPU作为主要组成部分。其负责通用浮点计算的GPU面积,要远小于MAC阵列NPU。

NPU全称为神经网络加速器,是一种在CPU和GPU之外的独立处理器,负责深度学习和预测功能。MAC则为乘积累加运算,可将许多运算分解为数个MAC指令,有效提高运算效率。

而且和通用芯片相比,专用自研芯片还不用考虑通用性,能砍掉与自己无关的模块,只保留自己需要的接口。这种设计的周期更短,也能针对自己的软件进行优化,使软硬结合要更加出色。

比如,在FSD 3.0芯片上,特斯拉通过合并输出通道中X、Y维度的输出像素,可以并行处理96个通道。

与FSD 2.5的Drive PX2芯片相比,FSD芯片算力是其3倍,但在执行自动驾驶任务时,每秒图像帧率(FPS)达到了其21倍。

尽管强调自研,但FSD芯片却并非是像智驾软件那样的全栈自研。特斯拉FSD芯片也只是把自研重点放在了NPU上,其余CPU、GPU、接口、片内通信等都是采购标准IP。

这种相对容易的研发方式,加上不用考虑通用性,不用第三方车规级认证,可以让芯片开发周期大幅缩减。特斯拉FSD芯片仅历时18个月,就完成了开发。

对于其余想要自研的车企来说,这是一种更容易被采纳的方案。理想汽车曾被爆料称,其自研智驾芯片中最关键的环节是NPU前端设计,后端设计被外包给台湾世芯电子,然后再交由台积电完成制造。

蔚来去年年底发布的神玑NX9031,虽然透露的信息有限,但一个重点强调的地方也是NPU为自研。

从另一层面看,这种开发模式也能解释,为何国内芯片公司落地高自研度产品时,节奏偏慢了。

更大的量产挑战

和量产上车相比,设计智驾芯片只是前奏的一小步。

2017年12月,特斯拉FSD芯片完成了第一次试产,但直到2019年3月才开始装车。期间,这款芯片经历过很多修改。

集成验证周期长、交付参数产生差距等等,都是量产过程中的常见情况。

目前,蔚小理被曝光的最新进展分别是:蔚来神玑NX9031计划在2025年第一季度随ET9量产;理想智驾芯片传闻在2023年10冲击流片;小鹏智驾芯片被传在2023年底回片。

这其中,蔚来没有透露具体推进到了哪一环节,但流片、回片距离正式量产,还有不小的间隔。

另外,与每年动辄拿出数百亿美元采购芯片的科技公司相比,即使年销量破百万的特斯拉,其需求也显得有些微弱。如何获得先进工艺产能,也是一大量产难题。

即使排除这些外界因素,车企在如今智驾愈发内卷的情况下,对于智驾芯片上车的选择,可能也会更加谨慎。有业内人士指出,自研智驾芯片上车是个谨慎的抉择,真正放心可能要等到第二、第三代。

今年年初,零跑汽车创始人、董事长、CEO朱江明曾公开谈到放弃自研芯片的原因:现在做AI芯片的厂家不光有英伟达,还有黑芝麻、地平线,海外的安霸等等。应该让更加专业的企业去打造芯片,车企则应将经历放在算法上。

前不久,英伟达在GTC 2024开发者大会主题演讲中透露,其与小鹏的合作再次深入,小鹏将基于Thor开发下一代电动汽车。

自研芯片虽然推进困难,但利好也确实明显。自研不仅是一条技术路线,也是提高品牌形象,建立未来竞争优势地位的一条有效途径。

不过,在地平线、黑芝麻等国内芯片企业影响力越来越大、能够实现更高阶突破的阶段,或许智驾芯片的市场又将得以重构。

如今,在智驾软件开始趋同「全国都能开」之后,那些主打科技标签的车企在自研芯片上重新卷起硬件,也不失成为另一种可能。