作者 |德新
编辑 |王博
英伟达汽车业务的天花板,不在一辆车卖几颗芯片,而在每年十万亿英里级的道路里程,有多少最终跑在它的技术栈上。
2023年8月,吴新宙从小鹏离职加入英伟达,担任汽车业务的全球负责人,直接向黄仁勋汇报。
时隔两年多后,在英伟达北京办公室,我们再次见到了吴新宙。
这是他加入英伟达之后,第二次公开的媒体沟通。
上一次还是在2024年的北京车展。相比上届北京车展,当时英伟达的DRIVE Thor正值装车量产前夜,业内除了特斯拉,大部分公司基于大模型的端到端辅助驾驶还没开发出来。
但两年后,中国辅助驾驶市场已经发生了翻天覆地的变化,随着城区辅助驾驶的普及,Thor的装车量以及车企投入辅助驾驶的数据中心算力也水涨船高。
2024年当年度也是英伟达的关键一役。随着AI迅猛发展,英伟达的市值,这年从1万亿美金跨到了年底超过3万亿美金,如今更是超过了5万亿美金。
从汽车业务侧,在吴新宙率队开发一年多之后,英伟达自研的辅助驾驶技术栈DRIVE AV向奔驰交付。英伟达如今有将近4000人的团队,在同时向着L2+、L3以及L4自动驾驶推进。
此时的新宙,无疑比当时更加游刃有余。
他认为当前L4已经没有重大的技术卡点,随着大语言模型以及推理能力出现,解决了很多技术门槛。今天看L4,更多是一个需要软硬件协同,以及实现极高安全性的庞大系统工程。
根据英伟达的时间表,其计划在2027年与Uber合作推出L4的试点;2028年在洛杉矶奥运会期间,其将开始对外提供L4无人驾驶服务,并计划在当年推广至20 - 30个城市。
在L2+上,英伟达今年将和奔驰在全美落地类FSD的点到点城区辅助驾驶,并拓展到欧洲等其他地区。继全新CLA之后,奔驰在中国区之外的车型将大规模采用英伟达的方案。
至于L3自动驾驶,新宙认为L3、L4在能力要求上,并没有太大的差别,但支持城区的L3和支持高速的L3有很大不同;由于L4要大规模运营起来难度很大,所以他认为在一段时间内L3、L4将会共存。
一、Reasoning VLA,英伟达智驾从硬件走向全栈
今年初,黄仁勋在CES上宣布了英伟达与奔驰的合作进展。
英伟达的辅助驾驶系统,称为DRIVE AV。
已经向奔驰交付的L2+版本,计算平台基于英伟达DRIVE Orin,配合视觉为主的感知方案,没有激光雷达;今年在这套硬件上,新宙团队将推出类FSD的城区点到点功能。
DRIVE AV同时运行了基于端到端模型以及传统规则算法的两套技术栈。前者有利于摸高探索更高的技术上限,而后者能够兜底保障有较高的安全性。新宙认为团队还有更重要的使命是向L3、L4迁移,这样的架构也有利于向更高级别自动驾驶扩展。
DRIVE AV的模型目前正处于快速迭代当中。据新宙透露,在这代技术栈开发的一年多时间里,模型迭代了3500多个版本。最新的进展,相当于当前每天有10个新版本的模型生成,团队现在使用的算力规模,相当于6万张卡。
除了奔驰之外,捷豹路虎以及Lucid也已经确定将会搭载英伟达全栈方案DRIVE AV,另外还有几家车企正在洽谈之中。
与当时奔驰的合作官宣一道,CES时黄仁勋还发布了辅助驾驶开放模型Alpamayo。Alpamayo随后在GTC上推出了1.5版本,并在COMPUTEX上推出2.0版本。
Alpamayo取自秘鲁的一座雪山,山峰以陡峭的冰雪地形闻名,登顶难度极高。
Alpamayo的模型主干(backbone)来自英伟达的世界基座模型Cosmos蒸馏获得,再用了8万个小时的驾驶数据进行训练;Cosmos作为基座模型,是基于互联网的海量数据训练,包含了推理、预测等模块,8万小时的驾驶数据相当于在前述模型能力的基础上进行的一次微调。
Alpamayo的关键是把辅助驾驶纳入了英伟达的世界模型主线,它的底座来自Cosmos,说明它继承了英伟达在世界模型上的能力;传统端到端直接从传感器输入到轨迹输出,Alpamayo则试图在中间加入一层可解释的物理世界推理,它又是一个VLA,也就是 Vision-Language-Action 模型。
新宙告诉我们,现在量产的DRIVE AV跟Alpamayo也是同源的。
在智能驾驶方案供应稀缺的欧美市场,英伟达目前可以说是这个市场少数真正严肃的玩家。由于DRIVE AV的算法研发团队大部分位于英伟达总部所在的硅谷,FSD的迭代无形中也会给团队施加压力,团队希望借新的技术路线,尽快追赶特斯拉FSD。
二、L4的雄心:把每年13万亿英里的里程,变成自动驾驶
随着2027财年第一季度财报公布,英伟达的披露有一项值得关注的调整,就是业务披露口径上,从过去游戏、汽车、专业视觉等终端应用市场,改成了「数据中心」与「边缘计算」两大逻辑。
对汽车业务来讲,这可能是一个能更好反映业务增长的选择。
因为按照过去的计算方式,即使一片英伟达DRIVE Thor X卖1000美金,即使按照每年出货200万片计算,这部分收入总和在20亿美金/年,这在英伟达当前单季就超过800亿美元的收入中也只相当于沧海一粟。
这样的计算方式,忽略了车企搭建数据中心的巨额投入。
比如特斯拉持有Cortex 1和Cortex 2集群,合计约有等效20万张级别的H100,这两个集群仅裸卡的价值就达到50 – 80亿美元。除了特斯拉之外,在自动驾驶蓬勃发展的中国市场,车企和自动驾驶公司都在大规模兴建/租用算力集群;仅仅租赁费用,头部供应商每年得花10亿元级别。
在英伟达内部,新宙团队除了布局L2+开发之外,也在同时开发L3和L4方案,这反映了英伟达汽车业务的诉求并不是做「又一家辅助驾驶方案供应商」。
他有一个简单的测算,全球每年车辆行驶的总里程在13万亿英里级别(13 Trillion Miles),英伟达的最终目标是帮助车企将这10万亿英里级的里程,变成自动驾驶里程。
他说,最终客户未必都是用英伟达全套的方案,但是就像老黄说的「或多或少用一点我们的技术」。目前,奔驰、Lucid以及Stellantis都已经与英伟达官宣了在L4 Robotaxi上的合作。
英伟达预计在明年与Uber一起推出L4 Robotaxi的试点,并计划在2028年洛杉矶奥运会期间推出L4 Robotaxi服务,并在当年推广至20 - 30个城市。
如果L2+业务是卖的是芯片和软件,在L4上英伟达有更多可以提供的套件:车端芯片、数据中心、世界模型、仿真、L4的软件与生态。
过去外界看英伟达的汽车业务,常常看到的是DRIVE Orin、Thor 这些车端芯片能卖多少。但在吴新宙的叙事里,汽车业务真正的上限,已经不再是「一辆车装几颗芯片」,而是全球每年十万亿英里级别的行驶里程,最终有多少会被 AI 接管。
三、物理AI的未来:自动驾驶还是具身智能?
自动驾驶是物理AI的一支,吴新宙也不可避免被问到另一个更热的方向,具身智能和机器人。
他坦言,现在确实有很多「同行兄弟」已经转去机器人,但自己仍然选择留在自动驾驶。原因很直接:他曾经在中国推动过上一轮自动驾驶的发展,如今在英伟达这个平台上,有机会把这些经验放大到全球市场。
在他看来,机器人和自动驾驶本质上都是物理AI的重要组成部分,都会在即将到来的「第四次工业革命」中,给生产力带来指数级的提升。
机器人比汽车更复杂,但随着大模型和推理能力突破,很多过去很难跨越的技术门槛正在被打开,这也是机器人过去两年快速升温的原因。
但至少今天汽车可能仍然是物理AI,最清晰、也最接近规模化兑现的场景,机器人还在寻找足够大的量产切口。
汽车已经有成熟的供应链、十亿级的终端以及明确的付费方,从 L2+到 L4的演进路径也逐渐清晰。全球每年十万亿英里级别的道路行驶里程,本身就是一个巨大的数据和商业闭环。
这也是英伟达重新定义汽车业务的核心:它不再只是一辆车上能卖几颗Thor芯片,而是把数据中心+车端计算、世界模型+仿真系统以及自动驾驶软件开放出来,希望成为车企打通物理AI的基础设施。
如果说过去十年,数据中心是英伟达的主战场。那接下来,汽车可能就是英伟达把 AI 推向物理世界的第一条主干道。车端的 Orin、Thor 只是入口,背后的数据中心和软件栈,才是更大的生意。