来源:环球时报
【环球时报报道 记者 杨沙沙】自今年年初以来,从美国拉斯维加斯的国际消费电子展,到中国农历新年春晚,中国人形机器人的惊艳表现,不断刷新外界认知,引发全球讨论。在这场以人工智能(AI)为核心的关键技术竞赛中,中美两国正围绕“大脑”与“身体”展开竞速。近日,中国机器人初创企业北京银河通用机器人有限公司(简称“银河通用”)创始人兼首席技术官王鹤接受《环球时报》专访,从春晚舞台上“盘核桃”“串烤肠”的精细动作切入,深度解析了人形机器人发展的技术瓶颈、中美各自的优势与短板,以及中国完备制造业带来的底气与未来图景。
“大脑”与“身体”之战
英国广播公司近日报道称,英国伦敦大学学院从事认知神经科学研究的尼克·赖特将AI竞争精妙地概括为“大脑”与“身体”之战。他认为,美国在“AI大脑”领域领先,包括聊天机器人、微芯片和大语言模型等,而中国在机器人等“AI身体”方面更具优势,尤其是人形机器人。
今年的春晚直播中,银河通用的Galbot机器人,向全球展示了盘核桃、捡玻璃、叠衣服、串烤肠等一系列精细操作。王鹤以“串烤肠”为例,向《环球时报》记者详细解释了机器人如何通过“大小脑分工”来训练复杂任务。在机器人做出动作前,大脑部分要解决“先干什么后干什么”的规划问题,比如串烤肠需要分六七步,先抓烤肠夹、用夹子夹烤肠、再抓签子、用签子插烤肠、松开烤肠夹、递出去等。
小脑部分,则要解决“怎么操作”的问题,比如怎么抓稳烤肠夹、该用多大力。“这部分是通过大规模的强化学习完成的,在仿真器里进行成千上万次演练,让几千只手同时学习,最终学会精准的力度控制。”王鹤解释称,经过上述分工配合,大脑以真实数据为主,小脑以合成数据为主,一起完成串烤肠这样需要双手配合的复杂任务。
王鹤透露,春晚导演组一开始很期待机器人能表演转笔这个动作。“我们事实上也能够做到在真实世界中让机器人把钢笔转起来。”他告诉记者,钢笔又细又长,在机器人指头之间转的过程中,涉及多次旋转、接触点变化、保持运动惯性等等,技术非常复杂。3年前,美国英伟达的团队让机器人在仿真器里能转起笔来,但在真实世界里,却迟迟转不起来。
对此,王鹤解释说,英伟达相比银河通用拥有更强的算力和更全的大模型全栈布局,但具体到具身大模型和机器人领域,像银河通用这样的中国公司,能够从零开始打造机器人的硬件乃至整条供应链,根据AI的发展需求,量身定制机器人的“身体”。同时,银河通用能够将大量真实与合成的数据融合,反过来迭代硬件,从而在数据、模型、硬件之间形成一个闭环。这些正是英伟达不做或做不了的事情,他们现在反而采购银河通用的机器人硬件来进行实验,也正是在这种具体迭代中,双方差异逐渐显现。
一个业界共同面对的挑战
2025年1月,英伟达创始人黄仁勋访华时,曾邀请国内合作伙伴在北京交流,王鹤就坐在黄仁勋右边,双方就合成数据等话题聊得很深入。王鹤告诉《环球时报》记者,英伟达与银河通用在具身智能的研发理念上有很多相近之处,都认为数据采集很关键。王鹤表示,“谁拥有大量人形机器人干活的数据,谁就能在这个时代训练出好的模型”。
这是一个业界共同面对的挑战:人形机器人的干活数据从哪里来?今年两会期间,全国政协委员、新希望集团董事长刘永好接受《环球时报》记者采访时反复提及,“机器人在复杂作业环境下的操作数据极度稀缺”,具身智能要实现真实落地,急需海量高质量数据训练模型。
而银河通用的主要突破在于,把合成数据的能量发挥了出来。王鹤介绍称,通过大量的物理仿真和合成管线,银河通用生产出高精度的操作动作序列、视觉图像,以及力觉、滑觉等多模态信号,产出具身数据集,进而让机器人能够在虚拟世界训练出干活能力。
而对于中国机器人的发展,国外媒体主要有两种声音。英国《经济学人》在今年中国春晚后不久,以《中国的人形机器人正惊艳世界,谁会买单?》为题报道称,目前大多数被采购的中国人形机器人用于展示,少数用于实际工作。
同时,西方也看到中国在人形机器人产业逐渐形成的实力。当地时间1月28日,在被问及如何看待特斯拉人形机器人在全球范围内面对的竞争时,马斯克说:“我认为,迄今为止特斯拉人形机器人最大的竞争对手来自中国。中国非常擅长扩大制造业规模,同时擅长运用人工智能技术,并处在持续进步的进程中,因此绝对是特斯拉最强劲的竞争对手。”
“这其中(中美)明显是有竞争,也有合作。”针对上述两种声音,王鹤表示,首先,美国没有很好的硬件量产能力。美国高校很难买到像机器人初创企业Figure AI、特斯拉生产的机器人来做研究。包括英伟达这些企业,它们用到的硬件很多来自中国。
其次是在技术上,Figure AI于今年1月提出新一代全脑架构,在System2和System1基础上,又引进了System0。王鹤感受到,目前中美确实处在一个激烈的竞争当中,大家都在拼命地打通“大小脑”。
未来机器人至少应该跟汽车价格相当
王鹤2014年从清华大学获得学士学位,2021年获美国斯坦福大学博士学位后加入北京大学,建立具身感知与交互实验室。2023年5月,与姚腾洲联合创立银河通用。从美国斯坦福大学毕业后,王鹤没有在美国任何一家企业面试,就直接选择回国,原因是他认为对于人形机器人产业来说,中国从产业培育、资金支持到政策支持,能够帮助企业快速迭代技术和产品。
“十五五”规划纲要提出全面实施“人工智能+”行动,并明确指出,抢占人工智能产业应用制高点,全方位赋能千行百业。人形机器人所在的更广泛领域“具身智能”也被列为中国的“未来产业”,与人工智能一起,被寄望成为新的经济增长点。
现在,美国初创企业OpenAI愿意高薪聘请王鹤的斯坦福同学。王鹤称,“他们可能领着比我高很多的薪水,但很少有人能真正做到一个领导者,从0到1把一个企业在美国做起来”。回国创立银河通用后,王鹤带领团队攻克技术难题,实现人形机器人量产、人形机器人7×24小时常态化工作,他说:“这一点在美国是很难做到的。”
根据研究公司Omdia的报告和估算,去年全球交付了超过1.45万台机器人,而2024年仅为约3000台,这些机器人几乎全部来自中国,特斯拉仅出货了150台擎天柱机器人。据香港《南华早报》报道,受中国机器人行业快速增长的推动,美国投行摩根士丹利上调2026年中国人形机器人销量预测,预计今年销量将增长133%至2.8万台,较之前预测的1.4万台翻一番。
王鹤认为,未来机器人成本降到20万元以下、甚至十几万元是可能的。“一个观点是,未来机器人至少应该跟汽车价格相当。”王鹤总结称,汽车是一个万亿甚至十万亿级的赛道,人形机器人同样如此,还有巨大的想象空间。但距离降价到普通大众都能接受的那一天,至少还需要5到10年。