作者:兰博 出品:42号电波
9 月 11 日,在 2025 外滩大会上,宇树科技创始人兼首席执行官王兴兴发表了最新观点。针对机器人模型、数据和硬件等问题提出了自己的看法。
王兴兴认为,让 AI 干活整个领域目前都是荒漠,只是长了几棵小草,爆发性增长的前夜还没有到来。而且现在的硬件完全是够用的,哪怕是一两年前的硬件都足够。
但王兴兴表示,目前的 AI 模型还用不好硬件,在机器人领域也面临着很大的挑战,对此他也分享了自己的一些观点。42 号电波在不改变原意的情况下进行了编辑,以下内容仅供参考。
数据和模型都重要,但模型还用不好硬件
在业内非常关注的数据和模型问题上,王兴兴认为目前数据和模型都非常重要。从数据角度看,目前机器人的数据无论采集还是数据质量等问题都非常大,而且在优质数据如何采集、数据质量应该达到什么程度、采集什么类型的数据、采集多大规模等问题上都还没有标准,现在还处于比较模糊的阶段。
而且要尽可能提高对数据的利用率,模型本身对数据的理解能力更强,那数据就可以少一些。从模型的角度看,可以发现数据里哪些比较有价值,就可以重点采集。在语言模型的角度,很多情况需要有一些特征性的数据,而不是单纯看量,因为有些特征性的数据非常重要。
接着王兴兴表示,目前的模型对多模态的融合做得不太理想,虽然纯语言模型、纯视频模型的效果很好,但是单纯把语言和图像效果要做得很好,是当下比较大的难点。要控制好图片、视频生成的细节,单纯用文字控制是很难的,但目前通过插图或者线稿来控制的话生成效果会更好。
而且在机器人领域,单纯从语言或其他方式让机器人的控制模态绑得更好一些,也是一个很大的挑战,比如用视频生成去让机器人做家务。虽然现在视频生成效果还不错,但是生成的效果跟机器人的控制模态要对齐得非常好的话也非常具有挑战性。
在硬件和模型端,王兴兴认为目前的硬件完全是够用的,甚至一两年前的硬件都是足够用的,现在最大的问题还是在模型上面。AI 模型本身的能力还是不太够,没办法很好的把硬件用起来。比如灵巧手,要把灵巧手用好对于目前的 AI 来说非常困难,无论是数据采集还是控制灵巧手去做更灵巧的事、而不单单只是做一些简单的抓取动作,这对于 AI 领域还是非常有挑战性的事情。
让AI干活的领域还在荒漠阶段
无论是 AI 还是机器人,没人想象到现在的发展比之前预计的要乐观很多。王兴兴提到,自己做机器人已经有十几年的时间,在 09 年大一最开始做的机器人就是小型双足机器人,后来宇树科技的主营业务也变成了人形机器人和四足机器人。
尽管宇树科技已经是现在机器人领域的明星企业,但王兴兴谈到 AI 的时候还是有些遗憾,在这里他也分享了一个趣事:自己在过去做过最后悔的一件事就是本来很喜欢 AI,但在 2011 年的时候 AI 还很冷门,相关的书籍都在图书馆吃灰,而自己看了一些书后认为能做的事还比较少,所以之后就没有花太多时间去关注 AI,此后几年主要就是在机器人领域发力。
不过他认为,最近几年因为 AI 领域的发展,包括机器人的 AI 模型,也给了自己又一次机会去把握住 AI 时代,然后让 AI 真正去落地能干活。现在的语言模型在信息领域,包括文字图像这些已经足够出色,超过了 99.99% 的人。但让 AI 干活这个领域还处于荒漠阶段,现在就是荒漠上长了几个小草,真正的大规模爆发性增长的前夜还没有到来。但这个时代是非常激动人心的,AI 时代非常公平,只要聪明、想做事、想达成自己的目标,大家都有机会让荒漠上长出参天大树。
AI对年轻人是机遇
在 AI 原生时代上,王兴兴认为最近几年尤其是对年轻一代、包括还在读书的学生来说是非常好的机会,以前大家编程主要是从基础性的代码做,而现在是使用工具,包括用 AI。目前的 AI 模型本身就可以把它当做一个很好的预编程的工具集。原本大家可能都是调一些最基础的代码,而现在就可以用更高级的模型能力去创作作品,无论是生成模型,或者是用 AI 模型去编 Agent,现在比以前都方便很多。
王兴兴表示,大家对 AI 模型本身的认知可以激进一些,不用把它当做一个模型,要把它当做全能型的工具集,而且要把过去一些东西忘掉,然后去重新学习和接受它,这样可以产生更多新的灵感,依赖过去的经验对未来决策不是好事,把握当下已经发生的事情,然后去做新的决策,反而更可能发生一些新的创造。