具身智能“带货”元宇宙,只是次机会的开始
统计 阅读时间大约9分钟(3511字)

3小时前 具身智能“带货”元宇宙,只是次机会的开始

来源:具身研习社
元宇宙:还有意外之喜?

作者:阿茹娜     编辑:吕鑫燚     出品:具身研习社

商业世界的演进从来不是一条平滑的直线。当一个足够量级的新物种破土而出,它会像宇宙中诞生的新恒星那样,以自身质量重构周围的引力场,重新分配资源流向,也重新定义什么才是真正有价值的东西。被改变的从来不止是产业的中心地带,更多时候,那些原本被遗忘在角落的资源、濒临淘汰的行业,会在这场价值重组中意外获得新生。

二十年前,没有人会想到纸箱厂会成为数字经济时代的隐形赢家。电商的爆发式增长,让这个最传统的制造业分支起死回生,瓦楞纸箱从包装辅料一跃成为现代物流体系的“原子单位”。

这正是技术革命带来的"余震效应"。

今天的具身智能行业,正站在这样一个历史节点上。

尽管这个行业至今仍未找到成熟的规模商业化路径,技术路线的争论也远未尘埃落定,但未来万亿级的市场预期已经吸引了大量资本涌入。这些资金不仅在加速技术迭代,更通过强大的价值外溢,催生了一批此前无人关注的“次级机会”。

最直观的变化发生在机器人产业链内部。随着越来越多的机器人走出实验室进入真实场景,机器人租赁、运维、保险等配套服务正在快速成熟;原本只存在于科幻小说中的“机器人服装”已经成为真实的生意;面向青少年的机器人教育培训,也从编程启蒙延伸到了具身智能操作与维护。一个围绕机器人的完整产业生态,正在以超出所有人预期的速度成型。

但更值得关注的变化,发生在那些看似与机器人毫无关联的领域。

就像电商拯救了纸箱厂,具身智能的崛起也正在激活大量看似无关的产业资源,它们在这场技术革命中被重新发现价值。

这种价值重构往往并不直接来自产业本身。新产业的出现改变了人们的生产方式和行为模式,进而改变了整个社会的需求结构。那些原本处于边缘的事物,突然之间就被推到了聚光灯下。这种技术带来的“余震”,对商业世界的影响往往比技术本身更宽广,也更隐秘。

接下来,我们将从几个微观的切口,去观察具身智能究竟在商业世界激起了怎样的涟漪。

bac8b31bc888e5d54d7ad2e9de9f1d6b.png

最能凸显出具身智能“带货能力”的,是元宇宙留下的硬件。

VR 设备曾是元宇宙时代最耀眼的弄潮儿,也曾是那场泡沫破裂后最落寞的幸存者。它没有等来传说中的VR 杀手级应用,却以一种完全意想不到的方式,在具身智能的浪潮中找到了自己的第二人生。

2021年,元宇宙的泡沫吹到了顶峰。那一年,字节跳动以 90 亿元的价格收购 PICO,被视为大厂押注下一代计算平台的标志性事件。在那场疯狂的军备竞赛中,无数 VR 创业公司如流星般划过夜空,最终只有 PICO 和 Meta Quest 等少数玩家活了下来。

8e5582f6201713cc1cd92a57eb7d38a2.png

但谁也没有想到,元宇宙的退潮来得如此之快。此后三年,概念泡沫破裂,资本热情消退,VR设备厂商经历了一系列打击。曾经被寄予厚望的下一代计算平台,一夜之间变成了相对小众的硬件设备。

我们能看到,VR 设备近年来一直在游戏之外寻找新的生存空间,不断通过影视等内容,丰富生态。但没有人能预料到,刚刚兴起的具身智能却成为了最大客户之一。

这并非偶然。XR的本质,是让人与数字世界实现更自然的感知与交互(XR意为扩展现实,包含VR、AR等概念,强调虚拟与现实的结合)。为此需要将人的动作,通过空间感知、实时建模,映射到数字世界中。而这种能力,恰恰与机器人数据采集所需要的底层能力高度一致,同样需要将人体运动映射到机器人本体,并将数据结构化留存下来,供机器人学习。

两者的底层技术栈,有太多重合的韵脚。

2025年 8 月,PICO 正式发布机器人远程操作框架 XRoboToolkit。这套系统解决了行业长期存在的两个核心痛点:一是将端到端延迟压缩到了 20 毫秒以内,彻底消除了数据采集过程中常见的眩晕感;二是优化后的运动求解器和灵巧手重定向算法,能够将人类的手势动作以亚毫米级的精度映射到机器人端,实现拧螺丝、插排线等精细操作。

仅仅一个月后,东莞工业机器人企业拓斯达发布的新一代人形机器人,就全面采用了PICO 头显和高精度力反馈手柄作为数据采集终端。通过这套 “VR+AI + 工业机器人”的协同系统,一个普通工人只需要戴上头显,就能在千里之外操控机器人完成复杂的装配任务。

而在江苏宿迁的京东机器人数据采集中心,数百名工人正戴着PICO 头显,日复一日地演示超市扫码结账、仓库分拣、快递搬运等日常作业,这些第一视角的动作数据,将成为京东机器人大脑最宝贵的养料。

这不是PICO 一个人的故事。在全球范围内,XR 头显正在成为具身智能时代最重要的数据采集基础设施。Meta Quest 3 是海外绝大多数机器人项目的标配,英伟达的工程师们正在用 Apple Vision Pro 完成遥操作,再将数据导入 Isaac Sim 进行百万倍的模拟扩增,用于训练 GR00T 等通用机器人基础模型。

28e0109be7aa05a0d1e0193ecde381f9.png

相比于传统动辄数十万元、需要占据整个房间的动作捕捉系统,一台售价仅两千多元的头显,显得颇具性价比。

但更重要的优势,是头显独有的第一人称视角。第三人称动作捕捉系统,只能记录人类肢体的空间位置,却无法捕捉操作时的力度控制、遇到障碍时的反应速度、甚至是眼神的细微变化。而头显生成的egocentric(自我中心)数据,完整保留了人类操作时的感官细节。

这或许是技术史上最奇妙的轮回之一。三年前,人们以为元宇宙会是人类的未来,为此投入了数千亿的资金,打造了一整套空间计算的基础设施。当泡沫破裂,这些投入似乎都打了水漂。

但没有人想到,那些曾经用来构建虚拟世界的空间计算技术、动作追踪系统和第一视角交互能力,正在以数据和算法的形式,沉淀到机器人的身体里。

556d1f2b5d2aba39efb822722079b371.png

元宇宙硬件设备在具身智能的应用只是这场价值重构的序幕。

那个十年前就提出的“下一代计算平台”,在十年后终于逐步打开消费级市场的同时,也找到了大规模的B端出货场景。

Meta在 2023 年低调启动的 Project Aria,原本被定位为 “未来 AR 眼镜的感知试验田”,如今已经成为具身数据采集基础设施之一。这套重量不到100 克的智能眼镜,正在被全球顶尖大学和研究机构使用。

b5f1d934b10dd3c0866189eadc8c4ad8.png

纽约大学和加州大学伯克利分校联合发起的EgoZero 项目,就是基于 Project Aria 设备完成的。研究人员发现,机器人不需要复杂的遥操作手柄,也不需要昂贵的动作捕捉系统,只需要观看人类戴着智能眼镜完成日常任务的第一视角视频,就能通过模仿学习,掌握从泡咖啡到整理桌面的一系列复杂操作。

这是智能眼镜独有的优势。相比于需要专门佩戴、只能在特定场景使用的头显,智能眼镜是目前最接近“无感佩戴” 的设备形态。它可以连续记录人类日常活动,捕捉那些在实验室里难以捕捉到的非标准化的动作细节。

而这些杂乱数据,恰恰是通用机器人最稀缺、也最宝贵的养料。

88a02404b551e8696548d951a914387a.jpg

这正是具身智能最迷人的地方,不必死磕自研,很多时候,解决行业最核心问题的答案,早就藏在那些已经被市场验证过的技术和产品里。我们需要做的,只是换一个角度,重新发现它们的价值。

随着具身数据采集从实验室走向工业化,再进一步走向众包时代,这条产业链的成本正在以前所未有的速度下探。彼时,一个所有人都意想不到的“原材料”,突然出现在了市场上:积压在全球各地仓库里的旧款 iPhone。

没有人会想到,那些因为型号过时而无人问津的库存iPhone,会成为具身智能时代性价比最高的硬件之一。一台发布于5 年前的 iPhone XR,如今在二手市场的价格已经跌到了 300 元以下,但它依然搭载着成熟的 RGB 相机、深度传感器和运动追踪模块。

部分企业发现,只需要一个简单的头带固定,它就是一台性能不输专业设备的第一视角数据采集终端。

在消费电子市场,旧设备的命运似乎早已注定,每一款新品发布,旧款就会迅速贬值,最终被扔进回收箱,拆解成金属和塑料。但在具身智能的语境下,这些“过时” 的设备突然拥有了全新的价值。

它们的处理器不再需要运行最新的游戏,它们的屏幕不再需要显示高清的视频,它们的电池也不再需要支撑一整天的重度使用。它们只需要做好一件事:记录这个世界,然后把人类的经验,传递给下一代机器人。

bd9501aea42043bc2d1e0ff190579d1c.png

如果说数据采集是具身智能浪潮掀起的第一道清晰浪头,那么还有无数个次级机会,已经悄无声息地漫过了我们的脚踝。

说一个谁都没有意识到的案例:咖啡机。

在咖啡爱好者坚不可摧的鄙视链里,半自动咖啡机永远站在金字塔尖。手磨、压粉、萃取、打奶泡,每一个步骤都充满了仪式感,也承载着对风味的极致追求。而全自动咖啡机,却因为出品高度统一、效率极高等优势,在成为办公室和连锁店的最佳选择时,也被某些人贴上 "不懂咖啡的人才会用的东西"的标签。

有趣的是,在具身智能新商业模式中,全自动咖啡机又找到了一个优势最大化的方式。

当各个品牌咖啡机器人出现在市面上,与机械臂配合的,永远是全自动咖啡机。例如咖爷科技。毕竟半自动的工作流,充满复杂的手动操作,不仅意味着指数级上升的技术难度,更意味着不可控的故障率和维护成本。而标准化、模块化、一键出杯的全自动咖啡机,恰恰是机器人最完美的搭档。

这背后,是一个正在发生的根本性转变:机器人正在成为这个时代新的"筛选器"。它的能力边界、工作逻辑和局限性,正在反过来定义生产工具的设计标准,甚至重塑整个产业的上下游。

未来,我们可能会看到越来越多这样的“反向适配”。例如,超市的货架会设计成机器人更容易抓取的高度。

产业革命从来不只会创造新物种,它更擅长重新排列旧世界;

它也不会把一切推倒重来,而是会在原有的地基上,重新分配价值的权重。

就像英伟达的GPU 最初只是为了满足游戏玩家的需求,谁也没有想到,二十年后,它会成为 AI 时代最核心的基础设施。对于大多数人来说,离我们最近的机会,往往藏在那些最不起眼的角落里。

它们可能是一款积压了多年的产品,可能是一门无人问津的生意,可能是一项已经被淘汰的技术,也可能是你已经拥有了很多年的某样东西。

这是每一个大行业兴起时都会反复上演的剧本。当巨石入水,涟漪会传得比所有人预想的都更远。而那些最先看到涟漪的人,往往就是最先抓住机会的人。

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×