2026年,具身智能要告别数据荒
统计 阅读时间大约9分钟(3554字)

20小时前 2026年,具身智能要告别数据荒

来源:星河频率
量产从来不是终点,而是起点。

作者:毛心如   出品:星河频率

2025 年,具身智能行业交出了一份以量产元年为关键词的答卷。

全球人形机器人出货量接近 1.8 万台,灵巧手量产数超过了 2 万台……从订单到供应链,成熟度都在肉眼可见地提升。

这一年能不能做出来产品已经不再是疑问,行业已经证明了各个玩家的工程化能力。

但量产从来不是终点,而是起点。

当机器人真正规模化走向真实场景,真正问题开始浮现,机器人在工厂里能运转,不等于能在家庭里干活;能表演,不等于能理解物理世界。

问题的核心指向了数据。

2026 年开年,千寻智能、灵巧智能、灵初智能、鹿明机器人等先后公布年度目标,不约而同地都指向了同一个方向,冲击百万小时量级的有效数据采集。

相同目标背后是行业共识的集中显现,在量产之后,必须解决能用的问题,而能用的核心,在于让机器人获得足够多、足够好的真实世界交互数据。

所以 2026 年,也成为了具身智能行业预期的数据元年。

2026年,是具身智能数据元年

迈入 2026 年,量产-交付-创造营收依旧是大多公司的主线任务之一。

但量产之外,创造有效数据,继而提升模型能力,帮助机器人机器人理解物理世界、完成复杂任务、适应真实场景成为了重中之重的任务。

从政策层面来看,多地已经出台专项规划推动数据基础设施建设。上海、天津等城市相继建设具身智能数据采集基地、跨本体开源数据集平台,将高质量数据采集列为产业发展的重点任务。

资本层面的动向同样印证了数据元年的到来。最近几个月,诺亦腾机器人、光轮智能、觅蜂科技等数据供应商都完成了数亿元融资。

行业层面,无论是本体公司还是零部件供应商纷纷跑步进场布局数据采集,数据工厂正在成为产业新基建。

帕西尼在天津建设的全场景数据工厂、智元机器人在上海搭建的真机训练平台、北京具身智能机器人创新中心的数据采集基地,均已投入规模化运营。

通过复刻家庭、工厂、物流等真实场景,持续采集机器人与物理世界交互的操作数据。

be8b668e7adc7132a403dc617c5aa4a9.png

这些数据工厂的集中落地,也标志着行业从分散式研发转向集中式数据生产,数据采集进入工业化、规模化阶段。

然而,当各家企业都在奋力生产数据时,一个此前被忽视的问题开始浮出水面:具身智能对数据的要求最高、采集难度最大、缺口也最致命。

行业真正短缺的,从来不是普通的机器人数据,而是有用的数据,尤其是高质量的灵巧操作数据。

而拆解数据元年下灵巧手数据采集的核心困境,可以发现两个并存的深层矛盾。

第一个困境,是优质数据的结构性稀缺,且缺口持续扩大。

数据元年背景下,机器人整体训练数据需求激增,但灵巧手数据的稀缺性远胜于普通机器人数据。

两者的区别在于,普通机器人数据侧重场景广度、导航避障,而灵巧手数据要求高维度、多模态、强时序,必须融合姿态、力觉、触觉等多种信息。

据行业调研,目前优质灵巧手数据的供给量不足实际产业化需求的 10%,这不是单纯产能提升就能解决的问题,而是一种结构性稀缺,真正能用、好用的数据,还没有被规模化生产出来。

多数企业因为缺乏优质数据,产品无法真正实现规模化落地。

90b17be7f92323efea54c7df4f1a23bf.png

第二个困境,是缺乏统一的采集标准,严重制约了行业的协同突破。

当前灵巧手数据采集,标准缺失成为了最大的阻碍。各家企业采用不同的采集方案、数据格式、标注体系,导致最终产出的数据无法互通、难以复用。

这样带来了必然的后果:

没有统一规范,行业整体研发效率低下

资源严重浪费,各家重复造轮子

产业化受阻,数据无法复用,算法难以迭代,落地成本居高不下

这不仅是单个技术问题,更是行业协同的基础设施缺失。

如果说2025年行业回答了能不能规模化量产灵巧手的问题,那么 2026 年的核心命题就是,在数据元年的背景下,如何破解优质数据的稀缺困境,建立统一的采集标准,推动行业实现真正的协同突破。

高质量数据从哪里来

虽然目前行业缺乏统一的数据采集标准,但对于什么样的数据才算高质量数据已经有明显的共识。

按照质量、有效性、物理真实性,机器人训练数据形成了清晰的数据金字塔,金字塔由三层结构组成,不同层级的数据价值差异显著。

金字塔的底层,是互联网视频数据。这类数据量大、获取成本低,但缺乏深度物理交互信息。

模型可以看到人类如何抓取物体,却无法感知抓取时的力度、触感、以及动作背后的物理逻辑。

金字塔的中层,是仿真数据。这类数据可以规模化生成,成本可控,但始终存在仿真到现实的鸿沟。

仿真环境中的物理规律无法完全复现真实世界的复杂性,导致模型在仿真中表现优异,在真实场景里容易出现失误,泛化性面临持续挑战。

而位于金字塔顶端的,是遥操作数据。遥操作,是由人类操作者通过某种设备远程控制机器人,让机器人复刻人类的动作,同时记录下完整的动作序列、力觉反馈、触觉信息等多维数据。

这类数据提供最高质量的真实物理反馈,动作序列与逻辑保持一致,是训练具身智能模型价值最高的数据。

5368d38be241e3a4476e86479fc8aaa8.jpg

基于数据金字塔的共识,另一个共识也显现出来,要实现具身智能的灵巧操作能力,必须依靠遥操作采集高质量真机数据,互联网视频与仿真数据只能作为补充,无法替代遥操作数据的核心价值。

目前,遥操作主要由三种方式实现,分别是VR 遥操作、动作捕捉和外骨骼遥操作。经过几年的产业试错,每条路径的能力边界已经清晰。

VR遥操作的核心优势是沉浸式交互,通过 VR 头显让操作者进入机器人第一视角,获得直观的环境感知,操作逻辑简单、上手门槛低。

但 VR 设备对手部动作的采集依赖视觉追踪,手指关节细小、易遮挡。

一旦指尖超出视觉范围或被物体遮挡,动作追踪精度就会大幅下降,无法捕捉毫米级精细动作,更难以采集连续的力觉反馈数据,在灵巧手数据采集中存在明显局限。

动作捕捉技术的主场是大范围人体运动采集,光学动捕、惯性动捕方案对全身骨骼轨迹、肢体运动的还原度极高,广泛应用于机器人全身运动训练。

但手部关节数量多、运动幅度小、遮挡场景多,光学动捕需要大量标记点,标定流程复杂,惯性动捕存在漂移误差。

同时,规模化采集手部精细数据的成本居高不下,难以满足灵巧手数据的大批量、高精度需求。

而外骨骼遥操作的核心能力腹地恰好就是精密手部操作。

外骨骼设备采用机械式物理连接,与人体手部骨骼直接对应,操作者的每一个手指动作、指尖位移、抓握力度,都能通过机械结构实时、无误差地传递给机器人,同步采集精准的运动数据与力觉数据。

无论是指尖毫米级微调,还是柔性物品的轻握、重捏,外骨骼都能完整还原,完美适配灵巧手精细操作的数据采集需求。

7bd38481eb2dfe2aad4a5d0a88be70c9.png

三条路径没有绝对的优劣之分,只有分工不同,问题只在于哪种方案更适配灵巧手的数据需求。

外骨骼是遥操作必然选择

处在数据元年的产业背景下,行业对数据采集提出了三个硬性要求,分别是高质量、可规模化、可持续。

将这三个要求与三种遥操作方案的功能叠加匹配,唯一能够完整覆盖所有条件、满足行业刚需的技术方案,只有外骨骼遥操作。

高质量是数据采集的核心前提,外骨骼通过机械式物理连接,从根源上保证了数据精度。f

不同于 VR、动捕依赖视觉或惯性算法感知,外骨骼与手部骨骼直接绑定,指尖无论是位置还是力度的细微变化,都能被无误差采集,数据噪声极低、物理真实性拉满。

同时,外骨骼能够同步采集位置、速度、力觉、触觉等多模态数据,满足具身智能大模型对多维信号的训练需求,确保训练出的灵巧手能够完成真实场景中的精细操作。

可规模化是产业落地的必要条件,外骨骼采集系统具备极强的可复制性与经济性。

VR 设备需要搭配视觉追踪套件,动捕需要搭建高精度光学场地,前期投入与场景改造费用高昂,难以快速规模化部署。

外骨骼设备结构紧凑、安装便捷,无需复杂场地改造,单人单设备即可完成采集工作,学习成本低。

采集人员经过简单培训就能实现人机合一,大幅提升单位时间有效数据产出比,能够快速搭建规模化采集团队,满足行业对海量数据的需求。

可持续是长期发展的关键保障,外骨骼数据采集具备稳定的迭代能力。

外骨骼设备硬件耐用性强,长期采集不会出现精度衰减,数据质量始终保持稳定;同时,外骨骼输出的数据格式统一、维度完整,便于后续标注、清洗、复用,能够形成持续迭代的数据集。

随着灵巧手硬件升级、场景拓展,外骨骼采集系统可以快速适配新的操作需求,持续输出高质量数据,形成采集-训练-迭代-再采集的良性数据闭环。

正是基于对外骨骼路径的深度理解,一些走在前面的本体厂商已经开始将这套方法论产品化。灵巧智能依托自身在灵巧手硬件领域的积累,将外骨骼采集方案落地为可规模化的数据基础设施。

这套被命名为 DexCap 的系统,延续了外骨骼的机械传动逻辑,操作员穿上后,手指的每一次弯曲、捏合、旋转,都能被实时映射到机器人灵巧手上。

从参数上看,它的确在回应行业对「高质量数据」的诉求:双臂各 9 自由度、双手各 21 个自由度,腰部 5 个自由度的全维度捕捉,毫米级的末端精度,1000Hz 的采样频率,确保了每一次抓握的力度、角度、时序都被完整记录。

更重要的是,它足够轻。整机不到 2 公斤,一个人就能完成穿脱,充一次电能支撑一整天的采集任务。这意味着,数据采集不再是实验室里的高成本实验,而可以真正走向工厂、家庭,成为可复制的日常操作。

c1b32c6fd7c5843ba2e7bfb90cf27d0d.png

而这背后,也正是灵巧智能作为灵巧手本体厂商的独特站位。

相较于第三方采集企业,本体厂商是离灵巧手产品、应用场景最近的参与者,他们比任何人都清楚:什么样的数据对灵巧手是“好用”的,什么样的采集方式不会磨损硬件,什么样的操作逻辑最能还原人类手势。

这种理解,很难从第三方视角获得。

当数据采集方案由本体厂商定义,它就不再是外挂工具,而是与硬件共生的一套系统。 这或许是数据元年里,行业突破瓶颈最值得关注的一种变量。

2026 年刚刚开始,数据元年的序幕也已经拉开。

谁能彻底挖掘出优质灵巧操作数据,取决于谁能用正确的路径、以可规模化的方式持续产出高质量数据,并推动行业走向标准与协同。

而具身智能数据荒迎来破局的那一刻,才是行业从可用走向好用的起点。

01490c5d99569026d6280c02865a8737.jpg

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×