口袋机采:这一次,我们把“训练机器人”的能力,装进每个人的口袋
统计 阅读时间大约6分钟(2209字)

10小时前 口袋机采:这一次,我们把“训练机器人”的能力,装进每个人的口袋

来源:穹彻智能
具身数采正从采集场走向日常生活。

具身数采正从采集场走向日常生活

当前具身智能所需数据,仍受限于实验室与集中式数采场景,真实世界中的多样操作与物理交互,难以被系统性覆盖。回顾自动驾驶的发展我们可以看到,当系统从实验室走向真实道路,数据也从少量、受控的采集,转向在真实场景中的规模化沉淀,进而推动模型能力的快速演进。

正是基于这一经验,穹彻智能正式推出口袋机采(RoboPocket)——通过智能手机和 App,每位使用者都可以成为数据采集的参与者,完成任务并上传数据,实现轻量化、可控且高质量的数据采集,将数据采集扩展到更广泛的真实环境中,让更多使用者能够参与任务采集。并在轻量化、可控的前提下,持续产出高质量可用数据,为具身智能模型构建更真实、可靠的数据基础。

RoboPocket

让每个普通人都可以采集高质量数据

RoboPocket 是每个普通人都可以操作的“从口袋掏出即可开始采集”的高质量数采方案。

1

轻便易用:高度集成的高质量数采设备

数据采集不再依赖复杂的专业设备,一部手机即可解锁无限的高质量采集。RoboPocket 体积轻巧、开箱即用,用户只需拿手机轻轻一碰,即可与设备连接开始采集。

f8599a95e0ea649beaa0ed26f8afa551.jpg

图注:开箱与快速启动

这样轻便的数采方案并不以牺牲精度为代价。

手机,如iPhone,同时具备 RGB 相机和深度相机(LiDAR),相比纯视觉 SLAM,它是多传感器融合(视觉、深度、IMU)的方案。在这一路线下,采集精度高于纯 VSLAM,对比红外定位也无需拖着基站,同时保持高度集成。可拆卸、可替换的鱼眼镜头带来超广视野,原生镜头画质出色,无惧强光、弱光等真实场景挑战。RoboPocket 无论在昏暗的房间内,还是在野外阳光直射的环境下都保持良好的性能。

114d2a04c45582ebb4310e13a18a90cd.jpg

图注:鱼眼镜头、超广角视野

RoboPocket 利用手机的成熟能力完成 SLAM 定位与建图。相比原版 UMI 需要手动标定、反复操作,RoboPocket 的核心价值之一便是让“建图变成一件令用户无感的事”。

ed1e611f838e9b3157e75512f98f47b7.jpg

图注:快速建图

2

实时保证采集质量:RoboPocket更是一个智能中枢

在具身模型规模化时代,数据质量和数据量同等重要。

传统的UMI式数采方案一直面临着一个数据质量、便携易用、后处理压力的不可能三角。如果要保证数据质量,通常需要牺牲便捷性,采集设备插着电脑来提升数采现场的质量反馈效率,而这样的方式,注定不能走入千家万户;或者需要集成存储和数采的小型设备,将数据处理压力留在采集后,导致采集效率低下,数据可用比例较低。

RoboPocket 面向大规模、分布式的真实场景采集设计,以集成的形态,通过强化实时交互与质量控制,来解决这样的不可能三角。

我们重新定义了具身智能的数据采集范式,将对模型训练的理解融入了端侧的智能中枢,RoboPocket 是一位时刻在线的人工智能导师,不仅能即时诊断每一帧的数据质量、智能指导采集员调整动作,更能通过实时互动动态评估数据价值,让每一次采集都直接贡献于最关键的模型进化。

任务指导:任务采集教程可实时下发到数采人员端,指导数采人员操作。

图注:任务教学指导

实时交互提醒:提示采集者动作过快、超出机器人工作空间,避免无效数据进入后处理环节。

图注:异常速度检测

图注:异常动作监测

多维质量打分:在采集阶段即对数据进行评分,帮助采集员及时修正,并为后处理提供筛选依据。

图注:数据质量闭环监测

基于在采集阶段引入质量控制机制,RoboPocket 能够尽可能提前解决数据质量问题,使得后续的数据处理从“灾难性清洗”转向“有监督的筛选”。

3

灵活加入第一人称视角:多设备快速对齐

视角局限是腕部第一视角的天然问题。RoboPocket 支持灵活加入第一人称视角,并通过多机快速对齐实现同一空间坐标。这种设计既保留了 UMI 的“具身一致性”,又补足了场景上下文,以确保 RoboPocket 不仅能采“可操作性强”的桌面任务,也能为更复杂、更丰富的场景提供额外的视角和场景信息。

图注:第一人称视角

在多臂采集或协作场景下,如何让多个设备的时间戳快速对齐并统一坐标系是关键,同时也是难点。RoboPocket 显著降低了这一环节的门槛。通过 RoboPocket 的快速同步机制,多个手机可共享时间戳与 SLAM 坐标系,双臂配对也变得异常简单。

图注:双臂快速同步

4

极佳扩展性:用户交互丰富

除了硬件层面的扩展,iOS 系统的算力与丰富的UI 界面带来更多、更高级的功能交互,使数采员可以用更直观的方式获得指导、控制质量。

除以上质量把控的功能外,RoboPocket 还支持实时回放与自动无线上传,并可通过语音或按键开始采集。

数据认知、模型know-how

以及数据基础设施

硬件只是起点,真正的壁垒在于对什么是有用数据的认知,“模型 know‑how”以及数据管线的构建。

从专业数采场到普通人的日常生活,穹彻智能持续推动行业对数据的理解与方法论升级:

2023年与上交大卢策吾团队共同发布RH20T大规模具身智能数据集:在预设条件下,实现机器人操作数据的系统化、规模化采集;

2025年发布 CoMiner 伴随式数据采集系统:机器人走出采集场,进入真实世界,在开放环境中获取更丰富、更复杂的操作数据;

2026年迈出更关键的一步:把机器人数据采集从特定场所与依赖专业系统,进一步释放到整个社会——让每一个普通人、每一部手机都能成为机器人学习网络中的一个节点,让数据在真实生活中持续产生价值。

在大规模数据采集的背后,是我们用强大的数据基础设施和科学的数据管线,覆盖高效任务设计、大规模数据采集、上传、清洗与质量监控,最终服务于模型训练与评估,并反向指导下一轮数据采集。

图注:穹彻具身工具链

而支撑这些数据持续创造价值的核心,正是穹彻智能深耕已久的模型能力。

在最新公开视频的最后,我们展示了:仅使用 RoboPocket 方案采集的数据,即可训练出支持长程任务、双臂协作、无遥操作、非 replay 的机器人策略,并完成在工业相机和机器人系统上的自主执行。

这一结果表明,来自 RoboPocket 这种“装进每个人口袋”的数采方式,能够跨越采集终端与部署平台的差异,稳定迁移到工业级感知与执行系统中,验证了穹彻智能在数据采集、数据质量管理、模型训练、模型部署等方面的系统性能力。

我们把“数据”变成真正的生产力:从真实世界中稳定获取可用数据资产,驱动模型快速迭代与成本下降,并将模型能力以标准化流程交付至药房、酒店等多元化场景,实现规模化落地。

未来,RoboPocket 将与高精度力控遥操作、CoMiner 伴随式野外采集以及人类操作数据一同,持续完善并夯实穹彻的数据金字塔,支撑具身模型在真实世界中的不断演进。

01490c5d99569026d6280c02865a8737.jpg

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×