具身智能新赛道?智元、天工、睿尔曼重构数据引擎!
统计 阅读时间大约5分钟(1918字)

2025-08-18 具身智能新赛道?智元、天工、睿尔曼重构数据引擎!

来源:智元
翻越这座 “成本高山”,是具身智能行业实现突破的必由之路。

作者:余柯   出品:机器人产业应用

特斯拉为使其具身智能机器人胜任工厂工作,需花费至少5亿美元采集数据。数据标注成本因类型和复杂性而异,每标签/对象可能需要0.03至3美元以上,或每小时6至30美元以上,大型项目的数据准备成本可能高达100万美元以上。高昂的数据采集成本已成为制约行业发展的关键痛点,翻越这座 “成本高山”,是具身智能行业实现突破的必由之路。

核心要点

• 具身智能数据特点与行业痛点

• 代表性企业的实践和模式

• 人形机器人未来展望

00

前言

具身智能市场增长强劲,训练前沿AI模型的成本自2016年起每年增长2.4倍,AI加速器芯片和人员成本最高达数千万美元,数据获取和管理成本在数千到数百万美元之间。具身智能数据因多模态、高动态、场景泛化性要求高、采集成本高且稀缺,价值评估和定价更复杂。本文通过分析智元、天工、睿尔曼的数据采集布局,探讨数据工厂前景与商业化路线。

01

具身智能数据工厂:

实践、价值与商业图景

1.1

智元机器人:

构建大规模真实世界数据“训练营”

智元在上海启用4000平方米数据采集工厂,即“机器人学校”,每天100台机器人训练产生数万条数据,采用“仿真+互联网+真机场景”三维度预训练策略,结合真实场景数据反馈持续优化,以应对真实数据成本高和仿真数据泛化能力不足的问题。

核心数据:具身智能模型训练所需的多模态数据,包括机械臂和灵巧手的运动轨迹、力度、精细操作数据,及视觉数据、任务反馈数据、环境感知数据,可解决包裹变形处理等“柔性问题”,是具身大模型运行的关键。

商业模式:围绕机器人销售和“机器人即服务”(RaaS),不直接出售原始数据,通过赋能产品和服务变现,基于解决“柔性问题”的价值定价。已中标中国移动订单,计划拓展至酒店、银行等场景,下半年将有密集交付。RaaS模式降低客户初始投入,数据工厂持续为服务优化提供支持。

ecfcd05325c011cd2dc6671b2d39c40f.png

1.2

天工:

开放的数据生态与数据流通

“天工计划”构建全球全行业免费使用的生命周期评价(LCA)数据库,核心理念为开放共享、消除数据壁垒、实现数据平权、建立集体信任、促进国际合作,通过公共数据基础设施“育市”,提升自身数据标准(ILCD格式)和质量控制流程的权威性。

核心数据:由领域内科研人员采集,经专家审查和AI技术质量控制,过程全存档可查,基于ILCD格式提供数据,兼容不同LCA软件,社区持续整合新数据、优化质量。天工数据库涵盖中国55个行业、4000多组单元过程的70000多条公开数据,是全球第三大、最大的公开免费数据库,可推动碳足迹国际衔接与互认,AI提升数据构建效率。

商业模式:开放、开源、共享、透明、免费使用,不直接销售数据,通过提升行业效率、建立数据信任、强化自身标准权威性实现间接价值(如相关服务、咨询),其数据采集、审核等实践对具身智能数据领域有借鉴意义。

1.3

睿尔曼智能:

硬件赋能下的3D具身数据共创

睿尔曼与智境云创围绕3D具身数据集的采集、优化及应用展开合作。智境云创引入睿尔曼轻量化双臂机器人,融合运动学与控制算法,借助机械臂高精度、高灵活性捕捉复杂环境下的高精度3D数据;运用光场扫描技术和动捕棚采集动态数据,融合机械臂与传感器,通过控制脚本和算法实现自动化采集,提升精度和效率;依托虚拟仿真平台,基于模仿学习数据开展泛化训练,增强机器人泛化能力与环境适应性,把控数据质量,模仿学习可零代码部署,提高学习效率与数据利用率。

核心数据:高质量3D具身数据集和多模态数据,是具身大模型运行的关键,兼具重要性与稀缺性。其轻量化仿人机械臂满足泛化场景数据收集对高动态响应、高负载、低成本、小体积末端执行器的需求,仿人优势显著。

商业模式:通过销售轻量化仿人机械臂,与智境云创等合作构建和应用数据集,形成产业生态,产品应用于新零售、医疗健康等多领域(场景本身为数据生成和验证渠道),夹爪技术方案开源。机械臂有明确售价(如人形机器人双臂集成价格不到2万元),数据不直接销售,通过硬件赋能数据采集服务或合作开发高级解决方案延伸数据价值链。

02

数据采集厂的共性与差异

共性

AI核心驱动:均聚焦于为AI模型提供高质量数据养料,尤其是具身智能和通用大模型所需的多模态数据。

技术密集型:数据采集过程高度专业化,涉及物理实体与先进传感、算法、仿真技术的深度结合。

数据量与价值:均致力于产生庞大且持续增长的数据量,这些数据具有高稀缺性和高价值潜力。

差异

数据类型与应用侧重:智元侧重人形机器人操作行为数据;天工侧重环境生命周期评估(LCA)数据;睿尔曼侧重3D具身数据集。

商业模式与开放策略:智元和睿尔曼的数据更偏向于支持自身产品或特定商业合作;天工则以开放共享为核心。

03

结语

智元、天工、睿尔曼展现了中国在具身智能数据领域的探索:智元通过大规模数据工厂解决“柔性问题”,探索RaaS模式;天工以开放LCA数据库为范本,为数据流通标准化和生态构建提供启示;睿尔曼通过合作将硬件优势转化为3D数据采集竞争力,利用模仿学习和仿真应对数据稀缺。

行业面临数据获取与标注成本高、质量与标准化不足、隐私安全与合规复杂、定价与市场成熟度欠缺等挑战,需全行业努力:创新混合数据采集与合成数据技术降本;健全标准和质量体系提升互操作性;发展隐私计算、完善脱敏机制,参与国际治理;探索多元商业模式与定价策略,培育开放生态。总而言之,具身智能破局而出需要全行业的共同努力!

91d9ae610d7ce6abda6278caeb5aec3.jpg

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×