独家|对话里工 CEO 李卫铳:为数采升维,让数采无阻,补位行业真正稀缺
统计 阅读时间大约10分钟以上(4017字)

3小时前 独家|对话里工 CEO 李卫铳:为数采升维,让数采无阻,补位行业真正稀缺

来源:里工
具身智能落地的稀缺资源。

作者:彭堃方    编辑:吕鑫燚    出品:具身研习社

似乎一夜之间,具身智能赛道里冒出了数十家数据采集设备商。热闹是真的热闹,甚至让人想起当年智能手机产业刚刚起势时,一群嗅觉灵敏、玩家蜂拥而入掀起的山寨潮。

但数采这件事,不是一个“赶风口”的轻松生意。表面上看,大家都在卖设备;更深一层看,行业真正争夺的并不是一副夹爪、一套手套,甚至不是某一种采集形态本身,而是面向模型、本体落地的数据生产能力:谁能把数据采得更全,谁能让采集更经济,谁能真正进入真实场景,沉淀那些过去难以被量化、也最难被替代的操作经验,才是数采潮清洗出来的主线。

这些能力,不是单一硬件能解决的,既需要硬件能力,也需要行业 know-how,更需要对“模型如何走向真实落地”这件事的系统判断。

也正因此,数采不是做减法,而是做加法。这也是里工正在做的事情。

近日,拥有 40 年精密加工制造经验的、全栈式的具身智能本体解决方案商里工(LiGong)发布了 ChiroSync 如意数采套件,一种 Egocentric 多模态数据采集与机器人遥操示教一体化平台。

image.png

图源:里工

如果只把它理解成一款新上市的采集 Ego 数据的设备,显然是低估了这家公司真正想表达的东西。在与具身研习社的对话中,里工 CEO 李卫铳反复强调,里工做的不是一门“卖设备”的生意,而是在尝试回答一个更底层的问题:当具身智能走到今天,行业究竟还缺什么样的数据,又该用什么方式,把这些数据更高质量、更低门槛地生产出来。

里工在思考的加法是,能不能把数采这件事做得更高维,但也更无感;能不能不只服务实验室里的演示,而是走进精密制造、生命科学等真实作业现场,去采那些岗位上的真正稀缺、也真正决定具身智能落地上限的“真人”的数据。这些也正是李卫铳坚信的“以人为本”的数采套件一定要做的。

这两年,具身智能行业在数据采集上形成了一种相当鲜明的倾向:大家都在追求更轻、更快、更便宜的采集方式。无论是真机遥操,还是 UMI、第一人称视角、夹爪式采集,本质上都在努力回答同一个问题——怎样用更低的门槛,快速把数据量堆起来。

这个方向当然没有问题,但问题在于,当行业越来越追求“采得快”时,另一件事反而常常被忽略:采得全面、采得好。

李卫铳的判断很明确,很多当下流行的采集方法,本质上都在“丢维度”。比如两指夹爪类工具,它们或许能解决相当多基础任务,但很难拟合出五个手指各自的关节状态、角度乃至触感;而第一人称视角虽然经济,却并不总是决定作业本身的关键变量。在很多真实作业里,人的眼睛并不直接看着手,手却仍在完成操作,视觉只是辅助,真正决定精细动作的,常常是某种由触摸中习得的“手感”。

按照李卫铳的说法,在工业场景乃至整个人类作业场景中,手指、手腕贡献的劳动成果占比极高,可能超过 70%。但如果数据采集从一开始就把最重要的末端细节舍弃掉,那么模型学到的能力天然就是“压缩版”的、低维度的,之后再想往更精细、更复杂的操作场景里走,难度只会更大。

image.png

图源:里工

这也是里工为什么要从“全模态+五指”切入。里工推出的如意数采套件 ChiroSync 可实现视觉、触觉、音频、关节角度、空间位姿五大维度数据的毫秒级同步采集,其中,触觉尤为关键。这套设备的触觉精度最高可达 0.01N,完整还原肌肉记忆中的细微力度变化,补上了具身智能模型训练长期缺失的关键维度。

image.png

图源:里工

过去在精密制造里,人们常说老师傅“摸一下”就知道零件合不合格。这种能力来自大量重复练习形成的肌肉记忆,也来自人手对触感的极细腻感知。但这样的经验长期以来都难以被量化,更谈不上标准化输入模型。对机器人而言,若要真正获得这类能力,触感就不能再停留在“可有可无”的附加项,而必须成为被采集、被标注、被训练的一部分。因为只有当它被量化为可评分、可学习的信号时,机器人才有机会真正进入那些对精度和稳定性要求极高的作业环节。

图源:里工

进一步看,“五指”本身也不只是一个硬件选型问题,而是一个带有终局意味的数据构型问题。过去行业里常有一种说法:现阶段机器人落地,二指已经能覆盖七八成任务,既然两指模型都还没有完全跑通,为什么要急着上五指?李卫铳的回答并不复杂:因为五指数据可以降维到两指、三指使用,但反过来,两指数据却很难自然地升维到五指。也就是说,五指并不只是为“更远的未来”准备,它同样能服务于当下的阶段性落地,只不过它选择的是一种更高维、更有余量的起点。

因此,里工所说的“升维”,并不是没必要的炫技,也不是和行业主流唱反调。恰恰相反,它是在行业普遍追求规模化、经济性的背景下,重新把那个更本质的问题提了出来:模型最终要进入的,一定不是实验室里的演示环境,而是充满细节、误差、手感和经验密度的真实世界。倘若数据本身不具备足够维度,模型的天花板很可能从一开始就被写死了。

如果说“升维”回答的是数据该采成什么样,那么“无阻”回答的则是,数据到底该怎么被更大规模地生产出来。

过去两年,以真机为代表的中心化数据采集模式,的确支撑了具身智能的早期发展。各地建立本体数采中心,购买机器人、搭建场景、雇佣操作员,围绕训练构建一整套高成本基础设施,这曾经是行业的主流路径之一。但随着行业继续往前走,这种模式的弊端也越来越明显:运营成本高、扩展速度慢、数据获取效率低,而且最重要的是,它很难真正实现跨场景、跨本体的泛化。

李卫铳对此的概括很直接:“真机数据属于 0 到 1,但 1 到 99,不能再沿用这条路线”。因为真机数据固然重要,却很难承担“规模化喂养模型”的全部任务。不同本体之间存在结构差异,躯干、臂展、自由度都不相同,真机数据天然存在迁移障碍;而具身模型真正想要的,又不是某一台机器人的有限经验,而是更广泛、更丰富、更贴近人类社会真实操作的知识来源。

图源:里工

在这个意义上,分布式数采之所以成为新的重点,不只是因为它能提高效率,更因为它可能把数据生产这件事,从实验室和训练中心里“释放”出来。

里工所强调的,就是一种更进一步的分布式:不是简单换个地方采,而是尽可能让采集本身变得无感、无阻,嵌入真实作业流程,而不是额外创造一套新的流程。

这也是里工与不少同行在方法论上的差异。按照李卫铳的说法,很多去中心化方案的背后,仍然默认了一种逻辑:找一批人,学会一套新工具,再完成采集任务。这样看似分布式了,但本质上还是把数采变成了一种新增的人力工作,甚至走向“廉价人力堆规模”的路径。里工并不认同这种模式。它更希望把套件交给那些原本就在产线、实验室、真实岗位上工作的人,让他们在不增加学习成本、不改变原有作业习惯的前提下,自然地留下数据。因为真正有价值的数据,往往不来自某种刻意、额外的生产,而来自日常经验的“留痕”。

image.png

图源:里工

这背后其实是一个很重要的认知转向:数采不该只是一个技术动作,它还应该是一种对技能沉淀方式的再设计。那些熟练工人、实验人员、精细操作岗位上的工作人员,他们本身就在持续输出行业里最难复制的经验。如果采集工具足够轻便、足够便宜、足够不侵入,那么这些经验就有机会在不打断作业的情况下,被自然记录下来。数据采集也就不再是一个额外负担,而是融入真实生产过程的一部分。

所以,里工发布的数采套件可以称得上真正的分布式数据采集工具,它的核心表征就是“无阻无感”。

image.png

图源:里工

当然回到最关心的经济性问题上来,它强调的也不只是设备价格低,而是进入门槛低、部署门槛低、使用门槛低。李卫铳提到,市面上一些 UMI 夹爪工具价格已在 9 万到 12 万元不等,而里工如意数采套件采用五指原生的高精度力觉数据捕捉方式,其市场定价却仅约一半。这是因为,里工并不把高毛利硬件本身作为核心目标,它更关心的是如何用极致性价比,把工具铺到更多场景里,把数据真正采上来,再通过后续的数据整理、标注、清洗和与模型对接,形成完整的数据生产能力。

也正因如此,里工把“套件”而不是“硬件”作为自己的表达。它不仅提供采集端,也提供云平台与后续处理服务,既可以对接公有云,也可以进入私有云,为客户完成数据整理、清洗和模型对接。这意味着,很多工业客户并不需要自己从零理解“数据怎么变成模型燃料”,他们只要把最擅长的作业做好,就可以把专业知识沉淀成结构化的数据资产。对行业来说,这是一种比单纯卖设备更深的补位。

今天谈数据,已经很难不谈“热”。

从新一批创业的热情到大额的融资、暴涨的估值,具身赛道正在把“数据”重新推成一个高频词。李卫铳对此的判断也很直接:“2026 年,是数据生产能力被重新定价的一年。而那些做数据处理、数据生产的企业之所以估值上升得快,本质上也说明市场仍处于供不应求状态。说得更直白一点,大家都知道这件事重要,但真正能把它做好、做深、做成壁垒的公司,其实还不多”。

数据赛道虽然拥挤,但拥挤并不等于稀缺被解决。

当前具身数据行业正处在一个很有意思的节点上。一方面,模型训练确实存在大量数据缺口,企业都在试图摆脱真机数据难迁移、难扩展的问题,寻找更普适、更低成本、可以快速做大规模的数据形态;另一方面,行业也越来越意识到,模型通往通用的路并不会一蹴而就,尤其在真正落地前,很多场景里更缺的不是“更多差不多的数据”,而是某些真正贴近现实任务、能够满足特定落地需求的垂直数据。

这恰恰是里工下场的理由。它当然承认数据规模的重要性,也承认多模态、多样性会提升模型能力。但李卫铳认为“与其去争夺那些更容易获取、更容易想象、护城河也更低的生活场景数据,不如扎进自己真正熟悉、真正有产业资源积累的垂直场景里,去做别人不那么容易做、也更难替代的数据”。

image.png

图源:里工

李卫铳给出的两个核心场景非常明确:精密制造,以及生命科学、化学实验相关场景。这类场景中包含了诸如依赖工匠式的触感、精细装配和亚毫米级操作经验,涉及了滴定枪、多孔板等典型五指精细作业,这些都不是结构简单、模态单一的数采设备所能覆盖的任务。

换句话说,里工想做的,不是“最多的数据”(这是在普遍大规模数据放量阶段反共识动作),而是“真正缺的数据”。不是在最容易获得的地方继续内卷,而是在行业最不容易获得的地方补位。这样的数据,既是里工自身的壁垒,也是具身行业真正走向落地所需要的稀缺资源。

从这个角度回看里工坚持的“全模态+五指”,以及它对去中心化、无感采集、低成本进入的强调,就会发现这并不是几项分散的产品特性,而是一套独特的认知论:在需求侧,行业需要更大规模、更高质量、可服务模型与本体泛化的数据;在供给侧,真正有价值的,不是抽象意义上的“任何数据”,而是那些植根于真实行业、真实岗位、真实技能流动中的稀缺数据。里工的价值,正落在这两者的交汇处。

总之,真正决定一家数采企业能走多远的,最终恐怕不是它卖出了多少套设备,而是它有没有能力把那些原本散落在真实世界里的“隐性经验”,转化为可沉淀、可迁移、可训练的数据资产。具身智能走到今天,数据行业竞争的表层看起来像是在比拼硬件形态、采集效率与成本曲线,但更深层的分野,已经转向谁能更早进入那些高门槛、高经验密度的真实场景,谁能把人类长期积累却难以言传的操作能力,第一次系统性地翻译成机器可以学习的语言。

从这个意义上说,当前数采的价值更像是在重建一套新的行业知识提取机制,谁掌握了这种机制,谁就更有可能在下一阶段的具身竞争中,占据真正靠近产业腹地的位置。

9671c9846a27d30d88c1fe6a1d687307.jpg

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×