阅读时间大约10分钟以上(4393字)
作者:吕鑫燚 编辑:狄鑫彤 出品:具身研习社
倘若以“第一性原理”的视角审视,你会发现部分具身智能企业有点“偏科”。或多或少会暴露出部分短板,显性的表现为,落地场景不清晰、技术发展略显迟缓、应用能力上限较低。
这并非单一痛点,而是“地基薄弱”的必然结果。
具身智能的“地基”,始终锚定于“在物理世界真实交互”,这也是落地的必要充分条件。这便要求,具身智能产品既要懂得物理世界的内在机理,又要融入世界运行中,和物体、人类高频交互。更直白点来讲就是大脑、末端执行器(灵巧手),要足够“像人”,能思考、能干活。
正如马斯克曾直言灵巧手是机器人核心,特斯拉Optimus灵巧手在接住迎面抛来的网球并放下时,能“像人”一样做到手指弯曲;Figure AI创始人Brett Adcock在2025年10月发布的Figure 03中,也重点展示了灵巧手的技术升级,能拿起光滑的盘子,并稳稳放进狭窄洗碗机中。该灵巧手丝滑操作得益于“大脑”Helix,它能够将视觉与语义信息直接转化为连贯动作,提升机器人手脑协同的工作能力。
国内发展速度较快的选手,也都是提早打好地基的玩家。这一点从2025年,具身智能赛道的大额融资事件中就能看出。资本正加速向“真落地、真应用”的企业倾斜,那些拿到亿元级融资的玩家,无一不是在场景落地中交出了实打实的成绩单。
例如,总融资额破30亿的智元机器人,拥有能完成精细化操作的OmniHand灵巧手,并是最早在VLA领域有所布局的机器人公司之一。近日,创造汽车产业单笔最大融资,完成近10亿元A+轮融资的星动纪元,作为清华大学唯一直接持股的公司,其灵巧手早已成为海外实验室的“标配”,在具身大脑侧星动纪元持续探索“更聪明”的大脑,不仅频频抬高大脑能力,还完成了大脑商业化落地。
可见,能夯实地基的企业才有商业化的可行性,也才是投资人眼中进入下一个时代的船票。
归根结底,底层能力的构建是具身智能企业的核心护城河。唯有夯实这一基础,方能打通技术与商业的转化链路,精准切入场景需求痛点,进而获得资本持续加持,构建良性发展闭环。

打地基要追求极致
具身智能在物理世界真实交互,不是简单的“接触物理世界”,而是能像人类一样理解物理规则、应对环境不确定性、完成有实际价值的实体作业。
支撑这一地基的围绕两大不可分割的核心维度构建:负责感知决策的“大脑”,是通用智能的核心引擎;高精度末端执行器(五指灵巧手)是智能落地的“最后一厘米”,决定了具身智能的落地穿透力。脱离任何一个维度,都会导致整个系统的能力塌陷,比如没有强大的大脑,灵巧手也只是“机械手”;没有高精度的灵巧手,再聪明的大脑也只能“纸上谈兵”。
再通过一个更具象的画面来看,没有更聪明的大脑赋能,灵巧手只能执行最简单的抓取&放置动作,甚至只能根据既定路线来规划运动轨迹。哪怕把抓取的物体稍微换个尺寸,也会导致机器人“宕机”,无法继续执行任务,更别提去完成复杂的长程任务了。
唯有“脑手”突破瓶颈才能夯实地基,真正在物理世界用起来。以星动纪元为例,其灵巧手,在全球首个驱动五指灵巧手的具身模型ERA-42的赋能下,已经能使用百种工具操作。融合世界模型下,可通过观看人类操作视频即可直接学习新技能,显著降低数据成本,快速适应新场景。模型可提前预测动作轨迹,实现长时序任务规划,最长可达2分钟。

图片来源:星动纪元
上述能力得益于星动纪元在大脑侧的深耕,作为全球⾸提分频VLA的具身智能企业,星动纪元早在2024年9⽉,就推出了HiRT快慢分层架构,通过latent向量连接70亿参数。
值得注意的是,一年后Pi0、Figure、Google、NVIDIA相继发布分频VLA,侧面映证了星动纪元在技术路线的前瞻性。
此后,星动纪元开始打磨世界模型,以机器人更能理解物理世界的方式,拓宽操作能力的疆界。2024年12⽉,由星动纪元推出的全球⾸个融合世界模型的具⾝⼤脑面世,其将具⾝智能可⽤数据扩展⾄海量互联⽹视频数据,学到“物理规律”,推动机器⼈执⾏更多精细操作。
此外,星动纪元也是唯一和PI联合研发具身大脑的中国企业,双方10月联合发布可控生成世界模型“Ctrl-World”;PI于日前发布的最新模型π0.6,强化学习部分亦参考星动纪元在这块的学术成果iRe-VLA。

图片来源:星动纪元
星动纪元的大脑并不是活在“demo”中,而是真正在岗位上发挥生产力价值。在物流领域,可完成包裹、药品的分拣及扫码;在制造领域,重点突破 “零部件抓取-⾼精度装配-质量检测”等场景任务;在商业服务领域能完成递送、酒⽔服务、导游导览等。其中,部分场景效率当前达到70%。
正如前文所述,大脑是操作能力的“指挥官”,与一个聪明的大脑匹配的是足够灵活的灵巧手不仅能复现模型能力,也能在真实场景中产生实用价值。值得注意的是,这里指的是五指灵巧手,而非市面上常见的二指夹爪,毕竟人类所有操作,70% 操作靠手部;在生产场景, 95% 的工作依赖手部操作。
星动纪元的灵巧手XHAND1,首创关节全直驱方案,共12个全主动自由度,是10自由度以上唯一和人手大小相当的五指灵巧手,可抓握不同形态物品,真正像人一样使用各种工具;食指能做到15°左右侧摆,复现人手复杂动作,如旋拧瓶盖等。
一个有趣的现象是,星动纪元从始至终一直死磕最难的五指灵巧手,这座压在马斯克身上的工程化难题,劝退诸多玩家选择以“夹爪”过渡的末端执行器,却是星动纪元最有代表性的产品之一。
该决策源于对产业本质的深刻洞察,星动纪元创始人陈建宇曾表示,当任务要求不仅仅是“抓住”,而是需要对物体进行位置调整、翻转、精细操作时,人类手掌的结构优势在机器人上也必须被还原。大量家庭用品、工业工具乃至日常器具本身就是为人手设计的,这意味着夹爪天然不适用,涉及工作操作的“握、按、对准”多工序动作,只有灵巧手能够完成。
从全球首提的分频VLA大脑、首个融合世界模型的具身大脑、和PI联合推进具身大脑研究范式,到死磕到底的高精度五指灵巧手,星动纪元的核心逻辑始终是“极致解决底层问题”。在具身智能赛道,技术没有捷径可走,唯有夯实技术地基,才能真正实现技术落地与商业闭环。

商业化的过渡性和可持续性
具身智能作为长周期、高壁垒的硬核赛道,其商业化绝非“毕其功于一役”的豪赌,而是以“沿途下蛋”为核心的理性渐进式布局。相比执着于技术的极致完美,产业落地的关键在于在迭代中验证价值、在变现中反哺升级。
细化到企业发展来看,商业化的最优解无需等到全部技术完全成熟再推向市场,而是在技术迭代过程中,针对技术成熟度和产业诉求推出适配产品,既能通过真实场景验证技术、回笼资金,又能积累数据反哺技术优化,形成“技术-商业-数据”的正向循环。这条发展脉络是中国具身智能商业化领先,量产规模走在世界前列的最佳实践。
例如,在整机走向市场之前,星动纪元能适配各构型人形机器人的灵巧手XHAND1,已经在国内外实现大规模应用,尤其是备受海外高校实验室青睐。例如,斯坦福大学、哥伦比亚大学、摩根大通AI研究院、卡耐基梅隆大学、英伟达就曾联合借助XHAND1的灵巧操作能力,发布数据采集与策略学习框架,在首尔举办的CoRL 2025中,该框架被提名为最佳论文。
率先实现商业化的灵巧手,为星动纪元后续发展带来的不仅仅是短期账面提振,更是在真实应用场景中不断收获真实反馈,用于后续灵巧手、整机的迭代。更有长尾效应的是,基于灵巧手在各大实验室、奖项中得到的正反馈,也为星动纪元的整机发布夯实了信任基础。
“沿途下蛋”是具身智能商业化的过渡性策略,也是部分技术和市场需求紧密结合后的果实。但从更长远的视角来看,具身智能商业化呼唤的是可持续的商业化发展,这便离不开对技术的极致追求。
行业发展脉络恰能印证社会学核心逻辑,经济基础决定上层建筑,转换到赛道中便是:底层技术基础决定商业化方向。只有先夯实技术底座,商业化才具备生长的土壤,而当技术突破通用化诉求后,落地场景是商业还是工业,不过是水到渠成的自然选择。
星动纪元的星动Q5和星动L7就是最佳佐证,前者是面向商用场景,拥有极致“小蛮腰”丝滑动作的轮式人形机器人;后者是面向物流、工业场景,一米七大尺寸能整活又能干活的双足人形机器人。
具体来看,星动Q5全身44个高自由度,能实现扭腰、握手、摆臂、转头等接近人类肢体的动作。“小蛮腰”设计配合超紧凑底盘,能让重心下移,移动更稳,在狭小作业空间,也能自主通道避障、完成复杂地形穿梭。星动Q5搭载了星动纪元自研VLA具身模型ERA-42、语音引擎、视觉导航等,能做到无惧光影变化和动态人流,在复杂环境中依然执行任务,“拿捏”非结构化场景。

图片来源:星动纪元
星动L7在物流仓储场景中,无论是“单打独斗”还是“群体协作”,都能出色完成任务。以协作执行为例,多台星动L7曾在现场复刻真实物流场景的高效协作模式,一台专注非结构化智能分拣包裹,根据包裹的大小、形状、重量等特征精准抓取分类;另一台专职智能扫码,褶皱、倾斜甚至需要翻面的二维码,也能准确操作识别。

图片来源:星动纪元
正是因为打通了底层技术,才有了这看起来两个毫不相关的产品。
更有趣的是,基于技术支持,星动纪元还玩了点不一样的,以“搭乐高”的方式布局商业化。星动L7支持“全尺寸(L7)+半身形态(M7)”的多形态选配方案,既能以完整双足形态完成复杂运动,也可切换为半身形态聚焦操作场景。
星动纪元商业化的可持续性不单单是整机的推出,而是实打实的订单。2025年,星动纪元商业化订单超过5亿元,已与吉利、雷诺、顺丰、TCL、海尔、联想等企业深度合作。已进入北美、欧洲、日韩等地,海外业务占整体的50%。目前,全球市值前十的科技企业,9家为星动纪元客户。

地基、商业化后
顶层护城河是什么?
在技术体系成型、商业化验证落地后,具身智能赛道的顶层护城河,已跳出“单点硬件销售” 的传统思维,转向“全链路价值交付”的综合服务模式。
它并非简单的硬件+软件拼凑,而是围绕客户真实场景需求,提供系统性解决方案的构建能力,形成“数据-本体-场景数据”的物理AI飞轮,将技术、产品与场景深度绑定,直接回应客户的核心痛点。构建“别人难模仿、抄不走”的竞争壁垒。
这既是软硬一体协同发展的必然结果,更是彻底打破规模化、可复制壁垒,推动产业从“试点尝鲜”走向“批量落地”的路径。
物理AI飞轮不仅需要具身智能企业推动,同样在等待专耕场景的,积累海量真实数据,能听懂场景语言的合作伙伴。星动纪元携手物流合作伙伴共同发布了具身智能物流仓储解决方案,依托于物流场景沉淀的数据资产,以星动L7为核⼼执⾏载体,⾃研端到端VLA具⾝模型ERA-42深度融合客⼾业务系统,构建全流程⽆断点的智能化闭环。也是全球首次端到端VLA具身模型在物流仓储场景真实应用。
具体来看,该方案围绕“下单—出药箱—取药—扫码—出库”的核⼼作业流程,让智能调度贯穿始终,⽅案搭建起物流客⼾业务系统与星动纪元⾃研端到端VLA具⾝模型的双向交互机制:物流客户业务系统向具⾝模型下发精准任务信号,具⾝模型则实时反馈作业进度与状态,形成此⽅案独特的差异化信号闭环,让机器人有实时结果反馈,从而大幅提升成功率。

图片来源:星动纪元
该解决方案直击了两个痛点:其一,物流仓储场景自动化设备中存在非标任务流(扫码等),这部分任务流自动化设备难以完成,导致整体智能化存在断档;其二,物流仓储场景存在明显峰值,电商大促期间峰值较高,仓储急速扩容需要长时间调试落地,不够弹性。
目前,星动纪元的物流仓储解决方案已和国内多家头部物流企业建⽴合作并试点落地;落地案例将代表中国具⾝智能落地实践,在联合国⼯业组织CG峰会进⾏展⽰&受到表彰。
星动纪元还和联想集团旗下联想新视界科技联合推出人形服务机器人智慧展厅解决方案。该方案以星动纪元人形服务机器人星动Q5为载体,以“技术+场景”深度融合为核心,能根据展厅布局定制多条讲解路线,兼容常设展、临时发布会、VIP接待等不同场景,同时通过知识库自动生成功能,可以快速匹配高端制造、教育科研等行业的专业内容需求,展现出极强的适应性。
透过上述两个合作案例可见,具身智能的真实应用落地,既需要企业的底层技术积淀,更需要场景方的真实数据与行业洞察。这种协同模式不仅让解决方案精准击中客户痛点,还持续反哺数据迭代,让竞争壁垒不断深化。
大脑+手夯实地基获得商业化反馈再深化场景合作,这套物理AI飞轮转动后,具身智能不再只解决基础问题,而是不断进化成更“像人”能干活。该飞轮不仅是一家企业的顶层护城河,更是推动具身智能真实交付价值从单点突破走向全行业规模化渗透,真正成为社会所需要的新质生产力。
