库萨机器人:在街道跑出能感知、会思考的城市具身智能
统计 阅读时间大约10分钟(3882字)

7小时前 库萨机器人:在街道跑出能感知、会思考的城市具身智能

来源:豆包
从背诵规则到理解世界

作者:阿茹娜     编辑:吕鑫燚     出品:具身研习社

具身智能的本质是什么?

我们不急着回答问题,先来试想生活中最常见的画面:在一个普通的傍晚,园区步道上几位学生在周围跑动,地上有一个敞开的书包,书包旁散落着草稿纸。

这时,一个负责清洁的具身智能产品看到上述景象,该如何规划作业?

库萨的机器人看到上述景象时,选择绕开这堆“障碍物”继续向前。

次日清晨。还是同一片区域,书包和孩子的身影早已消失,只剩纸张静静留在原地,库萨机器人再次到达,这一次,它开始执行清洁任务。

同一张纸,相隔几小时,迎来了两种完全不同的命运。

在大众的认知里,无人清扫的核心竞争力是扫得干不干净、吸力多大、续航多久、覆盖率多高。但在城市具身智能中,真正的课题不单只是“怎么扫”,还有“扫不扫”。

什么是垃圾,什么不是?

掉在路中央的矿泉水瓶是,放在长椅上的半瓶水不是;散落在路面的落叶是,堆在树坑边待清运的落叶堆不是;隔夜遗落的传单是,路人刚失手掉落的身份证不是。这些人类凭借生活常识一秒钟就能做出的判断,曾是无人清扫车永远也写不完的规则清单。

过去十余年,行业的通用解法是“背诵”。工程师把真实场景拆解成无数条指令:遇到书包不扫、遇到行人减速绕行、遇到路沿贴边作业,代码越写越厚,规则越堆越细。但城市作为开放系统,变量永远跑在规则前面,一场突如其来的雨、一阵吹乱杂物的风、一个路人随手放在路边的快递袋,都可能让整套精密的逻辑全面失效。

这也是传统以自动驾驶为核心的清扫机器人面对的天花板,感知与动作是割裂的,机器能识别像素里的物体,精准执行预设指令,却理解不了物理世界的因果与关联。它更像一个死记硬背的应试者,刷过的题库能拿满分,但凡遇到题库外的新题,就只能手足无措。

不仅如此,自动驾驶模式只需要在平整路面做平面移动,路况与任务场景相对简单,而城市服务机器人需要在高度动态的三维空间里完成清洁、巡检等任务,多维度的空间环境会产生海量杂糅的环境信息,技术与操作复杂度直接高出一个层级。

这些困境正是库萨亮剑的切口,它用自研全模态具身模型Kusa Omni-CTS,以及自研操作系统Kusa OS勾勒出具身智能的终极方向,真正理解物理世界的底层规律。

那张在步道上经历了两次不同命运的草稿纸,正是这场从“背诵规则”到“理解物理”的产业跃迁中,最微小也最有说服力的注脚。

11390c5cdf19cb078ef0a5b507a74143.png

“机器人真正实现应用落地的关键,在于能否适应开放、复杂的城市场景,并实现规模化盈利。”

这是库萨CEO杨希以落地为导向给出的规划,也是库萨的基因。

具体而言,城市场景有三大特点。首先,城市环境是一个具有极高“一致性”特点的场域,解决方案并不是为某个单独城市服务的,而是所有城市。这便意味着,入局企业的商业上限极高,且不会陷入“部署成本”的魔咒。

其次,城市场景中没有“存量市场”的概念,随着技术的不断提升,解决方案可以逐步响应更复杂的需求。换言之,技术面前只有增量市场。这给入局企业带来极大挑战,也提供了更强的创新动力,让企业能始终保持创新活力,征服更难的任务。

最后也是最重要的一点,就是这片场域,足够难,护城河足够长。

库萨选择以城市场景中具有高频刚需痛点的环卫赛道为切口,该赛道要的不是一辆底部安装清洗工具的自动驾驶小车,而是一整套实时完成“感知-决策-执行”闭环的具身智能解决方案。不仅要根据周围环境、人物动作,来判断面前的障碍物是不是垃圾,还要实时做好清洁轨迹规划。遇到路口还要和行人、车辆进行复杂的博弈,这不是简单的自动驾驶避让逻辑,环卫车离人、车更近,其反应速度也要更快,更零差错。

这里掺杂着太多场景 know how 和模型能力。

因此,库萨选择的是一条以场景定义产品的发展道路,它不只是造出一台会清扫的机器人,更是为整个城市服务机器人赛道,提供一套兼顾智能认知、长期稳定、规模化落地的完整具身智能解决方案。

其中智能认知和长期稳定的关键词是前沿的模型能力,库萨让机器人真正在复杂场景中,依旧能做到“会思考”,真正理解物理世界;规模化落地的关键词则是“车规级标准”。

杨希曾表示,大多数环卫赛道产品以工业级为标准,但工业级并不完全适配开放环境,而车规级能支撑30万公里的稳定运行,这才是城市服务机器人所需要的能力。因此,库萨所有设计、开发流程,均以车规级为重点。这意味着,把民用工业产品里对安全、可靠度要求最严苛的一套制造体系,平移到尚处粗放期、成熟度有限的城市服务机器人身上。以这套近乎苛刻的标尺打磨产品后,多款适配真实城市街景、能够稳定高效作业的清洁机器人得以平稳落地。

时至今日,整套全栈解决方案已落地全国四十余座城市,硬核技术与大规模实景落地相互印证,顺利跑通了可持续增长的商业正向飞轮。

当前,行业在探索技术落地与商业化的平衡过程中,面临着不同维度的挑战。库萨选择的是将具身智能前沿能力落地到真实城市作业中,在持续验证中搭建起可持续运转的商业飞轮,为行业提供了技术价值与商业收益均衡兼顾的可行方案。

63a33ad46f3f8f363395d6a9a7e54860.png

虽然城市场景中的环卫赛道大有可为,但该怎么做,做到什么程度依旧很难有人能回答上来。

传统无人清扫车通常是“自动驾驶底盘+清扫上装”的拼接体,这种产品形态放在真实环境中可以简单用起来,但并不好用。因为城市清洁的需求往往与自动驾驶背道而驰。

不同于自动驾驶避免碰撞的原则,无人清扫车既要贴边作业、主动接触路沿,又要具备区分私人物品与垃圾的智能,传统的纯视觉+规则体系无法完成因果推理,难以满足城市清洁场景的需求。

这也是无人清扫行业从封闭园区迈向开放街道过程中,需要持续突破的核心挑战之一。开放街道的复杂性,从来不是多装几个传感器、多写几条规则就能覆盖的。问题的根,出在多模态融合的底层逻辑上:上一代技术框架里,始终在做“强行对齐”,而真实的物理世界,是连续的。

这是传统解决方案的天花板,Kusa Omni-CTS 想解决的,正是这个问题。

库萨科技自研的全模态具身模型Kusa Omni-CTS试图从最底层的表征方式入手,给这个行业难题交出一份新的答案。

与主要依赖“视觉+语言”不同,Kusa Omni-CTS进一步把机器人的本体感觉也纳入了统一认知体系。除了看见和听懂指令,它还能感知自身运动状态以及所处的空间环境,就像人不仅依靠眼睛判断世界,也会通过身体感知地面的高低、物体的重量和动作的惯性。

这不仅仅是多一个感知模态,而是让机器人更清楚地知道它和环境的关系。

更重要的是,面对开放环境中的不同维度数据,过去往往将异构数据同步成同一节奏,并以严格的方式采集。这种做法的本质是割裂的,且高度依赖硬件性能。

而Kusa Omni-CTS 能够将视觉、雷达、力矩、文本指令等不同维度的数据汇入同一条河流,直接在模型内部即可自动完成对齐与融合,使机器人运动轨迹、交互动作更平滑稳定。

具体来说,模型采用时序注意力模块,实现数据流无缝融合,再结合物理动力学规律约束,在最终输出指令环节,这一技术不仅能实现数据的平滑融合,更能确保指令执行的流畅与可靠。

9c11da0b28b72cd2dec57fc6509e50a2.png

此外,Kusa Omni-CTS 不只是“感知当下”,还能推测接下来会发生什么。

这背后也是由于Kusa Omni-CTS 模型不仅能够理解当前发生了什么,还能够基于物理规律和环境变化,提前在大脑中推测接下来可能发生的种种状况,再选择最合理的执行方式。对于机器人而言,这就像拥有了一种接近人类的“物理直觉”,真正开始理解世界如何运转。

Kusa Omni-CTS融合了更多感知维度,并能将这些维度的数据自动对齐,增加其一致性,帮助模型更好地实行物理推演,让机器人从被动视觉识别到拥有场景常识、主动理解真实世界的质变。

这场从“规则驱动”到“物理理解”的认知跃迁,突破了传统清扫设备的能力边界,使城市服务具身智能的落地更加平稳,为更多类型的城市服务机器人适配复杂开放的城市道路场景提供了智能支撑。

1a17f65483890a2c6c36ad844c42b73a.png

如果说Kusa Omni-CTS 决定了机器人“如何思考”,那么Kusa OS 这套适配具身智能体的专属底层操作系统,则决定了机器人如何稳定、高效地行动,它给机器人装上一套真正适合它的“操作系统”。

一直以来,机器人行业缺少一套更加通用的机器人操作系统,机型、传感器适配成本极高,难以实现规模化落地。开发者大量时间花在底层兼容和系统调试上。

而Kusa OS 的出现有望改变这种局面。

它更像机器人世界里的基础设施,把复杂的底层能力统一封装起来。从传感器接入、算法运行,到资源调度、安全保护,都交给系统自动完成。机器人开发者无需再反复处理底层适配,可以只管专注“让机器人更聪明”这件事本身。

884f8aa9adf00868427fb3abaf6a4347.png

与此同时,Kusa OS 还提供了一套统一的平台能力。

无论是大型道路清扫机器人,还是小型巡检机器人,都可以运行在同一套系统之上,这就好比不同品牌的电脑都能够运行同一套操作系统一样。一套大脑,便能够管理不同形态、不同尺寸的机器人,为城市服务机器人规模化部署提供了统一底座。

稳定性同样是这套系统的重要价值。Kusa OS 并非从零开始,而是脱胎于库萨团队多年在自动驾驶、车规级芯片和机器人领域积累的底层技术,并已经在超过40座城市的真实场景中持续验证。

Kusa OS解决了传感器适配,不同本体开发各自为政、多机型调度难的问题,成为支撑具身智能大规模商业化落地的标准化底层基座。系统当前已落地城市环卫场景,后续还可拓展至各类城市服务赛道,从底层消除重复部署多场景的开发成本,加速城市服务机器人产业规模化、标准化发展。

这套系统的价值不止于“省时间”,更在于给多形态机器人提供了统一的大脑。无论是大型道路清扫机器人,还是小型巡检机器人,都可以运行在同一套OS 之上。一套系统管理不同尺寸、不同功能的本体,从根源上消除了多机型重复开发的成本,为城市服务机器人的批量部署铺平了道路。

可见,Kusa OS 补上了具身智能商业化落地的最后一块底层拼图。它不只是一套服务于库萨自身的系统,更是一套可以支撑整个城市服务赛道的标准化基座。

做到这一切的为什么是库萨?

回到文章开头的问题:具身智能的本质,不是堆砌算法、背诵规则,而是让机器人拥有类人的"思维"——读懂环境中的人、物、时空关系,推演行为逻辑与物理约束,做出恰当决策,实现感知、理解、规划、行动的闭环。

库萨的衡量标准一直很明确:在不可预测的真实世界里,稳定、可靠地把事做完,并沉淀出可规模化复制的方案。

为此,库萨始终深耕复杂开放的城市服务场景,在四十余座城市真实作业中持续积累,跑通"设备落地—场景数据—算法迭代"的正向商业飞轮。

这背后是一套完整的自研能力体系在支撑:Kusa Omni-CTS赋予机器人"物理直觉",使其主动理解物理世界;Kusa OS 统一多机型底层兼容,实现一脑管理多型。从认知智能到底层架构,层层相扣,共同构成库萨具身智能的核心底座。

从背诵规则到理解世界,从实验室到城市开放道路,库萨始终相信:只有扎根真实场景、经得起城市考验的技术,才具备持续进化的生命力。城市服务是一道高难度考题,库萨正在写下自己的答案。

推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×