作者:梁程敏 出品:高工人形机器人
李一南站在实验室里,注视着机械臂小心翼翼地抓取杯子。这是他的新工作场景——半年前,他还在一家头部自动驾驶公司负责感知算法团队,而如今,他的工作对象从车轮变成了机械臂。
“其实核心问题很相似——都是让机器理解世界,并在复杂环境中作出决策。”李一南说,“只是从道路场景换成了家庭和工厂。”
像李一南这样的跨界者,并非个例。据LinkedIn数据显示,2023—2024年,从自动驾驶领域转向具身智能的人才数量同比增长了78%。
对跨界者而言,这是从熟悉的赛道跃入未知蓝海的挑战,更是一场关于未来的豪赌——他们既可能成为开拓具身智能的先锋,也可能在风口中迷失方向。但正是这种充满不确定性的探索,让这场跨界变得格外引人注目。
自动驾驶三路人马,涌入具身智能
自动驾驶行业的“跨界三路大军”中,一支重要力量来自大厂离职创业的高管人才。
据不完全统计,2023年至今,已有超过30家具身智能初创公司由自动驾驶技术精英创立。
在《扒一扒从「自动驾驶」涌入「具身智能」的大佬们》一文中,高工详细盘点了包括陈亦伦、张力、余轶南、王刚、陈俊波在内的数十位跨界先锋。他们将自动驾驶领域积累的感知与决策技术,迁移并应用于机器人研发。
除了自动驾驶领域的精英,整车制造企业也在全面入场。
截至目前,全球已有20多家知名车企宣布进军人形机器人赛道,其中中国车企数量达到13家。利用其在自动驾驶领域积累的感知技术、决策算法和供应链管理经验,这些企业正在探索具身智能的新商业蓝海。
特斯拉的Optimus人形机器人无疑是这一领域的标杆,其通过将车辆领域的感知和控制技术迁移至机器人研发,为行业树立了范例。
国内车企如小鹏和小米,也紧随其后,宣布加码人形机器人研发。两家公司有着诸多相似点:都具备智驾车企属性、核心初创团队构成相似、最初产品切入方式和落地场景接近。
同时,两家公司先后宣布其人形机器人将学习特斯拉Optimus的商业落地场景和技术路线,显示出自动驾驶与具身智能的深度融合趋势。
与此同时,自动驾驶产业链上下游企业也在向具身智能领域大举延伸。
以激光雷达企业速腾聚创为例,该公司在2025年年初发布了第二代灵巧手Papert 2.0,并在3月推出了机器人视觉新品类Active Camera AC1。这些产品不仅表明速腾聚创在具身智能领域的技术积累,也反映了其在机器人产业中的先发优势。
根据速腾聚创发布的2024年全年财报数据显示,截至2024年12月31日,该公司已为全球超过2800家机器人及相关产业客户提供产品及服务,并与10余家人形机器人企业建立了深度合作关系,包括宇树科技、人形机器人(上海)有限公司及多家海外知名企业。
另一家典型代表是智驾解决方案提供商地平线。
早在2024年初,地平线将AIoT事业部拆分为子公司“地瓜机器人”,专注提供机器人开发软硬件。
从地平线AIoT事业部到地瓜机器人,不到两年时间,这支团队已经发布旭日3、旭日5等适用于家庭机器人市场的SoC,拿下扫地机、割草机等细分领域的头部客户,出货量累计超500万片,一跃成为赛道头部玩家。
近日,地瓜机器人还推出了业内首款单SoC算控一体化套件——RDK S100。这款产品专门面向具身智能场景,目标是为商业化清洁、低速物流车、四足机器人巡检等碎片化场景提供通用化解决方案。
跨界者,优势几何?
为什么会出现这样大规模的行业人才流动?
这种趋势背后的推动力来自两个方面:一是自动驾驶行业的发展瓶颈,二是两个领域间令人意外的技术相似性。
细心观察,不难发现,这些自动驾驶转向具身智能的人才,离职契机惊人地相似。
他们或多或少都在前司看到了自动驾驶领域的根本性问题:要么是技术难以攻破、关键资源难以获取,要么就是商业模式走不通,企业不得不进行人员和业务调整。
例如,王刚在阿里内部主导L4级自动驾驶的研究,而他离职后,L4自动驾驶的商业闭环至今无人实现。
陈俊波离职后不久,他原本所在的阿里达摩院自动驾驶实验室就被并入菜鸟集团,这种业务调整反映了阿里对自动驾驶前景的重新评估。
高继扬在Waymo和Momenta都任职了2年左右,分别发现了这两家自动驾驶企业的产品失效成本高和没有数据自主权的问题。
Kyle Vogt所在的Cruise,仅2023年一年就亏损了24亿美元。
更严重的是安全事故的冲击。Kyle Vogt离职前一个月,Cruise的自动驾驶汽车在加州造成严重安全事故,导致其加州运营执照被吊销,随后Origin车型停产,随后公司裁员24%。这一连串的挫折不得不让许多技术人开始思考职业方向的调整。
事实上,整个行业都在经历着瓶颈期。多家自动驾驶公司相继进行裁员或业务调整,商业化进程远比预期漫长。技术瓶颈、法规不确定性,再加上融资环境的恶化,让这个曾经炙手可热的风口变得寒意渐浓。近三年来,自动驾驶行业似乎陷入了前所未有的困局。
相比之下,具身智能领域正迎来春天。尤其是大型语言模型(LLM)的突破为机器人注入了更强的理解能力和决策智能,让具身智能的商业化前景变得更加清晰。
资本市场的表现更加直观:2023年具身智能领域融资额同比增长85%,新成立的创业公司数量更是激增93%。这种冰火两重天的现状,促使大量行业精英将目光转向具身智能领域。
自动驾驶与具身智能之间存在显著的技术重合性,这是跨界者能够迅速上手的核心原因。
首先,视觉感知系统是最明显的例子。自动驾驶车辆需要识别道路、车辆、行人和交通标志,而具身机器人需要识别物体、人和环境特征。尽管应用场景不同,但底层算法架构高度相似。
视觉算法专家王伟分享了他的实践经验:“我们在自动驾驶中使用的深度学习模型,经过适当调整就能用于机器人的物体识别。神经网络不在乎它看的是马路还是厨房,只要有足够的训练数据。”
同时,决策系统是另一个关键重合点。自动驾驶车辆需要在动态环境中规划路径并作出决策,这与具身机器人在复杂环境中导航和操作物体的挑战惊人相似。
“在自动驾驶中,大家开发的决策系统需要处理大量实时信息并作出安全决策。”王伟解释,“这些系统架构和方法在机器人领域同样适用,只是约束条件和优化目标有所不同。”
值得一提的是,安全控制系统的经验也极为宝贵。自动驾驶要求极高的安全性和鲁棒性,这些思想和方法同样适用于需要与人类密切互动的具身智能设备。
例如,为了确保人形机器人在家庭环境中的安全,自动驾驶团队开发的冗余控制和故障诊断系统,成为了重要的借鉴对象。这种从“路面”到“桌面”的技术迁移,不仅在理论上具有可行性,在实践中也已经展现出一定价值。
除了技术的可迁移性,供应链也存在一定的可迁移性。
据一家具身智能公司CEO吴奇介绍,他此前在某自动驾驶芯片公司任职期间,与某主机厂建立了重要的客户合作关系,双方在自动驾驶领域进行了深入合作。随着时机成熟,这种既有的供应链合作关系有望自然延伸至机器人应用领域。未来该主机厂可在生产工厂中部署相关机器人产品,承担流水线物料搬运、设备维护、质量检测等多项生产任务。
从“四个轮子”到“两条腿”的现实挑战
尽管跨界者们站在风口上,前景看似光明,但并非所有人都看好这场跨界潮流。
前华为智能汽车解决方案BU负责人苏菁曾直言:“自动驾驶都搞不定,有什么资格做机器人?”在他看来,自动驾驶本身就是一个复杂的物理机器人,其工作环境处于半规则和半非规则之间。如果连这样的场景都无法攻克,转向更为复杂的非结构化场景,挑战无疑更大。
类似的质疑也来自金沙江创投管理合伙人朱啸虎,他毫不留情地泼了冷水:“我们天使基金过去几年投过一些具身智能的早期项目,但最近几个月都在退出……我问这些CEO,你们的商业化客户到底是谁?他们说的全是自己假想的客户。谁会花十几万买一个机器人去干这些活?”
从自动驾驶转向具身智能,尽管带来了一些技术上的优势,但也伴随着诸多挑战。其中最显著的问题之一便是场景适配。
自动驾驶技术主要应用于开放道路环境,而具身智能则需要应对更加复杂且多变的场景,比如室内的精密操作。这种场景差异直接影响了硬件和软件的需求,同时对团队构成提出了全新的要求。
在硬件方面,自动驾驶更注重长距离感知,比如摄像头和雷达需要探测到150米远的物体;而具身智能更强调近距离的多自由度操作。
吴奇指出:“自动驾驶的自由度较低,通常只需处理转向、加速和刹车这些简单动作,而机器人需要应对十几个甚至几十个自由度的问题。这要求硬件设计更精密,在有限空间内实现紧凑和高效。”这意味着,具身智能的硬件设计复杂性远高于自动驾驶。
在软件方面,两者的差异同样显著。自动驾驶对低延迟要求极高,因为车辆必须迅速反应以保障行驶安全;而具身智能则更关注复杂的运动控制算法,以实现精准、灵活的操作。
“自动驾驶关注的是毫秒级的响应速度,而具身智能需要的是更复杂的运控能力。”吴奇补充道,这种复杂任务需要更强大的计算能力来处理多自由度的操作,而不仅仅是单一方向的控制。
此外,这些硬件和软件的差异还体现在对团队构成和人才需求的影响上。
例如,在自动驾驶领域,由于汽车的外观和内部结构相对固定,结构工程师的重要性较低,更多的任务集中在优化摄像头和雷达等组件的位置。而在具身智能领域,结构工程师的作用则变得至关重要,他们需要设计精巧的结构,让机器人既能灵活移动,又能保持体积小巧。
电气工程师的需求也有所不同。自动驾驶的整车电气系统非常复杂,包括座椅加热、动力单元和娱乐系统等,涉及数千个零部件;而具身智能的电气设计则更聚焦于供电、稳定性和低功耗,通常仅需管理几百个零部件。
总的来说,具身智能对机械结构工程师要求更高,对电气工程师的要求相对宽松;而自动驾驶则正好相反。
“我在智驾供应商工作期间,几乎不用对接机械结构工程师。现在做机器人,几乎每天都要和他们打交道。”吴奇笑说道。
机器人还在自动驾驶“L1.5”阶段
技术的难题和差异只是挑战的一部分,更大的考验在于商业化落地。当跨界者们带着技术积累和创新思路,怀着满腔热忱投身具身智能领域时,他们很快发现,真正实现商业化量产还有很长的路要走。
虽然具身智能的应用场景看似丰富,但目前真正能够规模化落地的场景却寥寥无几。
香港大学助理教授、OpenDriveLab负责人李弘扬在《深蓝AI》的直播中分享了他的观点:“现在的机器人行业,可能还停留在自动驾驶L1.5阶段。”
他进一步解释说,从大的层面来看,自动驾驶行业已经形成了从L1到L5的成熟分级标准,其中L3是一个重要分水岭,涉及事故后的责任主体划分。当前,自动驾驶技术大致徘徊在L3到L4之间,如果能解决剩余的20%技术难题,便可迈入L4或L5阶段。
而在具身智能领域,如果参照类似的标准进行划分,L1表示机器人具备初步展现能力;L2是掌握某一类任务;L3则是限定场景下的能力;L4是通用泛化能力;L5则是具备自我反思和智能推理能力。按此标准,机器人行业目前可能仅处于L1.5阶段。
李弘扬还认为,机器人行业的发展周期可能比自动驾驶更长。
首先,自动驾驶的发展已经进入深水区,市场和应用场景相对成熟。即使大众不是行业专家,也能看到街道上越来越多的智能汽车。而机器人行业,目前尚未形成明确的商业模式。
“人形机器人的价格依然高昂,动辄十几万甚至几十万,普通家庭根本无法负担。即使价格降到三五万,对于大多数消费者来说依然难以接受。”李弘扬补充道。
其次,机器人领域的研究仍处于早期阶段。当前,许多大学和研究机构对机器人研究还是停留在感知层面,类似于自动驾驶早期的感知研究。而机器人要真正实现落地应用,还需要在复杂环境中完成操作,这涉及控制、规划和决策等多个维度,技术难度远高于自动驾驶。
再次,机器人应用场景的通用性较弱。尽管机器人可以应用于多个场景,但这些场景大多相对局限,比如室内清洁或特定任务操作。相比之下,自动驾驶的场景尺度变化更大,通用性更强。
最后,从市场角度看,机器人行业远未成熟。许多机器人项目更像是技术展示,而非真正的产品。即使有少量产品进入市场,也难以实现大规模推广。而自动驾驶技术已在工业界得到广泛应用,市场接受度更高。
“未来5到10年内,能够形成成熟商业模式的机器人产品,已经算是非常不错的进展了。”李弘扬说道。“我们需要保持冷静,不要被短期的热潮所迷惑。机器人走入千家万户,还需要很长时间。”
远望资本投资人程浩也表达了类似的想法。他提到:“一个不可忽视的现实是,通用机器人商业化的确比想象中复杂得多,甚至比自动驾驶还要复杂得多。我个人判断,C端机器人真正普及至少需要5年,甚至更久。”
面对这些挑战,许多跨界者逐渐意识到,具身智能的商业化落地是一场坚持“慢工出细活”的长期主义之战。从技术研发到市场推广,每一步都需要深耕与耐心。
因此,一些跨界者开始调整战略,将短期目标聚焦于更容易落地的细分场景。例如,清洁机器人、仓储物流机器人和巡检机器人等垂直领域,成为许多企业优先探索的方向。这些场景虽然看似“小众”,但却有明确的客户需求和稳定的商业模式,能够为公司提供现金流,同时积累技术和经验。
急不来的造人梦
毫无疑问,具身智能是一个充满潜力但尚未成熟的领域,跨界者的涌入为行业注入了更多的可能性,但最终决定成败的,仍是时间与耐力。
当ChatGPT等大语言模型展现出惊人的对话能力时,人们开始幻想AI即将拥有真实的物理形态,在现实世界中行走、操作、服务。
这或许正是具身智能如此吸引人的原因——它承诺给AI一个“身体”。
但现实远比想象复杂。
还记得2016年波士顿动力的Atlas机器人在雪地中行走的视频吗?那个看似笨拙却顽强的身影,让全世界都相信机器人时代即将到来。九年过去了,Atlas依然在实验室里,而不是在我们的家庭中。
2023年12月,当Cruise的自动驾驶汽车在旧金山撞伤行人后被迫全面停运时,硅谷的工程师们突然意识到:连在规则相对明确的道路上行驶都如此困难,让机器人在千变万化的家庭环境中自如活动,岂不是更加天方夜谭?
这就是跨界者们面临的核心悖论:他们逃离了一个尚未解决的技术难题,却投身到了一个可能更加复杂的挑战中。
2024年10月,特斯拉在“We, Robot”发布会上重磅推出了Optimus机器人,其调酒、与人互动等功能一时成为焦点。然而,媒体随后揭露,这些看似“自主”的操作实际上部分依赖于人类远程操控。大众逐渐清醒地意识到,即便是硅谷最顶尖的工程师,要让机器人真正实现完全“智能”,依然任重道远。
这些事件背后反映的是一个残酷的现实:无论是自动驾驶还是具身智能,我们都严重低估了让机器理解真实世界的复杂性。
道路是人类设计的,有规则可循,有标准可依;但真实的生活场景是混沌的,充满了意外、变化和无法预测的人类行为。从结构化的道路环境到非结构化的日常生活,这不仅仅是技术难度的跨越,更是对人工智能根本能力的终极考验。
毕竟,无论是“四个轮子”还是“两条腿”,无论是让汽车学会思考还是让机器人学会行走,背后都指向同一个终极目标:让机器真正理解并服务于人类世界。
在这个意义上,所有的跨界都只是手段,而非目的。真正的胜者,将是那些能够穿越技术周期,在喧嚣与沉寂之间保持初心的人。
他们会明白,“造人”确实急不来,而造就真正有价值的技术创新,更急不来。
(应受访者要求,文中李一南,王伟,吴奇为匿名)