具身智能赛道,愈发热闹了。
传统智能汽车还未完全普及,理想瞄准了具身智能汽车;阿里巴巴发布千问具身智能大模型Qwen-Robot系列,进一步跑马圈地;字节跳动的AI核心部门Seed进行了架构调整,具身智能纳入核心业务……
种种迹象表明,具身智能成为业界的共识。
随着真金白银的不断投入以及重量级玩家的不断入局,具身智能的博弈再上一个台阶,汽车、手机、互联网等领域的巨头正在走向舞台中央。
那么,一场大战在所难免。
物理世界,成为AI新的竞争焦点。
一边,人形机器人表演跳舞、搏斗、武术等项目,赢得满堂喝彩;另外一边,也在试水工业、商超、物流等场景,助力企业降本增效、提质增效、创新增效。
此背景下,具身智能成为AI圈的新战场。
摩根士丹利的数据显示,2026年中国人形机器人销量预计为2.8万台,将同比增长133%,到2035年有望增至260万台。
而罗兰贝格的数据显示,到2035年,汽车主机厂布局的机器人市场规模或达7500亿美元,到2050年或进一步扩展至4万亿美元,规模量级接近汽车产业。
不难看出,具身智能是一个蓝海市场。
更为重要的是,资本市场与产业正在形成合力:当下已有20家左右的具身智能公司明确了上市计划,涉及宇树科技、智元机器人、银河通用等知名企业,试图借助资本市场的力量补上短板。

图源:51智选机器人
IPO之外,融资也进行得如火如荼。
IT桔子的数据显示,2025年7月至2026年6月,国内一级市场(不包含IPO与并购)具身智能领域的融资数量为503起,总融资金额超960亿元。
单单2026年6月3日,星尘智能、千寻智能、星源智这三家具身智能初创公司就分别融资10亿元及以上,赛道的火热肉眼可见。
真金白银下注的背后,则是赛道的竞争格局存在变数。
以宇树科技为例,宇树科技目前拥有262项专利权,其中核心的发明专利仅为20项,这意味着其专利墙与生态壁垒并未成型,后入者还有机会。

图源:企查查
关于此,从荣耀的弯道超车,就可见一斑。
在2026人形机器人半程马拉松上,荣耀机器人力压宇树科技、松延动力等一干热门选手夺冠,成为最大的黑马。
“瑞财经”表示:“手机厂商拥有成熟的供应链体系,能快速整合电机、视觉、运动控制器、散热、电池等核心硬件,这是传统机器人厂商不具备的优势,也是荣耀机器人在比赛中‘后来居上’的主要原因之一。”
与手机一样,汽车的智能硬件与具身智能也有共同之处。
如此一来,传感、决策、执行、数据等可以复用,从而实现技术与产品的延伸,进而可以催生新物种。
具身智能汽车,就是最好的明证。
李想表示:“具身智能汽车应该是‘四位一体’:它是一辆电动汽车、一位职业司机、一台 AI 计算机、一位生活助手,这其中电动汽车和 AI 计算机是‘具身’,职业司机和生活助手是‘智能’。”
未来,鹿死谁手尚不得而知,唯一可以确定的是“卖铲人”受益匪浅。
一方面,提供底座支持。
具身智能模型在训练时,离不开算力的鼎力支持,算力越高越强,效率也会随之提升,进而加快模型的迭代速度。
相较算力,数据则更为棘手。
清华大学人工智能研究院视觉智能研究中心主任邓志东表示:“具身智能落地最主要的挑战之一,在于如何从一维的文本语言模型走向四维时空的世界模型。这需要针对任务和动态驾驶场景让大模型完成更多的训练,而训练则需要更多高质量的预训练与微调数据。但相较于语言模型所需要的文本语料与多模态训练数据,世界模型智能体的训练数据还需要来自真实世界与虚拟世界的行动与交互训练数据,交互数据采集的成本很高、难度更大。”
通俗易懂地说,行业存在“数据荒”,面临数据少、成本高、参差不齐等问题。
此背景下,火山引擎、百度智能云等成为具身智能企业最佳的搭子,为企业提供算力、数据、场景等支撑。
以百度智能云为例,AI Infra技术平台叠加大模型训推加速套件,可以将模型的训练和推理效率分别提升30%和60%。
更为关键的是,推出了具身智能数据超市。
所谓数据超市,即为具身智能企业提供数据托管与展示能力,在不干预数据内容与使用方式的前提下,协助具身智能企业进行合规展示与流量对接,并通过原子标签的标准化定义与复合标签的结构化组合让数据特征一眼可识。
一言以蔽之,具身智能企业可以低成本获得高价值数据。
另外一方面,抢占模型入口。
腾讯、小米、阿里巴巴等则更为青睐具身智能模型,以方便具身智能企业调用,意图抢占具身智能时代的超级入口。
譬如,阿里巴巴发布了Qwen-Robot大模型,包含VLA 操作模型Qwen-RobotManip、VLN移动模Qwen-RobotNav 和世界模型Qwen-RobotWorld三个子模型。

图源:通义实验室
Qwen-RobotManip负责动手,采用一套80维的统一动作表征以及不依赖绝对坐标计算,解决了换机器人、换场景就会导致性能下降的痛点;Qwen-RobotNav负责认路,推出任务自适应观察机制,解决了记少迷路、记多混乱的痛点;Qwen-RobotWorld负责思考,推理出下一个时间点机器人的合理动作与状态,从而在现实世界中精准行动。
再譬如,腾讯发布了HY-Embodied-0.5-X大模型,包括专为端侧部署、强调实时响应的MoT-2B 和参数规模更大、处理更复杂任务的MoE-32B两个版本。
HY-Embodied-0.5-X在空间理解、长程规划、具身交互、风险判断等方面颇有优势,可以让机器人能够更准确地理解环境并完成复杂任务。
需要注意的是,具身智能如若要想走得更远,则不能忽视安全问题。
在2025年GeekCon安全极客大赛上,两名白帽黑客演示了如何远程劫持人形机器人,并指挥其击倒舞台中央的假人。
问题在于,安全并非当下具身智能的焦点。
《具身智能安全技术白皮书:机器人篇》提到:“当前具身智能行业正处于类似于早期智能终端及物联网行业的快速扩张期。厂商的核心竞争焦点普遍集中于算法精度、硬件性能、任务完成度及成本优化。安全防护往往被视为影响用户体验或增加成本的非核心需求。”

图源:《具身智能安全技术白皮书:机器人篇》
总而言之,具身智能赛道火得发紫,成功俘获资本市场与科技巨头的芳心,从而有了更大的盼头,但具身智能还需要在降低成本、提升安全、深入场景等方面苦练基本功,唯有此才可以真正重塑千行百业以及成为大众的生活搭子。
那么,具身智能还需要继续努力。
