2026年1月6日,智元具身研究中心推出SOP(Scalable Online Post-training)在线后训练系统,首次在物理世界VLA后训练中融合在线学习、分布式架构与多任务通才性。该系统采用Actor-Learner异步架构,多机器人并行采集数据并上传云端,动态调整在线/离线数据比例,实现分钟级模型同步更新。实验显示,结合SOP的HG-Dagger方法在商超场景中性能提升33%,叠衣吞吐量提高114%,多任务成功率均达94%以上,四机集群训练速度较单机提升2.4倍,验证了规模化学习的有效性。SOP使机器人在真实部署中持续进化,重塑机器人生命周期。
