腾讯混元开源首个面向世界模型的强化学习后训练框架
11 小时前

2026年3月10日,腾讯混元3D团队宣布开源首个面向世界模型的强化学习后训练框架WorldCompass。该框架专为长时序、交互式世界模型设计,通过引入强化学习机制,精准引导模型遵循用户指令探索世界,并保持长时序视觉一致性。实验表明,WorldCompass显著提升了SOTA开源世界模型WorldPlay的交互准确率和视觉保真度,特别是在复杂组合动作场景下,交互准确率提升近35%。