前阿里千问技术负责人林俊旸离职后发文称,AI大模型发展路线正从“推理型思考”转向“智能体思考”。第一波推理模型浪潮标志着行业进入扩大强化学习后训练规模的新阶段,数学与代码等领域成为优化模型正确性的关键。他分析了“融合思考与指令模式”的落地难题,千问团队曾尝试融合但遭遇冲突,随后推出分离变体,而Anthropic和DeepSeek等公司仍在探索混合架构。他预测,单纯延长模型内部推理轨迹的时代即将过去,未来将由智能体思考主导。智能体强化学习将改变技术栈要求,防范奖励作弊成为挑战,行业护城河将转向系统工程能力。
