腾讯首席AI科学家姚顺雨入职后首发研究成果
13 小时前

腾讯混元官网技术博客近日上线,并发表了腾讯混元团队与复旦大学联合开展的新研究成果。这是姚顺雨加入腾讯担任首席AI科学家后,团队首次发布的研究成果。当前,大语言模型在做题方面表现优异,但在真实场景应用中,它们主要依赖“参数化知识”,这与人类从眼前上下文(Context)中实时学习的能力不同,导致训练范式与实际应用不匹配。为了衡量现有模型与真正的“Context Learner”之间的差距,姚顺雨团队构建了CL-bench基准。该基准涵盖了四种现实世界的上下文学习场景,采用无污染设计,具有高复杂性、序列依赖性,且任务可验证。团队使用CL-bench对十个最先进的语言模型进行了评估,结果显示,这些模型的平均任务解决率仅为17.2%,表现最好的GPT-5.1 (High)也仅达到23.7%。这表明当前的大语言模型几乎无法从上下文中进行有效学习。