阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
1 天前

阿里巴巴千问团队推出了专为编码代理和本地开发设计的开放权重语言模型——Qwen3-Coder-Next。该模型基于Qwen3-Next-80B-A3B-Base构建,采用了全新的架构,并通过特定训练方式,在降低推理成本的同时,获得了强大的编程和智能体能力。Qwen3-Coder-Next特别聚焦于扩展智能体训练信号,在多个编程智能体基准测试中表现优异,能够在效率与性能之间取得更优的平衡。尽管该模型展现出良好的应用前景,但仍存在进一步改进的空间。未来,团队计划提升其推理与决策能力,支持更多类型的任务,并实现快速迭代更新。该模型的开源地址分别位于ModelScope(https://www.modelscope.cn/collections/Qwen/Qwen3-Coder-Next)和Hugging Face(https://huggingface.co/collections/Qwen/qwen3-coder-next)。