2025年9月12日,阿里巴巴通义千问发布下一代基础模型架构Qwen3-Next,并开源Qwen3-Next-80B-A3B系列模型。该模型采用高稀疏度MoE架构,总参数量800亿,但每次推理仅激活30亿参数,实现极高计算效率。相比Qwen3,Qwen3-Next在混合注意力机制、训练优化及多token预测机制上进行了核心改进,下游任务性能更强,训练成本降低不到1/10,长上下文推理吞吐量提升10倍以上。不过,市场有风险,投资需谨慎,本文不构成个人投资建议,用户应考虑自身状况,据此投资责任自负。