2025年,尽管DeepSeek全新大模型未如期发布,但团队持续优化DeepSeek V3.X系列大模型,并推出多项新技术。2026年元旦,DeepSeek发表新论文,提出“流形约束超连接”(mHC)框架,旨在解决大规模模型训练中的不稳定性问题,同时保持性能增益。该框架通过数学约束确保训练稳定性,并通过系统优化保证效率。实验表明,mHC在提供显著性能提升的同时,具备更优的可扩展性,且训练时间仅增加6.7%。这一创新为下一代基础模型架构设计提供了新思路,并可能推动全球AI技术的进一步发展。