2026年2月4日,腾讯混元AI Infra团队正式开源生产级高性能LLM推理核心算子库HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能上,Attention最高提升2.22倍,GroupGEMM最高提升1.88倍,FusedMoE最高提升1.49倍。