4月23日,腾讯混元Hy3 preview语言模型发布并开源。依托全栈自研技术优势,壁仞科技基于vLLM主流开源框架实现Hy3 preview模型的Day0适配及推理验证。Hy3 preview与壁砺™166系列GPU产品的“国模+国芯”联合,将充分释放大模型落地效能,全面赋能多元真实业务场景,为开发者和行业用户带来更高效、更稳定的部署体验。
Hy3 preview的官方介绍
Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。
Hy3 preview可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ等首发上线,微信公众号、和平精英、腾讯新闻等多个主线产品也在陆续上线。另外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub。全栈技术优势实现Day0适配
得益于成熟的BIRENSUPA™软件生态以及软硬协同能力,壁仞科技实现Hy3 preview模型Day0适配,快速贯通推理全链路。一方面,壁仞科技自研底层算子库覆盖全面、框架兼容性优异,可高效支撑Hy3 preview在注意力计算、MoE专家路由、长序列推理等关键链路上快速完成迁移与优化;另一方面,壁仞科技多机多卡推理部署能力出色,可稳定支持Tensor Parallel与Pipeline Parallel等并行方案,保障Hy3 preview在大参数、多卡协同场景下的运行效率。
Hy3 preview基于壁砺™166系列产品完成推理任务
针对Hy3 preview的192 Expert稀疏激活、Shared Expert共享专家、QK Norm注意力机制、GQA以及128K长上下文等核心特性,壁仞科技围绕专家调度、算子融合、KV Cache管理和执行链路开展深度优化,充分释放模型推理性能;通过自动化分析、算子调优和关键路径优化,显著缩短模型适配与性能优化周期,进一步提升Hy3 preview的推理效率与部署可用性。
“Day0 适配”阵营持续扩容
作为国产大模型生态的重要算力支撑,壁仞科技持续扩容“Day0 适配”阵营,领跑国产GPU生态建设。
近期,依托壁砺™166系列产品的高通用性与全自研BIRENSUPA™软件栈的成熟度,壁仞科技已完成腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、OpenMOSS MOVA系列等领先大模型的全面适配,覆盖语言、多模态、AIGC全品类矩阵。未来,壁仞科技将以全栈化能力助力国产SOTA大模型规模化落地,降低开发者的模型部署与应用门槛,全面加速AI应用普惠进程。
