沐曦股份:联合上海人工智能实验室发布高性能GPU算子生成系统Kernel-Smith
4 小时前

4月3日,沐曦股份与上海人工智能实验室联合发布高性能GPU算子生成系统Kernel-Smith。该系统创新性融合“稳定评估驱动的进化智能体”与“面向进化的后训练范式”,依托书生大模型Intern-S1-Pro进行深度定制化训练,使大模型成为“算子优化大师”。目前,Kernel-Smith自动生成的高性能算子已在实际场景中应用,加速了DeepSeek新架构Engram并合入DLBlas,还落地于主流生产级推理引擎SGLang和LMDeploy,实现了从实验室评估到前沿模型研发与生产级部署的跨越。