中国信通院发布 AI Infra 运维领域首个评测基准
1 小时前

中国信通院发布了AISHPerf人工智能软硬件基准体系3.0版,该版本包含AI Infra领域的两个核心评测基准:AISHPerf-智算运维智能体评测基准和AISHPerf-算子生成智能体评测基准,技术支持由无问芯穹及清华大学团队提供。其中,智算运维智能体评测基准是首个针对AI Infra运维智能体的评测基准,它基于近百亿条真实运维数据,提炼出103条典型评测用例,构建了一个立体化的评测体系,该体系覆盖5大技术栈、44种问题现象、22个细分故障领域、3种难度层级,并涉及6种国内外芯片(包括5种国产芯片)。这一基准旨在评估智能体在真实生产环境中解决实际问题的能力,填补了国产智算运维智能体评测的空白,为国产算力集群从“能用”到“好用”提供了标准基础,推动AI基础设施向自主自治的“Token工厂”升级。而算子生成智能体评测基准则专注于生成算子在真实量化推理部署中的工程可部署性。两者共同为智算产业的标准化升级和高质量发展提供了统一的能力参照框架。