编程集成开发环境(IDE)开发商JetBrains为应对评估AI辅助工具在现实世界中效率提升的挑战,决定开发Developer Productivity AI Arena(DPAI Arena),并将其贡献给Linux Foundation。DPAI Arena是业界首个开放、多语言、多框架和多工作流的基准测试平台,旨在衡量AI编码智能体在现实软件工程任务中的表现。当前,基准测试面临数据集过时、技术范围有限等问题,业界缺乏中立且基于标准的框架。DPAI Arena为AI辅助软件开发带来了可衡量的工作效率,其首个基准Spring Benchmark提供了技术标准。JetBrains计划通过Spring AI Bench扩展Java基准测试,并希望Linux Foundation成立技术指导委员会,以确定平台的未来发展方向。
