1月30日,阿里千问宣布DeepPlanning基准正式上线。该基准用于评估Agent在真实复杂场景中的全局规划能力,涵盖多日旅行规划和多商品购物任务,现已在Hugging Face和ModelScope开源。