IBM发布开源AI智能体CUGA,聚焦企业工作流自动化
12 小时前

据The Register报道,IBM研究人员近日推出通用型企业级AI智能体CUGA(Computer Using Generalist Agent),该智能体通过多智能体协同、API集成与代码生成技术,可自动化执行复杂企业任务。在WebArena基准测试中,CUGA任务完成率达61.7%;在AppWorld基准测试中,其任务完成率为48.2%,两项测试均位居前列。CUGA的架构从最初简单的“计划-执行-观察”模型(任务完成率仅15%)进化为如今能协调多个子智能体、感知网页环境、处理复杂任务的多层级系统。其核心优势在于跨业务场景的通用性——能像资深员工一样理解用户意图、规划任务路径、调用工具并协调多系统协作,同时持续学习适应新挑战。目前,CUGA已在模拟企业场景中通过严苛测试,并凭借“智能采样”“反馈反射”“知识注入”等创新方法不断逼近企业级实用标准。未来,随着准确率提升,CUGA有望成为企业内部的通用调度平台,主动协助完成跨系统数据整合、文档生成、流程管理等复杂工作。