文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher

6 小时前

过去两年，图像生成模型多采用“直接出图”模式，但传统文生图模型在处理涉及真实世界知识的任务时，常因缺乏面向真实世界的Agent能力而表现不佳。为此，研究团队推出了Gen-Searcher，首次尝试为图像生成任务训练具备“深度搜索”能力的智能体，使模型能够像Agent一样进行搜索和推理。研究团队构造了生成数据，并提出了KnowGen基准。Gen-Searcher的核心在于将信息获取过程转化为可训练的Agent，配备三类工具，分两阶段进行训练，并引入了双奖励反馈机制。实验结果表明，Gen-Searcher显著提升了图像生成的准确性和质量，展示了Agentic生成在知识密集型图像生成任务中的巨大潜力，为构建一体化生成系统提供了新路径，标志着生成系统向Agentic时代迈出了重要一步。

上一篇：微信支付已支持 AI 原生接入，推出打包 Skill

下一篇：中国Token为什么量大又便宜？1年发电量2倍于美国、5倍于印度

返回列表

热文阅读

2 天前

百度做出“龙虾”全家桶，没多少人“吃饭”是最大困境

2 天前

美拟禁止向中国出口DUV光刻机：禁止中芯国际、长江长鑫等使用

2 天前

极氪 8X 官宣 4 月 17 日发布上市，预售价 37.68 万元起

2 天前

Claude爆火研究漏引华人团队成果，已挨打立正道歉