消息称商汤科技正研发新图像模型:代号 U1 Pro,内部称对标 OpenAI
2 小时前 / 阅读约2分钟
来源:IT之家
商汤科技正研发多模态大模型“U1 Pro”,面向设计场景,预计7月启动内部测试。该模型支持8K分辨率输出,效果接近或优于GPT-Image 2,设计正成为多模态模型新赛场。

6 月 25 日下午消息,新浪科技独家获悉,商汤科技近期正秘密研发一款多模态大模型,该模型主要面向“设计”场景打造,由商汤科技联合创始人、首席科学家林达华牵头负责,意在对标 OpenAI 旗下 GPT-Image 2,打造一款“会思考”的图像生成模型。

目前,该模型在内部代号为“U1 Pro”,由商汤研究院推进研发,属于商汤日日新模型家族成员。预计今年 7 月该模型将启动内部邀请测试,并向客户提供服务。

据知情人士透露,面对复杂设计需求,该模型能像“会思考的设计师”一样,实现设计、生成、评审的长程循环,且支持 8K 分辨率输出。该知情人士介绍,在大量内部评测中,在相同提示词下,该“U1 Pro”模型生成的图片,与 GPT-Image-2 生成的图片效果高度接近,甚至更具优势。

在 LMSYS Chatbot Arena 的文生图评分中,GPT-Image-2 在文生图质量、文字渲染和指令遵循上大幅领先谷歌旗下 Nano Banana 2,在设计行业引发广泛追捧。业内普遍预测,OpenAI 近期也将发布新的 AI 生图模型,将“设计”作为重点发力方向。

商汤“U1”新模型的流出,也向外界释放了一个信号,在 Anthropic、智谱等顶尖 AI 公司引领的编程之外,“设计”也正成为多模态模型的下一个主要赛场。