谷歌 Veo 3.1 视频生成模型发布:新增音频支持、对象添加等功能
12 小时前 / 阅读约2分钟
来源:IT之家
谷歌推出新款视频生成模型Veo 3.1,在音频输出、精细化编辑控制等方面有提升,可生成更逼真视频片段,并允许用户添加或移除视频对象,目前正陆续部署至相关平台。
感谢IT之家网友 软媒用户1053564 的线索投递!

IT之家 10 月 16 日消息,谷歌今日推出了其新款视频生成模型 Veo 3.1,该版本在音频输出、精细化编辑控制以及图像转视频效果方面均有提升。谷歌表示,Veo 3.1 在今年 5 月发布的 Veo 3 基础上进一步优化,能够生成更加逼真的视频片段,并更准确地遵循用户提示词。

谷歌指出,新模型允许用户向视频中添加对象,并使其自然融入原有画面的风格。此外,公司还预告,不久后用户将可在视频编辑工具 Flow 中移除视频中的现有对象。

IT之家注意到,此前 Veo 3 已具备多项编辑功能,例如通过添加参考图像来塑造角色形象、提供首尾帧以生成完整视频片段,以及基于视频末尾几帧内容自动延长视频时长。此次 Veo 3.1 的升级为所有这些功能添加了音频,使生成的视频更加生动鲜活。

目前,谷歌正将 Veo 3.1 模型陆续部署至其视频编辑平台 Flow、Gemini 应用程序,以及 Vertex AI 平台和 Gemini API 接口。谷歌透露,自今年 5 月 Flow 上线以来,用户已在该应用上创作了超过 2.75 亿个视频。