IT之家 6 月 19 日消息,热门 AI 图像生成初创公司 Midjourney 今日宣布推出其首个 AI 视频生成模型 V1,正式进军 AI 视频领域。V1 是一款图像转视频模型,用户可以上传一张图片,或使用 Midjourney 其他模型生成的图像,V1 将基于此生成四段五秒的视频。与 Midjourney 的图像模型类似,V1 目前仅通过 Discord 平台提供,并且初期仅支持网页端使用。
Midjourney 公司表示,其对 AI 视频模型的期望远不止为好莱坞电影制作 B-roll 镜头或为广告行业生成广告视频。在一篇博客文章中,Midjourney 首席执行官 David Holz 表示,AI 视频模型是公司迈向终极目标的下一步 —— 开发能够实现“实时开放世界模拟”的 AI 模型。
在 AI 视频模型之后,Midjourney 计划进一步开发用于生成 3D 渲染的 AI 模型,以及实时 AI 模型。
值得注意的是,Midjourney 的 V1 模型发布仅一周前,该公司就遭到了好莱坞两大知名电影公司迪士尼和环球的起诉。诉讼声称,Midjourney 的 AI 图像模型生成的图像描绘了这些公司的版权角色,例如辛普森一家的霍默・辛普森和星球大战的达斯・维达。
在定价方面,Midjourney 表示,视频生成的收费将是典型图像生成的 8 倍,这意味着用户在创建视频时会比创建图像更快地耗尽每月的生成配额。目前,尝试 V1 的最低成本方式是订阅 Midjourney 每月 10 美元(IT之家注:现汇率约合 71.9 元人民币)的基础套餐。订阅 Midjourney 每月 60 美元(现汇率约合 431 元人民币)的专业套餐和每月 120 美元(现汇率约合 863 元人民币)的超级套餐的用户,在公司的“放松”模式下将享有无限的视频生成服务。在未来一个月内,Midjourney 将重新评估其视频模型的定价策略。
V1 为用户提供了几种自定义设置,以控制视频模型的输出。用户可以选择自动动画设置,让图像随机移动,也可以选择手动设置,通过文本描述他们想要添加到视频中的特定动画。此外,用户还可以通过在设置中选择“低运动”或“高运动”来调整相机和主体的运动量。
尽管 V1 生成的视频目前只有五秒长,但用户可以选择将视频延长四秒,最多可延长四次,这意味着 V1 视频的时长最长可达 21 秒。
与 Midjourney 的 AI 图像模型类似,V1 视频的早期演示看起来具有一种超现实的美感,而非极度逼真。V1 的初步反响是积极的,但目前尚不清楚它与其他已经上市数月甚至数年的领先 AI 视频模型相比表现如何。