凌晨三点,彻底失眠:Seedance 2.0告诉我们,AI对现实世界工作流“压缩”正在加速
7 小时前 / 阅读约6分钟
来源:36kr
Seedance 2.0将视频运镜、剪辑等AI化,预示视频领域GPT-3.5时刻到来。AI正极致压缩工作流,预示“即时软件”时代到来,引发对App生态和公司组织形式的思考,AI对世界的改变正在加速。

凌晨三点,看到影视飓风Tim更新的字节即梦Seedance 2.0视频,我彻底睡不着了。

这是过去一年多来,AI的进步第一次让我感到如此兴奋。或者说,战栗。

很多人都在等视频领域的GPT-3.5时刻,大家觉得那还要两三年。Seedance 2.0告诉我们,它已经近在眼前了。

它的强悍之处,在于它把运镜、分镜、音画匹配,全部AI化了,并且做到很棒。它理解了光影、透视、镜头语言。

Tim在视频里展示的,是控制,是AI对物理世界的完美复刻。

AI的逻辑正在变得清晰而简单,AI正在疯狂压缩我们的工作流:从导演、拍摄到剪辑、配乐;从产品经理、开发到测试、交付。

所有的中间环节都在逐步压缩。

这篇文章,我想聊聊AI正在如何改变工作流、如何重构我们的工作。

01

视频工业的GPT3.5时刻

Tim在视频里那种抑制不住的兴奋,我感同身受。

以前我们认为运镜是物理世界的特权,滑轨、摇臂、无人机、斯坦尼康。这些设备很贵,操作这些设备的人更贵。

Seedance 2.0把这些都变成了参数,视频里演示的图生视频,一张主角的照片+一张场景的照片。

它能让这个主角,在这个场景里,按照你指定的运镜方式动起来,多主体一致性得到了惊人的保持。

推拉摇移,以前需要铺设轨道,需要灯光师配合调整每一秒的光位。

现在这只是Prompt里的一行字,物理世界的物理限制,被数学世界的参数限制取代了。

Seedance 2.0似乎理解了三维空间的一致性。

它知道当镜头左移时,背景物体应该如何产生视差。它知道当光线从右边打来时,影子的长度应该如何变化。

Seedance 2.0开始涉足剪辑,AI能够理解视频的节奏,能识别画面中的情绪高点,能自动匹配音乐的鼓点。

对于剪辑师来说,以前需要耗费几个小时的“粗剪”工作,现在可能只需要几秒钟。

声音也是一样,画面里篮球场,赛场复杂的声音同步出现。

这种感知上的一致性,是人类大脑判断“真实”的重要依据,AI做到了。

影视后期原本是一个极度复杂的系统工程。导演负责构思,摄影师负责将构思转化为光影,剪辑师负责将光影重新组合成叙事,配乐师负责用声音调动情绪。

这是一个极其昂贵、低效、且充满摩擦的线性工作流。Seedance 2.0把这个链条打碎了,它把这些工种全部压缩进了一个模型里。

本质上,AI现在在做的内容就是不断压缩我们的各种工作流。

从Seedance 2.0看到了AI在压缩导演、拍摄、剪辑、配乐这些人员的工作流雏形。

视频领域的GPT-3.5时刻已经到来。

接下来的两三年,将是行业洗牌的时刻,旧的秩序正在崩塌。

02

AI正在极致压缩我们的工作流

视频领域的变革只是AI重塑工作流的一个切面,更深刻的变革,发生在软件领域,发生在我们的手机屏幕上。

最近用阿里通义千问点了一次奶茶,这个体验让我思考了很多。

它可能预示了App时代的终结,或者说,它预示了“即时软件”时代的到来。

我们现在的互联网体验,是被“App”这个形态锁死的。

你想点一杯奶茶,你需要解锁手机,找到外卖App,点击进入,等待开屏广告,点击搜索框,输入“奶茶”,在几十个商家列表中筛选,点击进入商家页面,在几十种商品中选择,选择甜度,冰度,点击下单,支付。

这是一个极其冗长的链路。

为什么我们要经历这个过程?因为App在试图满足所有人的需求,它在找最大公约数,它不得不把低频需求塞进二级页面,它不得不为了商业化加入各种推荐。

对于我来说,我不需要这些,我常点的就是那3家店,我知道哪家的柠檬茶最好喝,知道哪家的后厨最干净。

我只需要:“帮我点一杯我常喝的那家,无糖。”

通义千问现在的能力,正在接近这个理想状态。

你给它一个指令,它在后台通过代码,通过Agent,直接调用接口,完成交付。

这就是“意图界面”,你输出意图,AI交付结果。中间的UI、交互、跳转,全部被压缩了。

当AI的能力从Andrej Karpathy提出的“Vibe Coding”进化到足够强大的Agent,我们的每一个需求都将通过即时生成的“一次性App”来交付。

传统的“产品经理需求文档-开发编写代码-测试找Bug-最终交付”这一长达数周甚至数月的链路,将被AI瞬间压缩至1分钟以内。

这引发了一个根本性的商业追问:既然我可以用1分钟生成一个“App”来满足我当下的需求,那我为什么还要下载一个几百兆的App?

现有的App生态存在着无法克服的结构性矛盾,每个人的需求都是独特的,AI可以通过即时代码将用户的自然语言需求直接转化为交付结果。

这实际上是AI为用户量身定制了一个“专属App”,用完即走,无需留存。

这对于现在的互联网巨头是巨大的挑战,他们的护城河建立在App的装机量上,建立在用户的使用时长上。

如果App消失了,如果入口变成了AI Agent,那他们的流量从哪里来?广告往哪里投?

下一个时代的入口可能逐渐清晰。

为什么所有大厂都在疯狂做大模型,争夺那个唯一的“超级Agent”的答案呼之欲出。

对于很多App这种集合需求形态的产品,是不是在AI时代会转向个性化需求的AI内产品呢?

现在的App开发商,可能会变成“数据API服务商”,随着交付链路的大幅压缩和成本降低,App需求实际变成了API需求。

每一次产品对话,都是自己作为产品经理的一次结果交付。

最终,传统工作流的消失,意味着公司组织的解体

公司这种组织形式,本质上是为了降低交易成本而存在的。因为沟通很贵,信任很贵。所以我们要把人聚在一起,签合同,发工资。

当一个人+AI就能完成以前需要一个团队做的事情,庞大的组织就变得没有必要了,我们会看到越来越多的“一人公司”……

这样看,

我相信,AI对世界的改变,正在加速