和两位CEO聊Sora: 应用层爆发的里程碑事件,创业者的机会来了
5 小时前 / 阅读约27分钟
来源:凤凰网
OpenAI发布Sora 2及配套应用Sora App,引发全球科技圈关注。Sora通过Cameo等功能解决AI+社交难题,开启AI ToC应用时代。

作者|周永亮

编辑|郑玄

99% 的人都搞错了。

「Sora 不是『AI 版抖音』,它更接近『AI 版 ins 或朋友圈』。」这是 Lovart 创始人陈冕,在与极客公园创始人&总裁张鹏、Sand.ai 创始人曹越对话中的核心观点。

就在所有人享受十一假期的第一天,OpenAI 发布了新一代文生视频大模型 Sora 2,以及配套应用 Sora App。一瞬间,全球科技圈被彻底点燃。Sora App 在严格的邀请制下,仍火速冲上美区下载榜第三。

然而,喧嚣之下,争议也随之而来:这会是 AI 时代的 TikTok,一个超级应用的诞生?还是又一个「现象级」的烟火,绚烂一瞬,便迅速冷却?

在与张鹏的对话中,陈冕和曹越给出了清晰的判断。陈冕认为,Sora 是继抖音和 ChatGPT 之后,又一个里程碑式的产品,它真正开启了 AI 的 ToC 应用时代。其核心突破在于,OpenAI 展现了「为产品打造模型,而不是为模型寻找产品」的思路。Sora 通过 Cameo 等功能,巧妙地解决了「AI+社交」的难题,将重点放在熟人关系的「低成本 Remix」共创上,而非单纯追求视频质量。这意味着,定义应用与产品的能力,其重要性正变得与构建模型同样重要。

从技术视角,曹越则表示,Sora 在音画同步、人物 ID 保持和多镜头叙事上的突破,正是为了跨越 C 端消费门槛而做的关键优化。这些优化与产品定义相结合,爆发出了强大的力量。

Sora 的出现,也让两位创始人重新审视 AI 应用的终极方向。他们一致认为,AI 时代最大的机会在于「AI 原生」。

如何定义 AI 原生呢?「你就想,没有 AI,这个业务或内容还存不存在?如果不存在,它就是 AI 原生的。」陈冕解释道。他认为,对于创业者来说,AI 应用的时代才刚刚开始,但不要想着去做 AI 版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。

这场变革也带来了更激烈的竞争。陈冕认为,AI 时代的发展速度远超以往,人才、算力、资本都在向头部集中,导致竞争被前置。这是一个「Go Big or Go Home」的时代:平庸的改良者注定出局。对于创业者来说,这既是最好的时代,也是最卷的时代。

在这场风暴的中心,两位创始人对未来都清晰而坚定。陈冕表示,Lovart 将激进地探索 ToC 的 AI 原生应用。曹越则透露,Sand.ai 将在国庆后推出全新的音画同出模型,直面挑战。

只有那些敢于将顶尖产品创意与模型深度整合、并全身心投入于创造全新体验的玩家,才能最终定义下一个时代。

以下为陈冕、曹越与张鹏对话内容实录,有编辑删减。

01

解构 Sora:

「AI 原生超级 APP」的雏形

张鹏: 看大家兴奋又略带疲惫的样子,想必是熬夜玩 Sora 了。你们是连夜守着发布,还是第二天一早才发现世界变了?先请两位聊聊体验 Sora 的第一感受吧?

陈冕:我是连夜看的,发布会是凌晨 1 点。看完我马上就去弄美区账号,结果被苹果的安全延迟卡了一个小时,急得不行,大概 3 点左右才拿到邀请码。

坦诚讲,我本来期待没那么高,但用完之后我感到非常震撼。我是一个产品经理出身,最近十年里,能让我感到震撼的时刻只有三次:第一次是 2016、17 年玩抖音,第二次是 2022 年底玩 ChatGPT,第三次就是这次的 Sora。

我觉得 ChatGPT 开启了以模型为中心的时代,而 Sora 则开启了一个应用的时代,尤其是一个 ToC 应用的时代,这是里程碑式的。

我从凌晨 3 点玩到早上 7 点,实在扛不住睡了三小时,10 点起来接着玩,然后就开始拉着团队开会。所以到现在我都是亢奋状态,对未来即将发生的事感到非常兴奋。

曹越:我是早上醒来看到各种群里都炸了。我的感受是,从效果上来说,它非常令人兴奋,而且是一个为产品优化得非常完整的模型。但从模型本身的技术视角看,效果虽好,却没那么令人意外。因为包括我们自己在内,过去几个月也一直在探索视频和声音同步生成的能力。现在大家玩的很多梗,我们内部在早期模型上已经玩过一遍了。所以,这种感受更像是我们内部的兴奋点被释放到了外部。

张鹏:从技术角度看,Sora 2 的核心进步在哪里?

曹越:我觉得有三点:第一,当一个视频模型能同时做到画面和声音同出时,它就越过了 C 端消费的临界点。过去一年的视频模型大多只能生成无声的 GIF 式画面。

第二,它能保持人物 ID,也就是 Cameo 功能。这个 ID 同时包含了样貌和音色。之前有些模型能保留长相,但 Sora 能同时锁定样貌和音色,这让它的可消费性和传播性大大增强。

第三点,也是很多人可能没注意到的,它生成的 10 秒视频带有叙事属性。它不再是单一的片段,而是包含了运镜、多镜头切换(我最多看到切了 8 个镜头)和景别设计。这是一种以前没有展现过的能力。

当这三点结合在一起,就爆发出了强大的力量。

张鹏: Sora 的邀请机制很聪明,形成了病毒式传播。陈冕你作为产品经理,抛开技术,单看这个产品,有什么值得圈点的创新吗?

陈冕:这是我第一次看到一个 AI 原生超级 APP 的雏形。

首先,OpenAI 这次想得非常清楚:它在为产品打造模型,而不是为模型找产品。这表明它不只想做一家模型公司,更想做一家消费互联网产品公司,野心昭然若揭。模型可以被快速追赶,但一个成功的产品,其用户和网络效应是很难在一个月内被颠覆的。

其次,它解决了「AI+社交」这个大命题。最大的 ToC 应用就是社交,而 Sora 的 Cameo 功能就是答案。为什么大家都在和 Sam Altman 或者自己的朋友合拍?因为社交的乐趣建立在熟人关系之上,而不是视频质量本身有多高。你朋友圈的照片质量就一定很高吗?不是,但因为是你熟悉的人,所以感觉不一样。这也解释了为什么邀请码机制能如此成功,它天然就适合基于社交关系进行裂变传播。

最后,它用一种极其简单的方式解决了「共创」的问题。AI 降低了创作门槛,而 Sora 的左右滑动交互,本质上就是一种低成本的 Remix。你在别人的视频上进行再创作,这种交互方式简单到了极致——就是滑动和点击,这是顶级移动互联网产品的共性。

所以你能理解我有多兴奋。作为一个产品经理,这些问题我想了一年多,现在有人把答案做出来了,就放在我面前,这太酷了。后来它迅速登上美区 App Store 总榜第三,也验证了它的成功。

02

为产品打造模型,

而不是为模型寻找产品

张鹏: 确实,你刚才提到了一个核心观点:Sora 这个产品形态的成功,是因为它的模型是围绕产品来打造的。这与许多先做模型再找应用的团队形成了鲜明对比。从技术角度看,有哪些明显的迹象能证明这一点?

曹越:我非常同意陈冕的观点。OpenAI 展现出了一种强大的垂直整合能力,即组织内部同时拥有顶尖的模型能力和敏锐的产品洞察力,并且能让产品需求反过来指导模型的迭代方向。

这已经不是第一次了。上一次的典型案例就是 ChatGPT。GPT-3 模型的核心能力早已存在,但 OpenAI 真正的厉害之处在于,他们将这种能力对齐了普通用户的需求,把它打磨成了一个极其易用、易于传播的产品。这种组织能力是非常高级且稀缺的。大多数团队都会陷入「先做模型还是先做产品」的内部矛盾中。

具体到 Sora,一个关键的例子就是音画同步。从纯技术角度看,把声音做好,可能不像把视频或语言做好那么难。但从产品和用户视角看,声音是决定性的。正是因为 Sora 能让音画同步输出,才使得普通用户生成的视频具备了直接的可消费性,越过了 C 端产品普及的临界点。

这种洞察力——关注用户真正想要什么,而不仅仅是技术上什么最难——是一个只会埋头训练模型的基础模型公司可能不具备的。OpenAI 再次证明了,他们不仅有能力打造强大的模型,更有能力将模型与产品完美结合,这正是他们最令人敬畏的地方。

张鹏:OpenAI 在技术和产品之间的切换并非没有代价。去年那场宫斗大戏,现在看来,或许正是为了将重心彻底转向产品侧而经历的必要撕扯。Sora 的出现提示我们,在追赶模型的同时,定义产品的能力也必须跟上。你怎么看呢?

陈冕:这完全说出了我的心里话。我这两天想明白一个关键点:Sam Altman 是一位非研究员出身的 CEO,他是一个顶级的「产品+融资+战略」大师。在过去几年由研究员主导的「模型竞赛」中,让一个纯研究员主导的公司率先做出顶级产品,是很难的。

OpenAI 的成功得益于其独特的组织结构:它既拥有顶尖研究员,又由一位非研究员出身的顶尖产品战略大师领导。同时,它兼具创业公司的高融合度与巨头的雄厚资源。正是这种独特的组合,让 OpenAI 率先做出 Sora 变得顺理成章。

我之所以兴奋,是因为这预示着整个行业的组织方式和话语权将发生变化。定义应用和产品的能力,其重要性正变得与构建模型同样重要。就在大家还在讨论 OpenAI 的模型领先优势是否缩小时,他们已经通过产品开启了下一阶段的竞争。底层模型的竞争格局已相对集中,但 Sora 的出现,就像当年的 ChatGPT 一样,正式拉开了 AI 应用层竞争的序幕。

张鹏:除了刚才总结的那些结构性突破,你觉得 Sora App 在产品层面,有哪些做得特别聪明的地方?

陈冕:我认为 Sora App 的背后一定有产品高人。大家不要觉得一个产品看起来简单,越是简单的产品,背后越见功力。产品经理最难的不是做加法,而是做减法,这需要顶级的判断力。你用 Sora App 会发现,它几乎上手就会用。虽然在工程上还很粗糙,比如会弹出代码报错,甚至没有安卓版,但它的第一版在产品设计上,我认为已经做到了极致。

它的交互就是最简单的上下滑、左右滑。创作流程也极其简练:用 @ 来选择人物(Cameo),然后输入 prompt,整个过程行云流水。它所有的设计都在鼓励你进行社交。能把流程做到如此简单,背后一定是有强大的组织能力和优秀的产品经理在支撑。

第二个关键点,也是它最特别的地方,就是所有设计都紧密围绕「社交」。我为什么说它是「AI 的 Instagram」,你看它的核心功能:

ID 保持是基础。你要社交,总得先让别人认出你的脸,你才能 @ 朋友的脸,两个人才能互动。

音画同步是为了让大家「玩起来」。两个人要对话,要一起表演,就需要音画同步。你看所有双人共创的视频都依赖这个功能。只有在最需要即时性、UGC 和社交性的场景里,才需要把音画同步做得如此简单和极致。

再看它的分镜头控制。它限制视频时长为 9 秒,这完全是朋友圈的逻辑。同时,短视频也需要叙事性,所以它提供了多镜头切换的能力,让一个 9 秒的视频也能有故事感。

它做的所有事都在为「社交」服务。包括它的邀请码策略,一个人只能拉四个,就是为了让你邀请最亲密的朋友,快速建立「熟人关系链」。他们甚至没做营销,这证明从产品、模型到市场,内部已经想得非常清楚,并串成了一条高效的链条。这件事,如果没有高度整合的组织和 CEO 的亲自拍板,是绝对无法实现的。

张鹏:现在假定你是 Sam Altman,能帮我们想象一下 Sora 是怎么做出来的?

曹越:在这里我有一些不太一样的观点。首先,我觉得没必要神化 Sam Altman,他可能只是「许可」了这件事,而非亲自发起。

关键在于,Sora 的诞生更可能是一个「看菜下饭」的过程。当你知道现有模型能实现哪些能力后(比如音画同步、参考 ID 生成,这些对算法人员并非不可预测),再将这些能力与产品场景结合。对我个人而言,认知上最大的迭代是,它把「叙事」也整合进了模型,而不是用传统的产品方式来做,这点非常出色。

但是,要说团队一年前就决定要做社交,我觉得绝不可能。更大几率是,一个出色的产品经理,看着手里已有的「土豆丝」(模型能力),决定炒一盘菜。当你能做参考 ID 生成,但在北美 deepfake 是条红线,你不能随意生成人脸,那么「基于许可」的熟人社交就成了一个自然而然的选择。

所以,整个过程更像是组织内部紧密耦合、上下文对齐得很好,而不是产品提需求、模型再排优先级的传统流程。

张鹏: 所以你觉得这更像是一个归纳而非演绎的过程?把所有可用的「菜」搁在一起,然后推导出到底能炒出什么?

曹越:是的,从我的视角看,这个过程可能没那么神奇,但的确不容易。它需要大家做一些 mindset(思维模式)的切换。作为一个做模型的团队,我知道应该跟产品经理做更深度的交流,可以往某个方向去优化。但产品同学也需要去理解模型到底是怎么回事。

所以我觉得它更多是这样迭代出来的,而找到那个 fit 是关键。一旦找到这个 fit,如果他们的团队本身在产品侧就比较成熟,那么执行起来是能做到的。但最难的是最开始的那个认知:我们能做什么?在哪个地方是真正 fit 的?这个是关键。

03

超越技术:AI 时代的组织护城河

张鹏: 我们来聊聊视频生成的技术。很多人并非技术出身,但很想了解视频生成技术在过去几年经历了哪些关键阶段的变化?

曹越:我来梳理一下视频生成的几个关键里程碑。

第一个关键里程碑是今年 2 月 OpenAI 发布的 Sora,它是一个巨大的认知突破,用「扩散模型+Transformer」的结构证明了 AI 可以生成高质量的单镜头素材。

紧接着,上半年以 Veo 等模型为代表的音画同步技术,让 AI 生成的人物表现力大增,跨越了「恐怖谷」,使其能进入主叙事链路。

差不多在同一时期,还有另一条关键技术路线——自回归模型(如 MAGI-1 和 Genie),它像语言模型一样逐个 Token 生成视频,被证明可以生成更符合物理规律的视频。

然后是最关键的时刻——Sora,它核心叠加了「叙事能力」,能一次性直出一个包含有意义镜头切换的短片,让视频模型从生成「片段」进化到了能直出「可消费的完整故事」。

最后,Sora 还有一个常被忽略但官方极为重视的突破,即「物理准确性」,官方报告通过体操、跳水等案例来强调这一点。

张鹏: OpenAI 的报告里,有什么让你觉得在技术上有启发的东西吗?还是说他们已经把关键问题都藏起来了?

曹越:报告里关于如何实现物理准确性的描述确实相对晦涩,远没有达到学术论文的清晰度。它只是说「我物理上更准确」,但并没有详细解释方法,这和实现它的路径之间差距还是很大的。

但这至少指明了一个方向:OpenAI 非常关注物理准确性,并认为自己已取得阶段性成果。这对我来说是有启发的。

张鹏:我相信国内顶尖的模型公司都在加班加点地追赶,你估计他们需要多久才能做出类似 Sora 的产品?

曹越:我估计大概需要三个月。从产品维度看,OpenAI 的优势在于模型和产品的垂直整合,但如果只看模型能力,追赶者与它的差距并没有想象中那么大。一个关键能力是音画同出,Veo 3 在 5 月份已经做到,我们内部也将在国庆节后发布一个具备这种能力的新模型。所以,这更像是一个如何将模型能力完整地展示为产品的过程,单论模型本身,海内外团队的差距并不大。

陈冕:我觉得会非常快,第一个产品可能一个月之内就会出来。

原因有两方面:一个是模型能力会迅速拉平。不论是谷歌还是国内公司,很快会发布新模型追赶上来,OpenAI 的 API 也可能很快开放;另一个是真正的战场在应用侧。

对此,我有两个核心观点:

第一,国内的互联网大厂现在应该睡不着觉了。大家对 Sora 有个误解,它不是「AI 版的抖音」,而是「AI 版的 Instagram/朋友圈」,它的本质是 AI 社交。

在中国,通用社交有极强的头部效应和网络效应,赢家通吃,比如微信。内容平台可以百花齐放(抖音、小红书、B 站),但社交只有一个。如果 Sora 真的做成了社交超级 App,将会动摇现有所有平台的流量根基。这会引发一场「腥风血雨」,无论是海外的 Meta、Google,还是中国的几家大厂,都会疯狂内卷。所以我说一个月都是保守估计。

第二,对于创业者来说,AI 应用的时代才刚刚开始,但不要想着去做 AI 版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。

张鹏: 陈冕你觉得 AI 社交的帷幕被拉开了。如果把你切换成 Sam Altman 的角色,接下来三步棋会怎么走?

陈冕:首先,我想澄清一点,CEO 之前的背景不重要,重要的是在当前这个时间点,CEO 和整个团队都要有「复合认知」和「复合能力」。本质上是产品能力和产品认知变得越来越重要了。

回到你的问题,如果我是 Sam Altman,接下来要做三件事:

第一,勇敢地做 ToC。Sora 掀开了 AI 面向泛 C 端的帷幕,这件事可以开始认真考虑了。

第二,加强组织能力的垂直整合。未来的组织,产品需要懂技术,技术也需要懂产品。在前一个阶段,研究员(researcher)可能只需要工程能力,但现在他们也需要产品思维。技术是 AI 革命的基石,但现在技术也开始离不开产品了。不同职能的人,包括研究、工程、产品,必须深度整合。

第三,Go big or go home(要么做大,要么出局)。AI 时代的机会比互联网时代大 10 倍甚至 100 倍,但市场也可能更加头部集中。人才、算力、资源、资金都在向头部集中。AI 的发展速度比以往任何技术革命都快,这导致竞争被前置了。大家都能看到未来,共识很强,所以都用充裕的资本提前进入竞争,内卷加剧。你本来可以慢慢做应用,但现在不行了。API 和算力的价格都很高,如果你没有足够的钱,连 API 费用都付不起,还怎么竞争?所以,我的建议是,业务要更激进地增长。这对所有创业者来说,是最好的时代,也是最卷的时代。

张鹏:我想再追问一下关于「组织能力整合」,有什么迹象表明这种整合是对或错呢?

陈冕:坦诚说,我们也在探索。举个实际例子:一个产品经理会从用户出发,想着用现有技术去「打补丁」,比如优化提示词。但我们的技术同学会提出一个更未来的概念:为什么整个画布不能是一个上下文窗口?

这是一个产品经理最初可能想不到的。但反过来,你光有大的技术变革也不行,设计师会问你,「所以呢?这对我有什么用?」

这就需要产品和技术的深度整合。你既要拥抱新技术,又要找到一个「灵光一现」的场景,让技术真的能被用户玩起来。这要求组织非常敏捷,没有部门墙。根据我的经验,他们必须物理上坐在一起,因为「物理距离也影响心理距离」。我脑海里 Sora 的诞生画面就是:在一个复合型团队里,一个既懂模型又有产品感的人突然想到一个新玩法,然后整个团队能迅速形成共识并落地。这种组织能力至关重要。

张鹏: 我也想听听曹越对这个问题的看法。你最近在组织内部有什么相关的思考和观察吗?

曹越:在我看来,组织内部绝大多数的摩擦都来源于「上下文不对齐」。不同专业背景的人(比如算法与业务)之间沟通带宽很窄,因此提升组织效率的本质,就是如何让大家更快速地对齐上下文。

要实现对齐,有两个基础:第一,个人的 EGO 要小,这样才更容易接受别人观点;第二,要善用语言模型这个「补全上下文的神器」,比如,当我听不懂一段话时,我会把它发给 Gemini,让它帮我理解。

另外,我有一个强烈的感觉:AI 时代,产品和模型的边界比我想象的要模糊得多。这对组织的要求是:做产品的人要去理解模型,做算法的人也要和产品的人多交流。大家要多一起吃饭、散步,在非正式的沟通中对齐上下文。我非常同意陈冕的观点,很多伟大的想法不是设计出来的,而是碰撞出来的。组织就像一个容器,把不同背景的人「Remix」在一起,最终产生伟大的创意。

04

AI 应用的黄金时代和「最卷」的战场

张鹏:我观察到,过去大家追求让普通人能拍出好莱坞大片,或帮专业公司降成本。但 Sora 出来后,路线似乎变了,大家更像在玩,而不是想做大片。这是否意味着,过去那种降低成本、普及好东西的思路,未必是最好的?

陈冕:对,我觉得这是一种惯性思维。AI 时代最大的机会,本质上是 AI 原生的机会。

如果你想的是给好莱坞大片降成本,那你其实还是在做提效,而提效不可能带来革命。革命才诞生伟大的新机会。巨头想提效无可厚非,但创业者绝对不能用这个思维。

我们从第一天起,思考的都是:AI 时代会带来什么样的新体验和新内容?这才是本质。比如你和 Sam Altman 合拍的那个视频,在过去几乎不可能发生,但现在可以随时随意地发生。这就是原来没有的、从 0 到 1 产生的新体验,我们称之为「AI 原生」的体验。

如何定义 AI 原生?你就想,没有 AI,这个业务或内容还存不存在?如果不存在,它就是 AI 原生的。这是一个很重要的思维切换。如果你想在 AI 时代做一家伟大的公司,就必须回答这个问题。如果答案是「体验会打折」,那你可能做错了;如果答案是「业务会直接消失」,那你就做对了。

所以我其实不认为未来会是「好莱坞大片人人都能拍」。当年抖音出来,大家以为短视频是另一种电影,后来发现它是生活记录视频,是摄像头的平权化。我觉得这次也会是不同的东西。

张鹏:如果我们的目标是改变供给,而非降本增效,这会如何改变 AI 模型技术的发展路线,以及模型与产品的融合方式?

曹越:首先,我非常同意这个观点。这一波 AI 本质上是一场生产力革命。无论是语言模型、图像视频模型,还是现在可以音画同步生成的模型,它们在初始阶段都是在改变供给。

但关键问题是:到底要改变的是什么供给?这是一个需要从产品侧深入思考的问题。以视频为例,过去一两年我最大的感受就是,视频这个品类实在太庞杂了。有电影、短视频、中视频,甚至游戏也可以看作是一种交互式视频。

从内容的视角反推,我们就要思考:哪些品类会率先被改变?机会到底在哪里?产品与技术的「fit」又在哪里?随着模型能力的进化,我们看到机会也在演变。一开始可能是人利用各种模型工具去制作一个片子;现在,一个模型已经可以端到端地生成一个 10 秒的短片。再过一两年,模型能独立生成多长的、可消费性的内容呢?

沿着这个时间线推演,会涌现出不同类型的机会。它可能是一种像表情包一样的玩梗视频,也可能是需要更长叙事的 AI 短剧,还可能是有更多交互的形态,比如交互式游戏,用户可以点选分支剧情。甚至,我们能否做出陈冕之前提到的那种,超越简单滑动的、具有极致交互体验的 AI 原生视频产品?

张鹏:Sora 的出现,在未来三个月,对中国的创业团队和投资环境,究竟是好事还是坏事?可能会如何演进?

陈冕:我认为有两个方向的变化,最终是好是坏还不好说,但大概率不会变得特别差。

首先是积极的一面:AI ToC 的想象空间被极大地拓宽了。创业者能探索的方向更多,能做的事情也更多。光有模型能力已经不够,需要更复合的能力加入,这对创业公司是利好。我们能清晰地看到 AI 走向应用的趋势,这几乎是一个比互联网大 10 倍甚至 100 倍的超级机会。能力要求越复合,组织要求越敏捷,创业公司的机会就越多。

但另一方面,也存在「要么做大,要么出局」(go big or go home)的问题,即头部集中会更明显。因为行业发展太快,竞争趋于白热化。虽然巨头如 OpenAI 也并非无所不能——比如他们的 Agent 体验就不一定比创业公司好——但速度、资本和人才的密集,导致大家都在烧钱。尤其 C 端 APP 更烧钱,就像移动互联网早期一样,大家都知道未来能盈利,所以早期竞争异常激烈。这就不可避免地导致资本会更加向头部集中。

所以,总的来说,对于整个创投市场,投资 AI 会更加疯狂和「FOMO」(错失恐惧症),但资金会更向头部集中。而对于创业者来说,这既是最好的时代,也是最「卷」的时代。你必须飞快地做大、变强、找到产品市场契合点(PMF),否则就只能出局。

曹越:我对未来非常非常乐观。无论 Sora 是否出现,这个时代都充满了层出不穷的机会。我非常认同陈冕的观点,这是一个有巨大增量的时代。从底层来看,这波 AI 带来了至少几个数量级以上的效率提升,这种基础生产力的变革最终会催生出极多的机会。

另外一个维度是,中国的创业者完全可以放眼全球市场。坦率地说,中国的创业者非常「卷」,无论是数量还是质量都非常出色。

回顾过去,00 到 10 年,大家主要聚焦中国市场;10 到 20 年,顶尖的企业家已经在中国和海外市场都取得了成功。而在这个新时代,趋势一定会更加全球化。我相信,中国的工程师红利和企业家精神红利,能为世界创造巨大的价值。

张鹏: 最后一个问题,想请两位分享一下:看到了 Sora 之后,你们各自有什么新的目标和计划?

曹越:首先,我们最新的音画同出模型,将在国庆后大家就可以使用了。Sora 让大家看到了音画同出最终的 ToC 机会是什么。国庆后欢迎大家去评测和对比。

未来半年,Sand.ai 会继续专注于 AI 视频方向,为普通和专业用户提供 SOTA 级别的模型和产品。我们对此非常有信心,希望能抓住这个大方向上的机会。

陈冕:对 Lovart 来说,Sora 对生产力侧是巨大的变化。之前 Nano Banana 出现时,我们的流量翻了一倍,希望 Sora 2 开放 API 后能再翻一倍。生产端工具的 PMF 已经得到验证,并且会更强,我们肯定不能错过这个机会。

另外,我们会激进地探索 ToC,但具体做什么我先卖个关子。

第三,我们会激进地扩张团队,欢迎产品、运营、设计、研发的同学加入我们,我们希望做一家顶尖的 AI 原生应用公司。

张鹏: 我逼问一下,12 月份能看到你 ToC 产品的进展吗?

陈冕:(笑)进展肯定会比这更快。但我们对 C 端产品有更长的生长预期。如果一个产品能瞬间爆发,那可能还是大厂的机会。

张鹏:好的。今天两位嘉宾的分享让我们对 Sora 这件事看得更深入、更清楚了。一位准备迎接整个产业在 AI 视频模型上的高度关注,另一位准备接住翻倍的流量并向外扩张。能感觉到两位都非常兴奋。

再次感谢两位的分享。