传说中的6G,挑头的居然不是高通而是英伟达
14 小时前 / 阅读约21分钟
来源:36kr
英伟达在GTC DC大会上推进AI-RAN生态,开源Aerial软件,入股诺基亚,推出ARC-PRO平台,加速6G部署。AI-RAN将节省传输成本,降低时延,推动自动驾驶、机器人等场景发展,可能改变云服务器和通信服务商格局。

Cloud is where AI is born;

Device is where AI acts;

Edge will be where AI lives。

如果要在GTC DC大会上,寻找一个英伟达身上最“性感”而非最“实感”的故事,不同人或许有不同的答案,但有一个技术品牌可能真的要新加入候选人名单了。正是为了它,英伟达刚刚花费了10亿美元入股了老牌电信厂商诺基亚。它就是英伟达AI-RAN的核心技术品牌:

Aerial。

Aerial,今天是一个带有点工业气息的词语。但词源来自拉丁语 aerius,意指“空气的、轻盈的、高耸的”,在古时也用来形容虚幻的、轻盈优雅的美。它让人联想起另一位硅谷“帮主”OpenAI的视频产品:

Sora。

Sora在日语中的本意是“空”,可以是天空,也可以是想象遥远地方时的一种心境。

无论英伟达还是OpenAI都把自己的旗舰产品指向天空,这不是一种偶然,也不仅是一种硅谷审美乐趣上的趋同。或许它们将讲述的是相似一个东西,但现在我们先暂时按下不表。

所谓AI-RAN,用大白话理解就是在通讯基站上加入算力,让未来海量的场景计算可以不用进入云,直接在基站计算完以后就能够返回给终端的场景设备。

这样的方式有两个最显而易见的好处:

一个是节省大量的传输成本,降低云算力中心的压力。

微软CEO萨提亚·纳德拉(Satya Nadella)在前两天与OpenAI CEO山姆·奥特曼(Sam Altman)对谈时就提到了这种AGI困境:他说他的仓库里还有GPU,但没有足够的算力中心容纳,也缺少足够的电力使用。那么其实AI-RAN把算力分布式地放在全球的各个基站里,就可以成为以上的解决方案之一。

第二个则是大幅降低算力的时延。

打过在线游戏的读者都知道,有50毫秒以内的时延都属于“流畅”,但如果把这个延迟复用到自动驾驶上,高速路上将到处都是被撞烂的废铁,这也是今天高精地图方案被边缘化的重要原因。但如果将算力中心推进到用户周围,那么延迟可以降低90%以上,从毫秒级变成微秒级,大量高时延要求的场景就会跑通了。

根据目前可考的公开资料,Aerial最早出现在英伟达的资料里是在2019年洛杉矶世界移动通信大会那时它还只是一套SDK工具,目的是支持 GPU 加速与软件定义的 5G 无线接入网。

没错,2019年,正是“何同学”拍5G视频获得三千万播放量的梦幻之年。

所以从这个角度来说,Aerial大概也能算是一个“5G原生”的工具,正是通讯带宽的快速增长让英伟达看到了一个未来世界的影子,于是Aerial诞生了。

而在过去五年时间里,5G逐渐让不少人失望,但Aerial一直在默默发育。

在这期间,Aerial的定位脱离了最初的SDK工具箱的数据,而转变为一个为“产学研”服务的平台。

2021年3月,NVIDIA在IEEE的5G分论坛上发了一篇论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍5G连接和移动边缘计算(MEC)的NVIDIA超融合(hyper-converged )平台,那时他们的案例目标是工业4.0。

在这篇论文的摘要里,NVIDIA明确表示:

Aerial是一个为研究人员提供下一代无线和人工智能研究平台,从而实现行业转型开放平台(As an open platform Aerial is positioned to beindustry transformationalby providing researchers with a platform for next generation wireless and AI research)。

一个月后,NVIDIA 在 2021 GTC 大会上推出 Aerial A100即NVIDIA AI-on-5G 计算平台

Aerial A100 其实是将,NVIDIA Aerial软件开发套件与 NVIDIA BlueField-2 A100芯片结合起来的产品,后者很大程度脱胎自是英伟达2020年刚完成收购的Mellanox的DPU产品线。虽然是这是一个拼凑起来的产品,一张包括了“5T FOR 5G”解决方案、集成GPU和DPU的融合型卡,但它为AI-RAN提供了宝贵的计算平台,得到了包括谷歌云、富士通的支持。

是的,他们甚至没有在名字里放入AI——所谓5T,指的是“时间触发传输技术”(Time-Triggered Transmission Technology for Telco)。顾名思义,这其实就是要解决精确时间戳和高时钟准确性的问题,但这其实是大规模边缘计算的基础。

有趣的是,而那年媒体对 2021 GTC 的标题是:“NVIDIA推出首款 CPU,狂推ARM生态。” 虽然服务器业务依然重要,但今天已经不太有人想起CPU了,更不会用ARM的视角来看待NVIDIA了。

随后Aerial迎来了一个小的高峰,这从英伟达的“技术博客”可见一斑,在2022年以后有体积Aerial的技术博客数量快速增加。

2022年到2023年间,英伟达陆续陆续推出的DOCA GPUNetIO 、Sionna 库、Aerial Research Cloud等一系列加速AI-RAN的工具。

DOCA GPUNetIO让GPU绕过CPU实现直连网络,降低了时延和成本、提高了吞吐量;

Sionna 库则是一个 GPU 加速的开源库,用于通信系统研究,官方说它可以实现“自动微分框架”,“通过整个通信系统反向传播梯度”,非常适合“神经网络集成”;

Aerial Research Cloud是第一个完全可编程的 5G 和 6G 网络研究沙盒。

但你依然可以将英伟达对Aerial做的所有事情,都重新回到2021年的那个论文标题上:

GPU Hosted AI-on-5G

2024年是英伟达Aerial的生态大年。

2月,著名的 AI-RAN Alliance 成立,牵头单位是英伟达和软银,其他创始单位分别是爱立信、诺基亚、三星、T-mobile、微软、AWS、Arm、DeepSig、美国东北大学。

AI-RAN Alliance成为了英伟达希望重新改写6G定义模式的重要一步,因为它囊括了(除了华为和中兴以外)几乎最重要的通信相关的公司。其组织目标就是要让AI与RAN结合,从而让6G变成真正的AI原生网络。

3月,英伟达还推出了包含 Omniverse 生态系统和 Aerial CUDA 的6G 研究平台。

而直到 9月份, 英伟达在GTC Paris 2024才宣布正式推出 NVIDIA AI Aerial。

这是它在官方介绍中,它已经成为了一个优化无线网络和提供全新生成式 AI 体验的一站式平台

英伟达官方的通讯稿里是这样介绍 AI Aerial 的

NVIDIA AI Aerial 平台提供了全套功能,包括高性能软件定义的 RAN 以及训练、模拟和推理,以便电信运营商能够参与下一代无线网络从开发到部署的所有阶段。

NVIDIA AI Aerial 平台提供的功能包括:

NVIDIA Aerial CUDA 加速 RAN:包含使合作伙伴能够在 NVIDIA 加速计算平台上开发和部署高性能虚拟化 RAN 工作负载的软件库。

NVIDIA Aerial AI 无线电框架:包含基于 PyTorch 和 TensorFlow 的软件库,用于开发和训练能够提高频谱效率并为 5G 和 6G 无线电信号处理添加新功能的模型。该框架还包含 NVIDIA Sionna,该链路级模拟器可用于开发和训练基于神经网络的 5G 和 6G 无线电算法。

NVIDIA Aerial Omniverse 数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT 能够以物理学精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络都不例外。它包含软件定义的 RAN(Aerial-CUDA 加速 RAN)和用户设备模拟器,以及物理世界的现实地形和物体属性。

这里包含了英伟达对下一个6G的很多定义和想象:

高性能的算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。

也从此开始,英伟达开始加速推进整个AI-RAN的生态建设的扩容,不仅与Vapor IO 这类边缘计算服务商在拉斯维加斯开辟实验田,也不断开源新的工具,推进新的头部合作伙伴。

而这一系列生态动作,在2025年10月的GTC DC大会上达到了一个阶段性的峰值。

1

Aerial 冲刺 CUDA 时刻

在10月GTC DC大会期间,英伟达终于对着 AI-RAN 暗流涌动的湖面上扔下了两个大石头:

第一,开源Aerial软件。

开源后的软件,将可以运行于包括 NVIDIA DGX Spark 在内的多种 NVIDIA 平台。

DGX Spark 就是黄仁勋之前亲手交付给马斯克和李在镕的小“便当盒子”,是目前全球最小的“AI超级电脑”,可以在本地执行最高 2000 亿参数的 AI 模型推理和 700 亿参数的模型微调,可以说完美匹配像AI-RAN场景多元的开发生态需求,非常适合高校研究者和个人开发者参与。

第二,英伟达宣布以10亿美金入股诺基亚,达成战略合作。

入股后英伟达将占比2.9%,英伟达的AI-RAN生态产品将进入诺基亚的RAN产品组合里,双方共同推进6G的AI-RAN落地。

第三,英伟达推出了 Aerial RAN Computer Pro (ARC-PRO)平台。

如果说曾经的 Aerial 平台还是一个带有研发起步性质的小平台,这次的ARC-PRO就是为顶级合作伙伴预备的产业级大跑道,它可以直接和基站结合,既能服务5G实现AI-RAN功能,还能帮助5G向6G的平滑过渡。介绍稿里的标题也从AI-RAN,正式切换成了“6G AI”。英伟达对这个6G AI平台的口气也变得很大,甚至在中国读者看来可能是很具有侵略性的:

“驱动美国重返电信领导地位”。

如果了解英伟达历史的读者,至此可能已经有一种似曾相识的感觉。 Aerial 的发展历程很像 CUDA,几乎是一种关于技术的商业美学复刻。

黄仁勋力推CUDA,因为它看到GPU不止局限于游戏图像,而有通用计算能力的潜力;推Aerial,因为RAN不止是通信,还可能是未来的AI基础设施。

CUDA从高校生态起步,花了十年时间培养,最终形成了独有的生态护城河;Aerial也是从小的研发性质开发平台起步,一步步变成一个AI-RAN生态,总共花了五年时间,成为了英伟达基站算力业务的护城河。

从单点工具 → 通用平台 → 生态护城河,这是英伟达与时间的经典故事。

但如果细究,则会发现两者在商业细节上不完全相同。

这种差别不是在节奏的快慢上,Aerial是含着金钥匙出身的孩子,节奏自然更快。最大的区别是英伟达对生态伙伴的态度上。

以算法生态为例,CUDA是闭源为主,Aerial是开源为主。

在合作方面,CUDA的开放主要是积累开发者的习惯和口碑,Aerial虽然也拥抱大量中小开发者,但核心战略目标直指生态中的顶级玩家。

英伟达若要复刻CUDA时刻,第一个“北极星指标”实际上是让自己的标准与生态被“大玩家”接受。没有通信行业错综复杂的利益生态的支持,AI-RAN就无从谈起。在通用计算方面,GPU对CPU是从无到有的降维打击。但Aerial对RAN则是从无到有的合作升维。

从这个角度来说,虽然贵为5万亿美金的硅谷新宠,在通信市场里,英伟达依然在扮演“仰攻”和“说服者”的角色。

“10亿美金入股”就是其中最有力的说服方式。

诺基亚可能是今天Aerial所能找到的最完美合作伙伴。

抛开华为外的欧美国家市场,诺基亚的5G基站市场份额已经落后爱立信,且在趋势上与后者的差距越来越大。尤其在美国的基站市场,诺基亚丢单Verizo以后,一度传出仅剩的T-Mobile也将不保。与英伟达的合作或许可以帮助诺基亚在美国市场重新站稳脚跟。

2023年,诺基亚出台过一个“2030年计划”。该计划与英伟达的喜好高度吻合,它将AI放在了所有战略的第一条,将“云连续体”放在了第二条。所谓云连续体,其实就是将“云-边-端”无缝融合,背后最大的市场机会其实就是“边缘云”市场。

而如果按照英伟达的技术构想,今天的通信公司未来都可以成为新的云计算公司。这点我们放在最后细说。

最后,诺基亚是一个股权分散的上市公司,大股东系芬兰政府旗下资金,不直接干预公司经营。因此,英伟达2.9%的持股,既不会过度引发其他基站公司的抵触和担忧,也能直接对诺基亚施加影响。

对于英伟达而言,入股诺基亚有两大战略优势。

第一,6G AI的部署速度会领先行业,假如英伟达率先将部署了Aerial的基站设备推向市场,再在Aerial基础上形成应用生态,率先做成生态的增长飞轮。

这有点像安卓之于塞班、Windows Mobile等系统,先发优势会形成操作系统的重要优势。

第二,则是关于传统RAN市场格局中非常重要的投票机制:3GPP。

3GPP是全球移动通信技术标准的核心制定组织,组织内有上百个不同产业链的关键企业。3GPP在中国算半个网红,因为它曾在几年前爆发过一个科技行业非常出圈的新闻,即华为主推的Polar码和高通主推的LDPC码的“投票门”。投票过程被花边演绎,结果对某投票的企业形成了极大的公关创伤。

其实像编码提案是需要71%的投票率通过,因此并不存在严格意义的“关键少数”,而是以技术共识为主、投票为辅的决策形式。但3GPP“权力修罗场”的形象已经被深刻留在了互联网里了。

英伟达虽然有AI-RAN作为行业联盟,但3GPP才是规则的制定者。坏消息是,由于没有传统的通信业务,英伟达在其中的权重很低,存在感很弱。所以英伟达也需要一个具有生态协同能力的策动能手,而诺基亚便是在3GPP中与华为、爱立信、高通并驾齐驱的第一梯队权重的投票者,对上下游的其他投票权企业也有很深的影响力。

而今年和明年的 3GPP 讨论 release 20 和 release 21 刚好是 5G 转向 6G 的重要节点。

其中2025年的 release 20 被认为是 5G-Advanced 的最后一站,也是迈向 6G 的第一站。而大概率在明年召开的 release 21 则将是 6G 标准的第一站。英伟达需要抓住更多的时间窗口,来为自己的 AI-RAN 生态获得更好的站位。

2

谁的“6G”?

英伟达是今天RAN生态不可忽视的变量,高通也是。

如果将 AI-RAN 粗暴地分成 AI 和 RAN 两个维度,再将二家半导体巨头放在一起比较:显然英伟达是 AI 强,RAN弱;高通则是 RAN 积累更深,AI 相对英伟达处下风。

在6G时代,高通当然也会是重要的参与者。但这涉及到一个话语权的重新争夺:

6G的本质到底是倾向于 AI 还是 RAN ?

最简单的做法是算账。

我们暂时无法给出准确的数据,但是有一些相近的数字可以参考。DGX Spark 128G 的定价是3999美元,折合人民币近3万元;算力中心的大芯片A100,大内存的单卡价格在1.5万美金往上,折合10万人民币。

5G基站方面,此前有媒体通过中国移动的总5G投资和总5G基站部署量,计算出整体的基站平均部署成本大约40万人民币(含安装、土地等综合成本)。不过近几年随着产业链成熟,5G基站成本也在快速下降,有相应集采价格已经跌到16万人民币。

不过5G基站的类型包含了大基站、微基站等不同种类大小,功率和覆盖范围差异很大,所以不能一概而论。但6G的基站相应会比5G更密集,大基站空间更少,微基站更多。不过早期技术普及期,整体价格也可能会高一些。

有两件事情是确定:

第一,芯片算力会在基站业务中占据非常重要的成本比例;

第二,这个成本占比在未来是存在弹性的:

如果算力的使用频率越高,场景对算力的需求就会越大,那么芯片在基站中的成本占比也就越高。换言之,相比于RAN业务的规模,算力芯片业务的收入想象可以是很宏大的。

而黄仁勋从来没有放弃过的东西,就是对算力“想象”。

这时我们就不得不搬出NVIDIA的另一个杀手锏级的技术品牌:

Ominverse。

这个产品曾经是元宇宙热潮时候的宠儿,名字也带着元宇宙的气息(Omni是“所有”的意思,连起来就是“全宇宙”)。2021年,黄仁勋用它做了一个数字分身做发布会演讲,成了 Metaverse 时期的一道独特风景。

如今,Meta 的时代已经远去,Omni 却留了下来。

今天Omnivesre成为了英伟达与场景的重要链接器,许多跟落地相关的业务都在这里。如果你想知道,算力将在未来改变哪些场景,最简单的方法就是直接看Omniverse的业务线。

比如这次2025GTC DC披露的重头戏自动驾驶业务,背后是Omniverse为主导的团队。

英伟达宣布将要在2027年前部署超过10万台自动驾驶车队,部署NVIDIA DRIVE AGX Hyperion 10 自动驾驶平台。这是除了特斯拉以外,目前最庞大的部署计划。

在L4期间,AI-RAN似乎不那么重要,但是L5几乎必须6G以上的AI-RAN网络支持。

因为L5意味着无方向盘的无人驾驶,要在所有路况、所有时间都能够稳定运行,而如此庞大的车流网络就必须要边缘算力支持、配合高精地图的全局规划能力。

L5自动驾驶对于AI-RAN是堪称教科书级别的场景,因为它满足了AI-RAN背后三个场景强烈的需求:

超高的低时延要求、端侧难以承载的算力要求、类似“群体智能”一般的AI算力调度能力。

马斯克在近期接受采访时,有个“大胆”的预言。

他说,“未来不会有操作系统,不会有APP,你的手机只是显示像素和发出声音,它预测你最想看到和听到什么,然后实时生成,我们会尽可能地将AI集成到这个设备中。

“不会再有传统意义上的手机了,我们所谓的手机,实际上是一个用于AI推理的边缘节点,配备一些无线电模块进行连接。”

而服务器端的AI会与用户设备(以前被称为手机)上的AI进行通信,并生成用户想要的任何实时视频。

马斯克观点的本质,其实是AI-RAN能力和大模型能力叠加,将取代所有的终端算力。算是最激进的一种AI-RAN的愿景,如果这个愿景实现,那么AI-RAN就是宇宙级的大生意。但许多研究机构都认同,在6G时代“云电脑”、“云手机”会从小众走向大众。而其中的“云”很可能就是AI-RAN能力加持的“边缘云”。人们不再需要花昂贵的价格占有设备,只需要在有高算力需求的时候租用即可。

不过我们如果回到现实,有两个场景是相对近在眼前的:

一个是机器人与XR设备。

目前所有的机器人都面临“端侧”对话太智障,但是“云”对话缓慢且昂贵的体验困境。智能眼镜厂商,面临的则是大算力芯片做不进小眼镜,小设备撑不起长续航的困境。但未来AI-RAN可能会成为潜在的解决方案。

一个是“元宇宙”级别的数字孪生场景。

无论是消费级的游戏应用,还是工业、手术台、能源、国防都可以做场景的延展。

今年3月,NVIDIA出过一个数字孪生平台,正是叫Aerial Omniverse Digital Twin(AODT)。官方说,它可以实现从单个塔到城市规模的完整 6G 系统进行物理级准确的模拟。

读到这里,我猜你其实已经想到了AI-RAN的终局。

一个由边缘计算节点组建的超级计算机,一个地球ONLINE的超级服务器,一个AI打破世界的所有链接壁垒、又模糊掉所有边界的线上线下同构的世界。

当然,地球ONLINE还很遥远。但在此之前,你可能需要最后知道,AI-RAN可能还将改变两件事情:

一件是好的。

云服务器厂商的格局可能会变化,“边缘云”会从小众需求变成一件主流的超大生意,而通信服务商则可能会天然成为新的云服务商。下一个AWS,可能未必出自亚马逊。

一件是坏的。

如果你打开英伟达Aeiral页面,你会看到一个页面,写着:主权AI基础设施。

当然,算力原本也是脱敏的信息,但如果当5G通信网络都无法实现基站生意顺畅的跨国竞争。那么在AI-RAN时代,你可能更难以想象,欧美的政客会采用其他国家的基站设备。尽管华为可能是这个世界上,唯一既有AI芯片能力,又有基站能力的厂商。

这就是6G和它的AI。

它诞生在一个复杂的世界,所以也催生世界的复杂。