IT之家 12 月 21 日消息,一支由英伟达、斯坦福大学、加州理工学院等机构的研究人员组成的多元化团队,研发出了一款名为 NitroGen 的模型。英伟达人工智能总监、杰出科学家吉姆・范于周五在领英发文称,NitroGen 是“一款经训练可玩转 1000 余款游戏的开源基础模型”。但该模型的意义远不止于此,其影响力从游戏领域延伸至现实世界,能为仿真技术和机器人学带来可观的价值。

据IT之家了解,这款研究成果可以被看作是打造“行动版 GPT”的一次尝试。因此,它是大型语言模型(LLM)领域的一项突破,将这项成熟的大规模训练技术,拓展到了语言和计算机视觉领域之外。此外,该研究论文的引言部分指出,“打造能够在未知环境中运行的通用化具身智能体,长期以来一直被视为人工智能研究的圣杯”。
有趣的是,NitroGen 的底层架构是 GROOT N1.5,这一架构最初是为机器人技术设计的。而它在游戏领域的应用,也有望反哺机器人技术,为在复杂多变且难以预测的环境中作业的机器人带来极大助益。

研究人员对 NitroGen 进行了改造,使其能够驾驭玩法机制和物理引擎截然不同的各类游戏,这正是电子游戏的魅力所在。研究团队采用了超过 4 万小时的游戏主播公开实机演示视频,其中那些叠加了玩家手柄实时操作画面的视频,为模型训练提供了尤为关键的帮助。
吉姆・范兴奋地表示,在测试中,NitroGen 成功玩转了“角色扮演、平台跳跃、大逃杀、竞速等各类游戏,无论是 2D 还是 3D 品类,几乎无所不包”。尽管成果喜人,但这位英伟达科学家也坦言,这仅仅是个开始,还有很长的路要走。
NitroGen 第一个版本的研发重心明确放在快速动作控制上,吉姆・范将其称之为“玩家直觉”。研究成果显示,这款新型大型语言模型还具备“跨领域的强大能力”;在程序化生成的游戏世界,以及从未接触过的新游戏中,相较于从零开始训练的模型,其任务成功率实现了 52% 的相对提升。
截至目前,关于 NitroGen 的所有研究成果均已开源,研究团队鼓励所有对游戏、机器人技术和大型语言模型感兴趣的人士参与调试优化。预训练模型权重、完整的动作数据集以及相关代码均对外开放,任由开发者发挥奇思妙想,亲手探索打磨。
