北大校友Lilian Weng自曝公司首个产品？一篇论文未发，估值却已90亿 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

北大校友Lilian Weng自曝公司首个产品？一篇论文未发，估值却已90亿

1 天前 / 阅读约8分钟

来源：36kr

OpenAI前成员创企推AI训练仪表盘，OpenAI布局硬件。

26日，OpenAI前安全副总裁Lilian Weng，疑似爆出了90亿估值神秘新公司Thinking Machines的首个产品——一台专为AI训练打造的「手动调参仪表盘」？

OpenAI前研究员大佬、如今的Thinking Machines Lab联创Lilian Weng，26日转发了一个神秘产品——一个看似仪表盘的东西。

或许，这就将是公司即将打造的第一个爆品？

这个产品所揭示的理念，可谓十分惊人——

在训练过程中，研究人员可以直接用它来手动调整所有的超参数了！

Lilian Weng宣称：总有一天我们会涉足硬件领域，而现在就是时候了。

所以，这个最高估值90亿美元神秘新公司的首个产品，或许就是这个硬件？

前CTO组建的神秘公司，憋的大招是这个？

其实，分享出这个视频的，是前谷歌DeepMind员工Stephen Roller，后来，他又跳到了Character AI，现在来到了Thinking Machines Lab。

他表示，一些团队需要通过参数遍历、启发式方法或者Scaling Law来确定训练的学习率。

但是在Character，他们只需要让Noam Shazeer来手动调到正确的值。

这位Noam Shazeer，就是出走谷歌后创办Character，又让谷歌豪掷27亿刀买下整个初创、只为换得他重回谷歌工作的那位大神。

这个idea，着实让开发者们兴奋了。

看起来，这似乎比大多数调度方法都要好。

有人问道，为什么在这个过程中，还需要绘制学习率的平均值呢？

Stephen Roller回答说：「并不一定。对于所有指标，我们都会跟踪平均值和分母。对于学习率（LR），分母始终为1。这只是我们模板的一个副作用。」

有人表示，这个方法看起来太赞了！不过，仍然会需要做很多超参数搜索。

而且，他还发现了一件事，就是很多人在训练出不错的模型但达到瓶颈后，通常不会尝试分支搜索，即不会把这个模型衍生出几个不同学习率的训练路径。

但其实，如果提前主动剪掉一些没前途的分枝，其实是能节省不少算力的。

另外还有一名Character员工爆料说，其实在实践中，你需要花费大量的计算资源和精力，才能超越Noam随口提出的超参数。莫非，这是大神独有的一种神秘手动天赋？

「或许未来，AI研究中心会类似于老式发电厂的控制室？」

还有人玩起了梗：以后训大模型会是这样的，把实验接到DJ混音器上，然后开始凭感觉微调超参数？

一篇论文未发，已经估值90亿

神秘的Thinking Machines Lab，由Murati牵头，网罗了一堆OpenAI的天才核心员工。

虽然一篇论文未发，但公司的估值已经达到了惊人的90亿美元。

现在，公司旗下的大神包括但不限于——

Lilian Weng，OpenAI前研究副总裁（VP ofResearch），主管模型安全。

OpenAI联创John Schulman，主导了ChatGPT的研发工作；2022至2024年间，共同负责为ChatGPT和OpenAI API开发核心模型架构。

ChatGPT共同创始人Barret Zoph，OpenAI前研究副总裁，主管后期训练方向。

GPT开山一作、「爱因斯坦级天才」Alec Radford，「史上最强本科学历AI研究员」。

OpenAI首席研究官，塑造GPT-3、GPT-4、o1的关键人物Bob McGrew。

OpenAI前多模态团队负责人Alexander Kirillov。

现在，Thinking Machines的网站上列出了38名创始团队成员，其中有19人都是OpenAI的老员工，还有多位华人科学家。

在表面上，Thinking Machines这块调参「DJ台」看起来只是一个极客味十足的训练工具；但如果放到更宏大的产业棋局中，它的意义远不止于此——

它揭开了下一场AI大战的序幕：一场关于「谁能占据AI硬件入口」的全新较量。

另一边，OpenAI也早已悄悄布局。

就在不久前曝光的一份内部文件中，它写得清清楚楚——

ChatGPT的未来，不只是网页和APP，而是一种「无处不在、永不离线」的全新硬件形态。

OpenAI：AI+硬件的野心被挖出

在2024年12月2日，OpenAI的一份内部文件，提到「Ship a [REDACTED] by 2026」。

这些文件来自美国司法部诉谷歌垄断案（U.S. v. Google (2024) (1:20-cv-03010)），基本上就是真材实料，因为涉及到具体的商业机密，所以关键部分做了处理。

OpenAI在文件中坦言：网站、手机、桌面应用，仍无法让ChatGPT「无处不在」。

他们设想的，是能融入家庭、街道、职场、独处时刻的全能AI硬件。

被打码的极有可能是一款硬件设备。

ChatGPT翻译的OpenAI内部文件大意：

在2026年前推出一款██████████

如今，ChatGPT已通过我们的网站、手机和桌面应用的形式出现在生活中。但我们对ChatGPT的愿景，是让它无论你身在何处，都能陪伴你的整个生活。

在家中，它应该能帮你解答问题、播放音乐、推荐食谱；在路上，它应该能帮你导航、寻找最棒的餐厅、联络朋友；在工作中，它应该能帮你做会议记录或准备重要演讲；而在独自行走时，它应该能陪你思考、放松心情。

我们希望ChatGPT成为█████████████████████████████████████████████。

最好的AI，是那个始终陪伴在你身边的AI。

ChatGPT还给出了合理猜测：OpenAI要发布个人AI设备，他们希望ChatGPT成为实时响应、无处不在、始终陪伴的AI助手。

它还给出了依据说明：

这都说得通：什么东西能「始终陪伴」？

因为手机已经被排除，智能手表之类的硬件是个可能的选择。

在曝料贴下，网友Gordon Sloane还上传了带有OpenAI商标的设备。

最近，OpenAI还收购了知名硬件设计师Jony Ive的设计工作室LoveFrom，意在智能设备。

根据OpenAI发布的新闻，早在两年前，Jony Ive的创意团队LoveFrom悄然开始与OpenAI团队展开合作。

为了探索更多AI工具与产品形态，一年前，Jony Ive联合Scott Cannon、Evans Hankey与Tang Tan创立了io设计公司。

左：Jony Ive；中：Evans Hankey；右：Tang Tan

在本月，OpenAI宣布用64亿美元收购io团队。

Jony Ive曾担任苹果公司的首席设计官（chief design officer），主管产品设计和人机界面设计。

OpenAI显然在效仿Apple，试图以Jony Ive的美学重塑AI硬件体验，押注属于AI时代的下一个「iPhone时刻」。

而那些被挖出的内部文件，无疑也在佐证OpenAI谋划多时，意在智能硬件的目标绝非一时起意。

参考资料：

https://x.com/TechEmails/status/1926683901004517726

https://x.com/lilianweng/status/1926490532529770614

上一篇：AI营销的蜜月期比想象中要短

下一篇：o3不听指令拒绝关机，7次破坏关机脚本，AI正在学会「自我保护」机制

返回列表

前CTO组建的神秘公司，憋的大招是这个？

一篇论文未发，已经估值90亿

OpenAI：AI+硬件的野心被挖出

相关新闻