最长连续工作40天,硅谷Agent又进化了:给个指令,剩下它全搞定
8 小时前 / 阅读约7分钟
来源:36kr
Factory上线Missions功能,超越OpenClaw,实现全自动工程闭环。用户只需下达任务指令,智能体即可自主规划、执行复杂任务,最长可连续工作40天,极大提升AI自主化上限。

可自主规划连续执行40天的全自动智能体来了!

果然吃龙虾肉,有时候还得看老外(doge)

Factory最新上线的Missions,直接超越OpenClaw,把一盘剥好的肉端上桌——

不整虚的!只需一个任务指令,就能交付全自动工程闭环。

换句话说,不论是多复杂的架构,还是跨模块任务,给它一个Missions,智能体就能自己规划、自己写、自己测。

只管结果,不问过程,用户再也不用随时盯着屏幕交互指令。

u1s1,真香!

最长可连续工作40天

根据官方描述,Missions被搭载在Factory自研的智能体Droids上,被设计用来自主管理多天跨度的复杂任务。

用户只需告诉智能体想要做什么,例如“帮我构建一个CRM系统”或者“将这段PHP代码库迁移到TypeScript”,智能体就能自动将任务拆解为子任务,并按照时间和逻辑顺序执行。

其中每个子任务都会生成相应的对话,通过Git协调交接,并在每一步都进行验证、及时修复错误,最后直接产出完整结果。

同时在终端里,能够实时看到智能体的任务进展,包括正在构建的功能、哪个智能体正在执行、使用到哪些工具等。

具体来说,为了让多个智能体并行运行,Missions内置了一个调度器

调度器将大型复杂项目分解为多个里程碑,在每个里程碑中,工作又被细分为多个功能。

每个功能都会启动一个全新上下文的对话窗口,避免单一长对话会遗失上下文或出错。同时在适当情况下,Missions会在功能内部进行并行处理,以提升效率。

而进入下一个里程碑的前提,在于上一个里程碑要完成验证阶段

系统会审查已经完成的工作,运行测试并验证所有功能是否已经集成。一旦验证过程中发现问题,调度器会自动生成修复任务直至满足标准,然后再进入下一个阶段。

Missions内置有原生计算机功能,并专门针对任务工作负载进行了优化,验证过程会与真人验证保持对齐。

另外,Missions本身支持多模型,可以调用来自不同厂商、不同类型的AI模型担任执行智能体,调度器Droids则会根据任务自动选择最合适的模型。

除了软件开发,Missions还可以用于训练机器学习模型、攥写研究论文等任务上,具有极强的泛化能力。

这一点主要是通过基于skill的学习系统实现的。当新任务运行时,它会将可复用的操作提炼成skill。然后执行智能体会在干活中不断完善、扩充这个技能库。

只要用户用得越多,系统在用户领域的表现就越出色。

加上Missions后,智能体的对话持续时长出现了明显增长。

原先Droid平均对话持续约8分钟,60%的对话会在15分钟内完成,而Missions+Droid的对话普遍在2小时左右,37%的任务都会持续超过4小时。

有些任务甚至持续数天,最长的任务可达到40天。

这就意味着,Missions的引入能够让智能体处理更为复杂的任务,极大地拉高了AI的自主化上限,妥妥的业界天花板水平。

与此同时,不仅任务运行时间更长,每回合推理次数也会变多。

在单个Mission里,消息发送速率降至每分钟3条,但每条的token权重翻了一番。这是因为Missions把大量时间花费在执行工程任务上,而不是一直生成文字token。

平均而言,Missions消耗的token数量会是普通对话的12倍,但前后消耗速度其实差不多,都是每分钟约4.5万个token。

目前Missions已经在官方的CLI和IDE扩展程序中提供,企业版和Max版用户即日起可以使用。

理论物理和AI强强联合

Factory.ai是一家硅谷初创公司,与传统的AI代码助手(如GitHub Copilot)不同,它致力于构建自主AI工程师。

旗下的代表产品便是Droids,一款专为软件开发生命周期设计的自主Agent。

它能够独立完成复杂的任务,理解用户需求、查阅文档、编写代码并提交,全方位覆盖软件开发。

类似的产品例如早前大火的AI程序员Devin,但Droids更强调深度集成到企业工作流中。

这次Missions则是对Droids完成系统级封装和调度升级,建立起完整的多Agent协调框架。

团队创始人为两位普林斯顿大学校友Matan Grinberg和Eno Reyes。

Matan Grinberg是典型的理论物理学背景转向AI创业。本科期间曾师从世界顶级弦理论专家胡安·马尔达塞纳,在UC伯克利攻读博士学位时,研究物理与AI的交叉领域。

2023年,他凭借一封关于弦理论和AI深度思考的邮件,吸引了红杉资本合伙人Shaun Maguire的注意,于是他辍学创办了Factory并收获红杉领投的数百万美元的投资。

Eno Reyes则拥有丰富的机器学习背景,在创办Factory之前,他曾在Hugging Face担任机器学习工程师,负责模型相关工作,以及在微软从事过软件开发。

在普林斯顿大学主修认知科学,负责领导研发Droids的自主循环机制和上下文压缩机制。

他们二人是在一次黑客松上重逢并决定创业的,然后用了一天时间就签署了意向书,注册成立了公司,最初的demo也只用了短短一周时间。

福布斯曾评价这对组合是AI时代的黄金搭档,Shaun Maguire也称赞他们二人:

不仅拥有顶级物理和AI实力,还具备与之匹配的商业直觉和执行效率。

他们的理念是,在AI强势发展的同时,进一步激发软件开发领域的创造力——而不仅仅局限于工程师。

参考链接:

[1]https://x.com/FactoryAI/status/2027104794289263104?s=20

[2]https://factory.ai/news/missions

[3]https://sequoiacap.com/article/partnering-with-factory-autonomous-ai-for-all/