神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:别再把 AI 当对话框。真正的效率不在于“你会问”,而在于让智能体在下班后替你干活。这是一场工作流的范式革命。文章来自编译。
在采用任何真正有意义的工具时,我的经验是必然会经历三个阶段:(1)低效期;(2)平庸期;以及最终的(3)改变工作流和生活的探索发现期。
在大多数情况下,我必须强迫自己熬过第一和第二阶段,因为我通常已经有了一套让自己感到舒适且满意的现有工作流。采用新工具本身就像是在增加工作量,我并不想投入这种额外的精力,但为了成为一名技艺全面的开发者,我通常还是会选择坚持下去。
这就是我在 AI 工具中发掘价值的历程,以及我接下来的探索方向。在当下充斥着极度夸张和炒作言论的环境中,我希望这篇文章能代表一种更细致、更理性的视角,阐述我对 AI 的看法及我的看法是如何随时间而演变的。
立即停止尝试通过聊天机器人(例如网页版的 ChatGPT、Gemini 等)来开展实质性的工作。聊天机器人确实有其实际价值,也是我日常 AI 工作流的一部分,但它们在编程方面的效用非常有限。因为你大多时候只是在寄希望于它们能根据之前的训练给出正确结果,而一旦出错,就需要人工(也就是你)反复告诉它们错在哪里。这极其低效。
我想每个人的 AI 初体验都是从对话界面开始的,而且每个人第一次尝试用 AI 辅助编程时,大概也都是在聊天框里让它写段代码。
当我还是个坚定的 AI 怀疑论者时,我的第一个“真香”时刻是把 Zed 的命令面板截图发给 Gemini,让它用 SwiftUI 复现出来。结果令我大为震惊,它完成得非常出色。如今 Ghostty macOS 版中搭载的命令面板,与 Gemini 在几秒钟内为我生成的版本相比,只做了非常细微的修改。
但当我尝试将这种方式应用到其他任务时,结果却让我大失所望。在处理现有的存量项目时,我发现对话界面的表现经常不尽如人意,而且在界面之间反复复制粘贴代码和终端输出让我感到非常沮丧。显然,这远没有我自己动手来得高效。
要挖掘真正的价值,你必须使用“智能体”(Agent)。智能体是业界通用的术语,指能够不断进行对话并调用外部行为的大语言模型。作为一个智能体,它起码得具备以下能力:读取文件、执行程序以及发起 HTTP 请求。
进阶历程的下一个阶段,我尝试了 Claude Code。开门见山地说:最初我并没觉得它有多厉害。在实际使用中,我得不到理想的结果。我觉得它生成的任何东西我都得重新润色,而这个过程比我自己直接写还要费时间。我读了博文,看了视频,但依然感觉平平。
我没有选择放弃,而是强迫自己用智能体去复现我手动完成的所有提交。我相当于把活儿干了两遍。我会先手动完成工作,然后再指挥智能体去产出质量和功能完全一致的结果(当然,智能体是看不见我写好的现成方案的)。
这个过程非常痛苦,因为会阻碍工作的进度。但我在非 AI 工具领域已经摸爬滚打了足够久,深知这种磨合期的阵痛是自然的;如果不竭尽全力去尝试,我就无法得出一个经得起推敲的结论。
然而,专业直觉就此形成了。我迅速通过第一性原理验证了别人早已总结出的经验,而亲手实践让我对这些基础逻辑有了更深刻的理解。
将任务分解为独立、清晰且可执行的子任务。不要指望通过一次超长对话就能“一步登天”画出整只猫头鹰。
对于模糊的需求,将工作拆分为独立的“规划”与“执行”两个环节。
如果你给智能体提供一种验证其工作的方法,它通常能自行修复错误并防止功能退化。
从更广泛的角度来说,我也摸清了——在当时那个阶段——智能体擅长什么、不擅长什么,以及针对它们擅长的任务,我该如何操作才能得到想要的结果。
这一切让我的效率有了显著提升,以至于我开始自然而然地使用智能体,并感觉到它的速度已经不亚于我自己动手了(但我仍然没觉得它更快,因为我大部分时间都在盯着这个智能体)。
这里有一个“留白”经验值得重申:效率提升的一部分来自于知道什么时候“不”去动用智能体。在那些它极大概率会失败的事情上使用智能体,显然是在浪费时间;具备完全避开这些坑的认知,本身就是一种时间的节省。
到了这个阶段,我发现智能体的价值已经足够让我乐于将其纳入工作流,尽管我还没感觉到有什么净效率提升。但我不在乎,此时的我对 AI 作为一个工具的表现已经感到满意了。
为了进一步追求效率,我开启了一个新模式:每天最后留出 30 分钟来启动一个或多个智能体。我的假设是,如果智能体能在我不工作的时候取得一些积极进展,那么在效率上我就赚到了。简单来说:与其尝试在现有时间内做更多的事,不如尝试利用我不在的时间做更多的事。
和之前的尝试一样,起初我觉得这种做法既不成功又让人烦躁。但很快,我再次发现了几类非常有帮助的工作场景:
深度调研:我会让智能体调研某个领域,比如找出所有使用了特定协议且采用特定语言开发的库,并针对每一个库生成长达数页的总结,涵盖优缺点、开发活跃度、社区评价等。
并行探索:让不同的智能体尝试我脑子里那些还没空动手的模糊想法。我不指望它们能产出最终上线的东西,但也许当第二天我正式开始这项任务时,它们已经帮我找出了一些先前的知识盲区。
Issue 和 PR 的分拣与审查。智能体非常擅长使用 gh (GitHub CLI),所以我手动写了个脚本,快速启动一堆并行任务来分拣 Issue。我不会让智能体直接回复,我只是想要第二天的报告,以此引导我去做高价值或低工作量的任务。
需要说明的是,我并没有像某些人那样让智能体整晚循环运行。大多数情况下,智能体在半小时内就能完成任务。但是,在工作日的后半段,我通常比较疲惫,容易脱离心流状态,效率极低。所以,把精力转到启动这些智能体上,让我第二天早上能有一个“热启动”,进入状态的速度比平时快得多。
我很满意,并且开始感觉到自己做的事情比 AI 出现之前要多了一些,哪怕只是多了一点点。
到了这一步,我对 AI 擅长和不擅长什么已经非常有把握了。对于某些特定任务,我有信心 AI 能够给出一个大体正确的方案。于是,我旅程的下一步就是:让智能体去处理所有这些活儿,与此同时我去做别的。
具体来说,我每天开始工作时会拿前一晚分拣智能体跑出的结果,手动筛选出那些智能体几乎肯定能处理好的 Issue,然后让它们在后台持续运行(一次跑一个,不并行)。
与此同时,我会处理其他事情。我没去刷社交媒体(起码不比没 AI 时刷得多),也没去看视频。我依然处于自己正常的、AI 时代之前的深思模式中,处理着我想做或必须做的工作。
这一阶段非常重要的一点是:关掉智能体的桌面通知。语境切换的成本极高。为了保持高效,我发现,作为人类,我的职责应该是掌控中断智能体的时机,而不是被它牵着鼻子走。别让智能体打扰你。在你工作的自然间歇期,切过去看一眼进度,然后继续忙你的。
更重要的是,我认为这种“去做别的事”的策略有助于抵消 Anthropic 那篇广为流传的关于技能形成的研究中提到的负面影响。这其实是一种权衡:外包给智能体的任务你不再需要自己磨练技能,但对于继续手动完成的任务,你依然会自然地提升技能。
此时,我已坚定地进入到“再也回不去”的阶段。我感觉效率更高了,但即便没有,我最喜欢的一点是,我现在可以将编程和思考集中在那些我真正热爱的任务上,同时依然能体面地完成那些我不喜欢的琐事。
再说点显而易见的:如果智能体第一次就能生成正确结果,或者起码只需要极少的手动润色,其效率会高得多。要实现这一点,最稳妥的办法就是为智能体提供快速且高质量的工具,当它出错时能自动告知它。
我不知道业界是否已经有了通用的术语,但我习惯称之为“配套工程”(Harness Engineering)。其核心理念是,每当你发现智能体犯错,你就花点时间用工程手段解决掉,确保智能体以后再也不会犯同样的错误。我并没打算发明新名词,如果有现成的说法,我非常乐意借用。
这主要体现在两种形式上:
更优的隐式提示词 (AGENTS.md):针对一些简单问题,比如智能体反复运行错误的命令或找错 API,可以更新 AGENTS.md(或同类文件)。这里有一个 Ghostty 的例子。那个文件中的每一行都是基于智能体之前的糟糕表现总结出来的,这几乎彻底解决了所有同类问题。
实实在在的编程工具:比如用于截图、运行过滤后的测试集的脚本等等。这通常需要配合 AGENTS.md 的修改,让智能体知道这些工具的存在。
这就是我目前的现状。每当我看到智能体做错事,我都会认真投入精力去防止它重蹈覆辙。或者反过来,我会竭尽全力确保智能体能够自行验证大方向上它做对了。
在执行第五步的同时,我还在朝着一个目标努力:让智能体始终保持运行。如果当前没有智能体在工作,我会问自己:“现在有没有什么事是智能体可以帮我做的?”
我特别喜欢把这种模式与那些速度较慢、思考更深的模型结合起来,比如 Amp 的深度模式(本质上就是 GPT-5.2-Codex),它可能需要 30 分钟以上才能完成一些微小的改动。但好的一面是,它产出的结果通常非常出色。
我目前还没有(或者说还没打算)跑多个智能体。我觉得维持一个智能体运行对我来说是一个很好的平衡点,既能让我享受深度手动工作的乐趣,又能顺便照看我那个有点笨拙但又高效得不可思议的机器人朋友。
“让智能体始终运行”目前还只是一个奋斗目标。我想说现在我也就只能在 10% 到 20% 的工作时间里让后台保持有智能体运行。但我正在积极尝试提高这个比例。
我不想为了跑智能体而跑。我只想在有真正能帮到我的任务时才启动它们。这个目标的挑战之一在于完善我自己的工作流和工具,以便我能量产出高价值的任务流供智能体执行。哪怕没有 AI,这一点其实也很重要!
这就是我今天的状态。
通过这段历程,我个人已经在现代 AI 工具的使用上取得了成功。我相信我正以一种基于现实、分寸得当的视角来看待它。我其实并不在乎 AI 是否会一直流行下去,我只是一个单纯因为热爱而想要创造东西的软件匠人。
整个行业的发展瞬息万变,我相信不久后回过头来看这篇文章,一定会嘲笑现在的自己多么天真。但正如人们所说,如果你不会为过去的自己感到尴尬,那你可能就没有在进步。我只希望我进步的方向是正确的!
我在这件事上没有任何利益关联。当然,除了实用性之外,肯定还有其他理由让人选择避开 AI。我完全尊重每个人的个人决定。我不是来游说你的!对于感兴趣的人,我只是想分享我探索这些新工具的个人方法,并让大家管中窥豹地看看我是如何面对任何新工具的,无论它是否与 AI 有关。
译者:boxi。
