IT之家 11 月 26 日消息,Anthropic 昨日(11 月 25 日)发布研究报告,通过分析旗下 AI 模型 Claude 的十万次真实对话,发现任务完成时间平均缩短约 80%。
该研究目的是量化 AI 在真实工作场景中对生产力提升的具体效果。研究团队采用了一种保护用户隐私的分析方法,抽样分析了十万次来自 Claude.ai 用户的真实对话记录,通过让 Claude 估算这些对话中涉及任务的完成时间,研究人员得以对比有无 AI 协助下的效率差异。

根据 Claude 的估算,如果没有 AI 协助,用户处理的这些任务平均需要 90 分钟才能完成,而在 Claude 的帮助下,任务完成时间平均缩短了约 80%。
这些任务大多较为复杂,例如法律咨询、企业管理等,平均耗时接近两小时;而一些较简单的任务,如餐饮筹备,耗时则在 30 分钟左右。
研究还发现,AI 在不同领域的提效能力存在差异,例如在医疗辅助任务中,AI 能将效率提升 90%,但在硬件问题处理上,效率提升则为 56%。



研究团队将这些任务层面的效率提升数据外推至整个美国经济。他们使用标准经济学模型进行测算,结果表明,如果普及当前一代 AI 技术,有望在未来十年内推动美国劳动生产率实现 1.8% 的年均增长。
这一数字几乎是美国自 2019 年以来年均增长率的两倍,也处于近期同类研究预测范围的上限。不过,研究人员强调,这并非对未来的精准预测,因为它并未考虑 AI 模型的普及速度以及未来技术进步可能带来的更大影响。
数据显示,AI 带来的生产力提升主要集中在知识密集型行业。其中,软件开发人员的贡献最大,占总生产率增益的 19%。紧随其后的是运营经理(约 6%)、市场研究分析师(5%)、客户服务代表(4%)和中学教师(3%)。
相比之下,餐饮、医疗服务、建筑和零售等行业的任务在数据样本中占比较低,因而从当前 AI 应用中获得的直接生产力提升也相对有限。
该研究还指出了一个重要现象:AI 能够显著加速某些特定任务,但对其他任务的帮助则相对有限。例如,AI 可以帮助软件工程师高效编写代码和文档,但对于协调系统安装、监督工程师等任务却作用不大。
这意味着,随着 AI 普及,那些难以被 AI 加速的“瓶颈”任务,可能会在整体工作流程中占据更大比重,从而成为制约生产力进一步增长的关键因素。
Anthropic 承认该研究存在局限性。首先,Claude 的估算并非完美,且无法核实用户在与 AI 对话之外所花费的额外时间(如验证 AI 生成内容的准确性)。其次,模型假设 AI 被普遍采用,而这在短期内难以实现。
尽管如此,这项研究建立了一套可持续追踪 AI 经济影响的测量框架。随着 AI 技术不断进步和应用范围扩大,该框架将为我们理解 AI 如何重塑经济提供一个动态且宝贵的视角。
IT之家附上参考地址
Estimating AI productivity gains from Claude conversations
Estimating AI productivity gains from Claude conversations [PDF 文件]
