Claude Code为什么好用?界面的认知成本
9 小时前 / 阅读约7分钟
来源:36kr
AI能力远超想象,但聊天机器人界面增加认知成本,阻碍AI潜力发挥。专用接口和个人代理展现新方向,未来AI将根据用户需求调整界面,消除认知摩擦,提升使用体验。

AI的能力被浪费了

AI的能力远超大多数人的想象。但大多数人接触的不是真正的AI。他们用的是弱化版:聊天机器人,甚至很多人使用的是免费版。

聊天机器人确实很快。能快速回答问题。但它不适合完成实际工作。

这个观察很容易验证。最近一项研究让金融专业人士用 GPT-4o 做估值任务。研究者每一轮都测量他们的认知负荷。

结果很清晰,AI提高了效率。但付出了代价,认知成本很高。

为什么?因为聊天机器人呈现信息的方式有问题。你提一个问题,得到五段文字,不断的提示,冗长的对话。答案藏在某处,你要自己挖。AI 还会告诉你三个你没问的新信息。

界面本身成了障碍,不是工作内容。

一旦对话变混乱,就很难理顺。为什么?因为 AI 只是复制用户提供的混乱结构。而用户因为不堪重负,无法重新整理。双方都在加剧问题。

受害最大的人是谁?经验不足的员工。他们本应从 AI 那得到最大帮助。反而因为界面混乱更加迷茫。这很讽刺,如果他们能清楚地知道自己在用什么,他们本该能从 AI 那里受益。

专用接口

如果你用过聊天机器人做任何实际工作,你就懂,界面本身造成的认知成本,远远超过了人工智能智能带来的好处。

大多数人关注「AI 能做什么」。很少人问「人该怎样与 AI 交互」。后者往往比前者更重要。

一个好界面不是提供更多功能。一个好界面让你用已有的知识,去做新的事。现在的聊天机器人界面要求相反——你得学会新的交互方式,学会怎样「提示」,学会理解长篇回答。

这些都是额外成本,这个成本是「认知负荷」。新界面本身就是一项重认知任务。

那么,更好的界面应该是什么样的呢?

真正成熟的专用 AI 界面只有一类:编程界面。

Claude Code、Codex、Antigravity 都很出色。为什么?因为 AI 实验室由程序员组成,他们为自己造工具,所以这些工具理解程序员的思维方式。

人们可以用 Claude Code 做很多任务,全程不写一行代码,Codex 也很实用。

这些工具都很棒,目前也出现了很多为某一个行业单独打造的专用界面。

比如,Stitch 暗示了 AI 原生设计的未来:一个无限画布。用自然语言描述应用。AI 生成多个相互关联的屏幕,统一设计系统。

Pomelli 让营销人员粘贴网址。自动生成符合品牌调性的社交媒体文案。用营销语言,不是提示式语言,更好理解。

NotebookLM 提供了研究和处理信息源的新方法。

这些都展现了方向,但还远不是像 Claude Code 那样对程序员有变革意义的工具。

还有另一种界面在爆炸式增长,个人代理。

利用已有的界面

OpenClaw 是一款开源人工智能代理,它的标志是一只红色龙虾,安全隐患重重,但却成为了历史上增长速度最快的开源项目。

为什么这么成功?因为它做了一件看似显而易见的事。

它没有造新界面。它连接 WhatsApp、Telegram、Slack、wechat、飞书等软件。你每天都在用的,已经非常熟悉的。

你在飞书中与 AI 对话,就像与同事说话。你让 AI 查邮件,预订餐位,找文件。它就在你电脑上完成,都在你已经熟悉的地方。

为什么这个想法这么强大?

每次你打开新应用,你的大脑做一个叫「任务切换」的操作,需要加载新规则,在神经学层面有成本。

研究表明,每次切换削弱接下来的专注力 5 到 15 分钟,一天 10 次切换,你损失 50 到 150 分钟专注力。

但你已经懂 WeChat 了。不需要学任何新东西,认知摩擦消失了。你用已经懂的方式与 AI 交互。

OpenClaw 也有问题,难以使用,安全隐患严重。Anthropic 的解决方案是 Claude Cowork 和 Dispatch。

Cowork 于今年一月发布,是面向知识工作者的 Claude Code 版本。它允许 Claude 通过桌面工作区访问你的本地文件和应用程序。它还可以通过连接器连接到数十个应用程序,如果没有连接器,则会直接控制你的鼠标和键盘。

最近几周推出的 Dispatch 添加了关键功能:你可以在 Claude 在桌面上工作时通过手机向它发送消息。只需扫描二维码,手机即可成为远程控制位于电脑前的 AI 代理的工具。

Dispatch 和 Claude Code 的组合使用,打造出如同与一位得力助手对话般的界面。例如,我用手机让 Claude 准备一份晨间简报,它会读取我的日历、邮件和在线渠道,然后生成一份关于我下一步需要做什么的报告。

与 OpenClaw 偶然发现的洞察相同:人们想要的不是聊天机器人,而是一个能够处理他们实际文件、使用他们实际工具、并且像他们与人交谈一样易于访问的代理。

按需接口

这一切都假设我们需要预先决定界面。但最新的 AI 系统实际上可以为你构建界面。例如,在过去几周里,Claude 获得了在对话中直接生成可视化内容的能力。这些并非静态图像,而是交互式的、可调整的,Claude 可以根据你的后续问题进行修改。

这是一种不同的界面解决方案。以往企业需要为每种工作都构建专门的界面,而现在人工智能可以即时生成合适的界面。

未来不会出现一个包罗万象的界面,而是人工智能根据具体情况生成合适的界面,例如桌面上的智能助手、对话中的图表,或是用于解决问题的定制应用程序。

我们正在从适应人工智能的界面,转变为让人工智能根据用户的需求调整界面。

问题的本质

所有这些改变背后有个被广泛忽视的观察:AI 能力的发展一直领先于普及程度。

这些模型足够强大,足够聪明,能完成非凡的任务。

但我们一直让人通过聊天机器人来用它,聊天框,文字输入,大段的回答。

认知负荷研究很清楚:聊天机器人形式实际上阻碍了 AI 潜力的发挥。

随着界面改进,什么会改变?当更多人真正能用 AI 能力时会发生什么。

每个消除部分认知摩擦的新界面都会让人感觉 AI 能力突然提升。即使模型本身没变,即使它仍在发展。

所以当人们说「对 AI 失望」时,这失望从何而来?我猜它不来自 AI 本身弱,它来自界面设计差。

我们创造了近代最强大的技术之一,却让人通过聊天框输入文字,这很荒谬。这会改变的,很快。