IT之家 4 月 14 日消息,MiniMax Agent 是一个能完成长程(Long Horizon)复杂任务的通用智能体,官方称其能多步规划出解决方案、拆解任务需求、并能执行多个子任务从而交付最终结果。
MiniMax 官方今日发布了 MiniMax Agent 桌面端两项更新:
Pocket 功能上线(Beta 版),支持接入飞书、微信、企业微信、Slack 等主流 IM 通讯软件,让桌面智能体可以随身携带。用户在 IM 中唤起 Pocket 并发送指令后,Agent 即在其电脑上执行任务,并将结果回传至原对话。
Computer Use 功能上线,Agent 可以像人一样看屏幕、操作鼠标和键盘,直接操作用户电脑上的软件。本地安装的设计工具、内部的报表系统、藏在偏好设置中的开关、需要在多个应用之间手动衔接的流程 —— 这些过去 Agent 难以触达的任务,现在都可以由它完成。
官方分享了多个使用场景,IT之家列举如下:
远程找文件:Agent 在用户电脑的桌面上定位文件,找到后将文件直接回传到原对话。用户在地铁上、会议中、出差途中都可以用同样的方式取用本地文件,不需要打开电脑。

筛选简历并生成飞书文档:Computer Use 负责在用户电脑上读取 Resume 文件夹中的本地文件并理解每份简历的内容,飞书 CLI 负责将最终的候选人分析与面试题结构化写入飞书文档。Agent 完成后将文档链接回传至原对话,用户点击即可查看。

操作本地应用与系统设置:Agent 基于 Computer Use 打开系统设置、定位到“锁定屏幕”面板、调整下拉菜单,随后启动客户端执行任务,最后截图回传。整个过程可以在 IM 中完整查看 Agent 的每一步操作。

相关阅读:
《MiniMax 开源 M2.7 模型,AI 自主训练与复杂任务能力再突破》
