就在今天早上,ChatGPT 开始推出了更新,开始允许用户下载浏览器使用,并且在ChatGPT的对话页面给出了弹窗,并且可以下载,于是我下载了。
我第一时间完成了下载并安装
如下是下载安装界面
下载安装完成之后,就可以看到其鼠标的logo,并且取名为Atlas,“Atlas”是源自希腊神话的一个名字,意为“支撑天地的人”,可以看见这个浏览器的确达到了这个身形聚会的含义。
通过下面几个任务案例,我相信你可以将AI浏览器的Agent模式,就是未来人来的贾维斯与办公模式。基于我做产品经理工作日常场景,我将这款浏览器做了几个测试,包括自动撰写公众号、原型设计、项目管理、以及浏览器常用网页打开。
在第三方应用打开之前,第一次使用会提示安全风险,提示了授权登录到ChatGPT的相关风险。
小红书授权登录:
开始小红书发帖:
登录小红书创作平台 :
完成小红书的帖子发布 :
可以看到帮我写了自动化操作手册的步骤笔记,是小红书自动化发布,同时,并且整个任务通过对话完成,每一次对话都会通过视觉模型来完成下次操作,并且确定任务的完成的情况。
在任务中会提示是否要让小红书交付给ChatGPT来完成控制 :
支持按钮锁定,并且一键排版,可以支持排版选择,然AI点击某个按钮完成操作,进行发布。
如下是最终发布成功的效果,可以看到再利用小红书官方的自动化排版,AI浏览器点击排版之后就完成了发布。
期间用户可以选择继续被接管或者暂停接管。
不过从现在来看,笔记的图片插入还是有缺陷,需要用户自己准备好图片来让AI插入完成,并不能让Agent自己生成图片再完成图片上传。
再来一个升级话的任务,让其AI帮我打开我小红书的毕竟数据量较高的毕竟,帮我单独打开,如下是笔记的任务筛选。
浏览器Atlas,打开了浏览器,并且查询到我笔记阅读量数据较高的(估计是用视觉模型分析)就可以帮忙整理出来,帮我点击与筛选。
如上是帮我筛选出来的阅读量较高的笔记,并且在对话框可以查看缩略图的对应URL链接,用户可以查看。
这里也同样的任务完成自动化发布Twitter,输入任务命令之后开始打开Twitter,并且开始撰写消息。
如上是发布成功之后就可以点击查看消息可以看到自己的消息内容。如下图是完成对应的任务,可以看见自动化发布海外产品就会非常流畅,可以更快的发布成功。
这里我开始自动化办公任务测试,访问我产品经理常使用的原型工具masterGO,通过授权访问master go登录之后,就可以查看对应的项目以及项目里面的UI文件。
和小红书一样,涉及到登录注册的地方会交给用户来完成操作,其次需要开始打开对应的原型页面设计,并且打开UI设计图,完成查看。
如下是AI浏览器agent模式到对应的UI设计图页面开始查看对应的数据页面,并且查找数据页面,最让我吃惊的是在项目里有多个vision PRo的项目,他可以逐步打开每一个项目进行检索。
如上图是检索的过程与步骤,可以看到几乎可以帮我快速定位。曾经做UI设计的协作,我作为产品经理经常会找不到对应的设计图与项目地址,这下有了AI,几乎就可用帮你完全定位了,寻找UI设计图,并且即使UI设计图没有命名,也可也图像识别来查找。
打开teambition需要首先先注册登录,并且完成授权之后就可用登录了,如下是对应的完成任务创建与卡片进度监控。
通过AI浏览器的agent模式,可以快速的完成各个卡片的任务创建与完成状态,并且在卡片上并没有创建文案,而只有编辑文案。AI仍然能够识别出来,完成卡片创建的
同样的我开始使用这款浏览器完成figma的使用,和原型工具不同的是,这一次是用AI浏览器来完成AI功能的使用,也就是用AI使用AI,如下是将其打开
在AI上使用AI是什么效果呢,我看到了ChatGPT Atlas的效果,将其在figma maker上完成一个产品的编码任务,如下是AI浏览器使用figma maker完成AI对话使用,通过 AI浏览器完成AI对话,完成一个产品的自动化生成,几乎就不需要再次生成功能了。
任务完成技术对接 :
AI任务编写 :
自动化任务的创建,并且真的做到了指导figma maker来完成一个项目工具的生成 :
如下将其项目还可以继续完成数据库配置与项目发布,最终就得到了自动化病历评级的工具。
接下来就会按照这个发展几乎每一个人使用的工具,并且完成人机与协同。
从现在来看,使用 Atlas自动化浏览器办公,还有一个较大的锁点就是账户体系,因为现在AI需要兼容以往非AI功能的所有账户密码,现在的流程体系是用户使用AI浏览器,然后再各自鉴权各自产品的账户密码。
也就是现在的最大卡点仍然是账户密码授权,用户需要在浏览器里重新完成一次密码校验,而有的校验根据第三方产品的安全策略不同,有的需要验证码,有的需要扫码,有的账户密码就可以了。
由于现在的第三方账户密码与AI没有形成对应的标准形式,只能通过开放平台或者跳转到第三方的链接完成,有开放平台的用户还可以快速通过授权通过,而第三方链接的就只能重新走一次安全校验。
账户体系大统一必定会出现,AI浏览器或者AInative的产品账户与第三方产品的账户联通,类似于MCP的方式。
不需要用户再重新操作一次前端界面
现在在国内产品的使用上,现在atlas的产品使用限制还是很大,比如对于国内产品的授权与鉴权机制相较于国外都是用谷歌或者Facebook等,国内的一键登录就几乎要重新来
这篇文章的排版也是来ChatGPT Atlas排版的,也就是以往在SaaS上的产品,你几乎都可以让atlas来完成,尤其是那些自动化的项目管理,现在你可以交付给AI来完成,如果自己没有做AI功能,那么就让浏览器AI来完成操作,也就是你只需要做好单元功能模块即可。
从这款产品可以看到,未来AI产品的最终产品形态就由2个组成,分别是AI模型底座作为后端而前端则作为AI产品的浏览器或者原生native的APP。
浏览器可以拿到几乎硬件终端的所有权限,而但是如果想要更强的GPU性能等,浏览器仍然是有限制的,但现在来看用网页端AI运行的大型游戏也几乎没有。
从前端来看,产品经理需要将其罗列在AI 浏览器Agent模式中会出现的交互组件,从对话组件,再到这次ChatGPT发布的自动化浏览器任务操作的终止、密码输入、账户鉴权、以及交互提示等组件,都需要产品经理来设计。
让用户可以在native的 AI对话框或者通过语音模式、视频模式来完成AI的内容输入与数据输出。
最后,这些组件都会放在我的AI产品经理训练营里进行拆解,并且介绍相关组件的模块设计。
通过AI浏览器的Agent的模式,再加上底座的模型ChatGPT6或者ChatGPT7,我相信就连产品经理这个职位可能都没有存在的必要了。因为一切的任务来自于一个需求,而需求的本质上是一个问题,发现问题的能力几乎每个人都有。
而不是需要特定的产品经理,曾经产品经理最引以为傲的需求翻译能力,有了AI浏览器与Agent模式,就不存在了。
今天的分享就到这里。