浏览器成了 AI 主战场,但我劝你别乱换
1 小时前 / 阅读约10分钟
来源:36kr
2026年浏览器成AI行业热门战场,美团Tabbit、阿里夸克、字节豆包三款产品被测。测试从基础浏览、AI对话、Agent自动化等方面展开,Tabbit总分82.35,适合职场人;夸克总分57,适合学生;豆包总分59.8,适合大众用户。

2026年,浏览器成了AI行业最热闹的战场。

美团做了Tabbit,阿里升级了夸克,字节推了豆包。对外口径出奇一致,这不是浏览器,是AI Agent:能懂你、帮你、替你操作网页。

听起来很诱人。但当我把三款产品放在同一台电脑、同一个WiFi下,全部未登录,跑了一整天真实工作流之后,结论比想的还要两极:

有的连网页都抓不准,有的把"深色模式"做成登录福利,有的确实能替你跑出Excel表格。

一句话:一家真会,一家诚实说不会,一家在假装。

测试从全部未登录开始,这是底线——如果一款浏览器连"打开就能用"都做不到,它所谓的"免费"就有水分。

基础浏览:10个站点过关,顺手又开了几个常用页

先验证基本功。B站看视频、知乎刷长文、微博追热点、虎嗅读资讯、京东淘宝看618预热,再加上几个常用站。三款都是Chromium内核,10个站点全部正常打开,视频、弹幕、电商弹窗都没问题。

兼容性过关后,我顺手又打开了自己常用的后台和资讯站:少数派、GitHub、Stack Overflow、36氪、钛媒体,再加上前面已经开着的标签,凑到15个。这时候差距出来了:Tabbit和夸克内存都控制在1.6GB左右,豆包直接冲到2GB+。多出来的400MB不是白占的,但用户得到了什么?一个更空的启动页。

随后打开TechCrunch看一篇英文报道,翻译和广告拦截的差异显现出来。豆包最积极,自动汉化导航栏,双语对照直接呈现。夸克有手动翻译面板,还算好用。Tabbit没触发自动翻译,得手动找。广告拦截也是,虎嗅首页三家都干净,但Tabbit在TechCrunch漏了七牛云CDN横幅。

夜间模式有个意外发现。 Tabbit和夸克在设置里直接能找到。豆包在未登录状态下翻遍设置没有,直到后面找隐私设置时,才发现登录后突然冒出了"深色模式"选项。一个深色模式也要靠登录解锁,这个"免费"的边界感,豆包划得很暧昧。

这一模块,夸克表现最稳,拿到85分;豆包82分,输在内存和夜间模式门槛;Tabbit 78分,翻译和广告拦截有短板。

AI对话:Tabbit弹窗要登录,豆包数学推导最清晰

下午开始测AI大脑。此时三款均未登录

三点钟,咖啡送到。我顺手找了篇中国咖啡产业的深度分析,将近3000字,有数据、有时间线、有品牌案例,适合测总结能力。要求三款AI控制在300字内,分点列出。

Tabbit直接弹窗:请登录手机号。这是整个测试里第一个实质性门槛,夸克和豆包未登录就能用AI,Tabbit必须登录。登录后,Tabbit的总结最全面:四阶段演进、供应链细节、文化悖论全在。但字数飙到500+,把"300字内"当耳旁风。豆包最均衡:四阶段骨架保留,字数合规,数据准确。夸克最简洁,但丢了原文最核心的"四阶段"时间线,且把"35年历史"和"2600亿市场规模"并列,容易让人误解。

矛盾数据陷阱(用户数增300%,收入只增20%): Tabbit分析最深入,但极度冗长,飙到1200字+。夸克简洁有力,但冒出一句"复购率不足15%",无推导过程。豆包唯一做了数学推导:设2023年为A×P,2024年客单价=0.3P,暴跌70%。量化感最强,逻辑最清晰。

多模型对比是Tabbit独有卖点。让DeepSeek、Kimi、GLM同时回答"咖啡为什么没替代茶",三家给了三个不同角度:DeepSeek讲"场景割裂",Kimi讲"互补关系",GLM讲"文化身份"。夸克和豆包的单模型给不出这种横向视角。

连续对话记忆 测了三轮。第一轮自我介绍 "我叫刘五,从事新媒体运营",第二轮要选题,第三轮要大纲。Tabbit和豆包全程记得"刘五"和"第一个选题"。夸克未登录时前两轮正常,第 三轮生成大纲时强制弹窗要求登录夸克网盘,登录后才完成。这说明夸克的免费零门槛有深度限制。

创意写作要求写一段加班到凌晨的文字,禁用"悲伤""难过""孤独"。Tabbit画面感极强:"键盘推进显示器下方,顺手捏了捏后颈,那里硬得像块石头""感应灯啪地亮了一排,又在他走过之后一段段熄灭"。夸克文艺腔。豆包翻车:"心里没有波澜,只剩一份踏实的释然",感受词堆砌,套路化。

这一模块,Tabbit内容质量最高但扣分在字数控制和登录门槛,拿到82分;豆包80分,数学推导和未登录体验是亮点;夸克75分,第三轮登录打断是硬伤。

Agent自动化:这是真正的分水岭,也是照妖镜

继续测核心能力。此时Tabbit已登录,夸克在连续对话测试中已经登录,豆包仍保持未登录。

知乎热榜提取:Tabbit:自动访问zhihu.com/hot,提取前5个话题,附带热度数据,还能导出Excel。内容与实时页面完全一致。 夸克:诚实回答"我无法直接访问实时网页"。 豆包:灾难级幻觉。返回的5个热榜话题与实时页面完全不符:张雪机车、蒸汽机、日本炸鸡店、微信收费、NBA总决赛,全是编的。且自信标注"结合当前知乎热榜实时数据"。

跨页比价(京东vs淘宝,蓝牙耳机):正好快618,我想买副蓝牙耳机,在京东和淘宝之间比价。Tabbit:Agent全自动。开标签→导航→搜索→截图→提取→生成Excel表格,带颜色区分和货币格式。不到5分钟,零人工干预。 夸克:诚实承认"无法直接控制浏览器"。 豆包:给了一份"操作步骤+比价表格模板",但表格是空的,下方"示例"数据是模拟的。用教学文档假装Agent能力。

复杂任务(36氪+钛媒体文章提取):Tabbit:自动打开36kr.com和tmtpost.com,提取首页前5篇文章标题和发布时间,生成Excel。全程仅需最初点击"执行"确认。 夸克和豆包:无此能力。

这一模块是分水岭。Tabbit拿到95分,夸克30分,豆包15分。夸克和豆包得分低不是因为"做得差",而是因为"没有这项能力"——它们目前只提供AI对话辅助,无法操作网页。

微信文章导出:测了两轮,夸克两次都抓来同一份错误文档

测试微信文章导出时,第一轮指令是"整理为正式文档"。结果Tabbit和豆包都做了AI二次加工,不是原文直出。夸克导出的文件标题变成"微信公众号文章下载器 STDT v3.0"——这是一个真实存在的开源爬虫项目,但与我们给的原文《周靖人没走,但阿里AI的决策层正在慢性消耗》毫无关系。

第二轮修正指令:"不整理,直接原文导出。"

Tabbit:听懂指令,输出DOCX+PDF双格式,42段落/6页内容完整。但丢失大小标题,无图片。 夸克:仍然给了那个"微信公众号文章下载器 STDT v3.0"的文档,和第一次一模一样。巧合的是,这篇原文恰好涉及阿里内部人事变动,而夸克作为阿里系产品,两次导出都出现内容错位,对微信生态内容的抓取存在系统性兼容障碍。豆包:这次没有生成任何文件,只给了一份"手动操作指南",让你自己复制粘贴到Word里。它坦诚了自己"无法远程访问外部网页抓取原生源码",但这也意味着,在"直接原文导出"这个需求上,豆包交了白卷。

这一模块,Tabbit 70分,豆包55分,夸克20分。

生态捆绑与隐私边界

生态测试方面,Tabbit搜"外卖"首条美团、次条京东外卖,右侧联想词中立,捆绑程度3/10;夸克搜"网盘"首条夸克网盘带"官网"蓝标置顶,右侧有"夸克热搜"自家栏目,捆绑程度6/10;豆包搜"抖音热点"首条抖音但无强引导,捆绑程度2/10。这块涉及平台导流,观感像广告,原始截图就不放了,需要原始记录的读者可以找我要。

隐私与性能方面,三款均未触发免费额度限制。高负载稳定性过关,一天测下来无闪退。隐私设置方面,Tabbit和夸克都有无痕模式,豆包在隐私政策里也有相关选项。

这两个模块合并,Tabbit 80分,夸克75分,豆包78分。

总分与最终判决

五个模块按权重加权,最终得分如下:

Tabbit总分82.35。适合愿意折腾的职场人、数据分析师、运营。Agent自动化是真能力,多模型对比是真差异化。代价:必须登录,对"字数限制"类指令遵循度差,基础工具有短板。它像一台功能强大的专业设备,上限高,下限也有明显缝隙。

夸克总分57。适合学生、轻度用户。网页翻译好用,广告拦截干净,分析简洁有力,诚实不幻觉。但Agent能力为零,深度内容触发登录弹窗,生态捆绑感最强。它是个"好用的AI搜索框",不是Agent。

豆包总分59.8。适合大众用户、零门槛尝鲜。未登录体验最完整,数学推导清晰,自动翻译积极。但Agent能力灾难级(幻觉+伪装),创意写作套路化,内存偏高。它是"最友好的AI聊天窗口",但千万别让它帮你操作网页,它说的"实时数据",可能是编的。

最终结论:如果你需要的是"能自动填表、比价、抓数据、导Excel的数字实习生",Tabbit是唯一选项。如果你只需要"一个干净、诚实的AI搜索助手",夸克比豆包更可靠。Agent浏览器的战争才刚开始,目前市面上的产品,上限都在快速提高,下限却参差不齐——选谁,取决于你能容忍哪种错误。