千问会是阿里的豆包时刻吗?
5 小时前 / 阅读约9分钟
来源:36kr
阿里千问App上线两月月活破亿,支持语音下单、餐厅订座、旅行规划等功能,接入淘宝、支付宝等阿里生态业务,覆盖消费、政务、办公、教育等场景。

“如果这场发布会没有人就完美了”有互联网人士看完阿里千问的发布会评价道。

这句话调侃的是发布会谁讲了什么不重要,重要的现场演示做了什么。毕竟过去所谓的AI重造一切的发布会讲话已经听过太多了,可是实际落地往往都是期货产品。

1月15日,在千问产品发布会上,阿里巴巴集团副总裁吴嘉反复强调一个核心变化:在AI时代,面向用户的服务将直接承载需求本身,用户不再需要拆解任务、切换应用,办事这件事将由AI完成。

这种判断依然是老生常谈,但是让人眼前一亮的是阿里在发布会现场选择了一种更具象的验证方式。吴嘉在现场用千问下单了40杯霸王茶姬,他表示:“希望用千问来办事从一杯奶茶开始。”

同样的公开演示,可能还要追溯到前荣耀CEO赵明用手机一句话点瑞幸,但是后来的结果大家都知道了。可能是担心大家觉得这次的点单也是发布会概念,因此在大会现场,千问宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,并向所有用户开放测试。

发布即全面开放,大厂的底气还是搞邀请码的小厂比不了的。官方数据显示,此次千问App上线400多项新功能,主要覆盖超级生活管家,超级工作搭档、超级家教三个场景。如果简单认为只是一次功能堆叠,可能会低估这次更新的实际意义。

几天前,谷歌宣布将与沃尔玛等零售商推进AI购物合作计划,但目前尚未上线。

海外的AI办事进度受制于超级企业的集成度。在此之前,谷歌还联合Shopify、沃尔玛、Target以及Visa、Stripe等支付机构,发布“通用商业协议”(UCP),试图为AI智能体建立一套跨平台的通用商业语言。

所谓UCP,主要是指为AI智能体建立通用商业语言的开放协议。对比还在拉通开放协议的海外大厂,阿里多年前买买买攒下的商业帝国底蕴,在AI时代倒是先跑通了自有生态的生活工作两不误的闭环。

01 千问打包阿里全家桶

豆包手机收尾了2025年的大厂AI热潮,以硬件形态封装豆包的能力,带动了市场对AI智能体形态的新一轮想象。

进入2026年,阿里推出新版千问App,也有人将其称为阿里的豆包时刻。尽管和豆包不同,千问并不依托操作系统,而是作为一个App形态的AI执行中枢,试图将阿里系业务打包为一个可调度的AI体系。

但是受益于阿里生态的业务覆盖面,千问仅通过自有生态的软件调度,几乎就实现了豆包手机的大多数实用功能。

比如点外卖。千问App此次最大特征是减少人工操作、打通执行链路。发布现场,阿里副总裁吴嘉通过语音指令完成下单 40 杯奶茶,全程在千问内完成商品选择与支付,不经过淘宝或支付宝页面跳转。

在此前的AI产品中,这一环节通常依赖第三方跳转,千问通过接入自有生态的淘宝闪购实现了交易体验在千问端内的闭环。

系统还支持多人下单的个性化拆解:对于多人点单任务,可自动生成多种口味与品牌组合。产品经理在现场展示面对公司级等多人点外卖奶茶时,千问会提供不同的方案,满足不同人喝不同口味及品牌。

不仅人动嘴,AI开口说话也要够真。

发布会现场,通过千问APP定餐厅,AI不仅能帮你挑选餐厅,并且能语音致电餐厅帮你定座。现场展示的AI打电话到餐厅定座的录音回放,声音自然逼真。餐厅老板似乎并没有听出来是在和AI对话。

再比如多任务场景下,千问还具备串联多个业务节点、完成复合型任务的能力。

在旅行场景中,用户输入“春节带家人去三亚旅游”,千问系统会联动飞猪、高德能力,生成机票、酒店、导航、打车与餐饮一体化解决方案。

与以往的“卡片推荐”不同,系统会提供多个路径方案,支持用户按价格或偏好调整组合。

从“提供商品”到“生成方案”,这一动作的组织逻辑明显更靠近自动化执行而非内容理解。

在购物决策场景中,千问也开始接入更多上下文维度。用户输入“我要去东北四姑娘山徒步”,系统会分析关键词意图、调取淘宝数据库商品与评论,并结合天气等外部条件生成装备推荐清单。

此类能力本质上构建的是阿里多业务体系与AI接口之间的理解→选品→下单流水线。

买买买的吃喝玩乐个人消费场景之外,千问还打通了蚂蚁集团的生活服务,给个人生活办事助力。

除消费场景外,千问也可以调动支付宝生活服务体系的接口。

目前千问已接入50项常见民生事务,包括签证办理、户口迁移、公积金与医保查询等。

用户输入“杭州户口如何办护照”,系统将自动给出办理路径、材料清单并引导跳转至政务服务页。

连接蚂蚁生态的千问,在功能定义上进一步从消费AI覆盖到生活AI。相比过往通过搜索、等方式完成服务链条,千问试图建立的是一个能接住用户模糊意图、并自动引导流程的办事平台。

除了用千问串联阿里生态,打包阿里所有业务之外。基于AI大模型本身的通用能力,千问也在办公、教育等场景进行功能迭代。

与消费和政务不同,办公场景强调的是对信息结构的理解、拆解与重构。千问的处理方式更接近自动流水线,而非问答交互。

发布会展示中,用户将100张电子发票拖入对话框,系统可通过单句指令“帮我整理成台账”自动提取开票方、金额、日期等关键信息字段,输出一份可直接使用的Excel表格。

在教育场景,千问强调“助教”定位而非替代教师。产品能力覆盖:智能出题、一句话找卷、作业批改、错题分析、知识讲解等20多项教学功能。千问认为AI不具备取代教师与学生之间情感链接的能力,其目标是通过工具形式,增强教师效率、实现教学公平。

如果说豆包手机提供了一个硬件Agent的产品形态想象,那么千问则更像是一次应用级操作系统的落地演示。

02 AI下半场的十字路口

尽管模型演进未止,但C端应用层已经悄然进入下半场语境:用户对模型的评价标准,从能力指标变成了使用体验;开发者在意的,不再是训练规模,而是能否支撑高频、稳定、低延迟的真实任务。

去年4月,时任OpenAI研究员姚顺雨写了一篇博客《The Second Half下半场》,他认为:“AI的下半场将把重点从解决问题转向定义问题。在这个新时代,评估将比训练更重要。”

有媒体从业者认为这番AI下半场的言论,或许是其在去年底被腾讯以高价收入囊中的关键性方向。在最新的清华分享上,延续这个思考,姚顺雨进一步阐述了下半场在To C领域的思考。

在分享中提出To C领域,模型的“聪明程度”与产品的“用户数”之间不一定正相关,甚至可能负相关。对C端用户来说,陪伴感、效率感、互动趣味性可能比智能性本身更重要。这导致C端Agent的演进路径更依赖产品理解与场景打磨。

目前腾讯与阿里,两家大厂正在用完全不同的策略切入这一阶段。

腾讯的元宝更多作为组件存在,被嵌入微信搜索、输入法、腾讯文档等多个原子功能中。今年2月,元宝一度出现在微信九宫格入口,但并未联动京东、美团、拼多多等服务形成完整闭环。

但时至今日,元宝仍缺少阿里千问的这种融合,腾讯的思路依然以“AI能力嵌入”为主,不打算重塑界面,这可能更符合张小龙原子化的理论。反观阿里的千问,则更像是阿里结合生态业务能力打造的AI时代的超级APP。

在消费、出行、政务等场景中,千问不是嵌入某个环节,而是主导用户的整个对话流程。淘宝、闪购、高德、飞猪、支付宝这些原本彼此独立的服务接口,被千问重新组织成一个服务逻辑统一的Agent操作系统。

值得注意的是,这种产品形态或许与阿里过去一年的组织结构调整有关。2025 年,阿里重组消费业务,淘宝接入飞猪、饿了么等服务模块,强化大消费平台定位。千问正是在这一整合基础上,通过 AI 的交互模式,完成了一次交互结构与业务逻辑的重排。

腾讯选择了保守整合,阿里押注激进重塑。两条路径,延续了二者在移动互联网时期的产品基因分野。上线不到两个月,千问C端月活跃用户突破1亿。

回看2025年,中国AI市场的大厂声量,主要集中在字节豆包的两次出圈:一次是豆包手机重构AI硬件想象力,一次是豆包登上春晚,把一个日活过亿的产品推到台前。

尽管字节在模型榜单上的排名并无绝对领先,但它确实是第一个跑出To C超级应用轮廓的厂商。

现在,阿里千问打响了2026年的第一枪。只不过,这一次枪响之后,最先击中的会是谁呢?