喂饱AI,需要多少水?
2 小时前 / 阅读约8分钟
来源:36kr
AI应用扩大导致水资源消耗增加,主要来自数据中心冷却、电力生产和芯片制造。不同机构统计范围不同,结果差异大。需改进冷却方式、减少发电用水、提高芯片制造用水效率。

和AI聊上几句,究竟会消耗多少水?

在科技公司的计算里,答案可能只有几滴;在研究者的账本上,却是一整瓶矿泉水。

近两千倍的差距,不是统计误差,而是两套截然不同的计算方式。前者把目光停留在数据中心,后者则沿着电力、芯片和服务器一路追溯。

随着AI应用不断扩大,其对水资源的消耗也在持续增加。

这种消耗并不只来自数据中心的冷却,而是在电力生产和芯片制造环节就已经开始累积。

悬殊的答案

和ChatGPT进行20至50轮对话,会消耗多少水? 

加州大学河滨分校副教授任少磊的研究给出的答案是:约500毫升,相当于一瓶常见的矿泉水。 

20至50轮并不算重度使用,它可能只是让AI润色一封邮件、规划一次出行,再回答几个日常问题。 

但科技公司公布的数据远低于这一数字。

谷歌在环境影响报告中称,Gemini处理一次文本请求约消耗0.26毫升水,大约只有5滴。 

微软援引《Joule》期刊的研究数据称,一次典型AI查询所需的冷却用水为0至0.067毫升,中位数甚至不到一滴。 

同样是使用AI,一边是一瓶水,一边只有几滴,结果相差近两千倍。 

差异首先来自统计范围。任少磊指出,谷歌披露的数据主要计算了数据中心现场冷却所消耗的水,没有计入发电环节的用水。 

研究者的测算则覆盖了服务器运行所需电力带来的间接消耗。两组数字看似在回答同一个问题,实际统计的并不是同一部分用水。 

将用水量折算到“单次查询”,本身也存在局限。 

数据中心的冷却系统不会随着一次请求单独启动或关闭,而是长期持续运行。 

把一座设施的总用水量除以查询次数,只能得到一个平均值,无法准确反映某一次对话实际增加了多少用水。 

因此,“一次对话消耗多少水”很难有一个统一答案。不同机构选取的统计范围、设施所在地、能源结构和计算方式,都会影响最终结果。 

相比单次查询的估算,数据中心用水总量的变化更能说明问题。 

2021年至2022年,微软数据中心的用水量增长34%,全年超过64亿升;同期,谷歌的用水量增长20%。

两家公司都将增长原因之一归结为AI业务和相关计算需求的上升。 

这和"每次查询不足一滴水"的官方口径放在一起,就显得耐人寻味。 

单次消耗可以被压得很低,总量却在攀升。 

水到底消耗在了哪里?数据中心的冷却塔只是其中一个出口。 

要看清全貌,需要沿着产业链往上走。

被忽略的上游

AI带来的用水主要发生在三个环节:数据中心冷却、电力生产和芯片制造。

科技公司披露的数据通常集中在数据中心内部,而研究者的测算往往还会纳入供电和芯片生产过程。

统计范围不同,最终得出的数字自然存在巨大差异。

最直观的是数据中心冷却。服务器持续运行会产生大量热量,不少数据中心通过蒸发水来降温,水在带走热量后进入空气,无法直接回收。

美国内华达大学拉斯维加斯分校教授斯蒂芬·雷曼测算,一座传统大型数据中心每天用于冷却的水可达500万加仑,相当于一座两万至五万人口城镇的日用水量。

但冷却并不是全部,数据中心需要大量电力,而部分发电方式同样高度依赖水资源。

火力发电厂在蒸汽循环和冷却过程中需要消耗大量的水。因此,即使数据中心减少了机房内的冷却用水,只要所用电力仍主要来自高耗水电源,上游的用水就不会随之消失。

另一个更容易被忽视的环节,是芯片制造。

AI芯片在生产过程中需要反复清洗晶圆,以去除颗粒、金属离子和有机残留。 

一块晶圆往往要经历数十次甚至数百次清洗。任何细微残留,都可能造成线路短路或器件失效。 

也就是说,在芯片进入数据中心之前,水资源的消耗就已经发生。

任少磊的测算显示,仅训练GPT-3一个模型,数据中心现场的散热用水就达到70万升。这一数字尚未包括供电环节的用水,也未计入制造GPU芯片时消耗的超纯水。 

数据中心的地理分布,又进一步放大了这一问题。 

内华达、亚利桑那、得克萨斯、犹他、加利福尼亚和科罗拉多均面临较大的水资源压力,但这六个州仍有437个数据中心处于建设或规划阶段。 

数据中心在选址时通常更关注土地、电力和政策条件,水资源承载能力未必是首要因素。 

当越来越多算力设施落在缺水地区,AI产业的用水需求便会与当地居民、农业和其他产业争夺有限的水资源。

预计到2030年,全球数据中心全产业链的总用水量将达到9.3万亿升,相当于13亿撒哈拉以南非洲居民一年的基本生活用水需求。 

这个数字所反映的,已不只是机房如何降温,而是从芯片生产、能源供应到数据中心运行的整条产业链。 

技术之外的缺口

在上海临港小洋山以东的海面上,一座高出海平面20多米的钢铁平台正在运行。

平台下方,192个机柜、约2000台服务器被安置在海底,承担日常网络服务和AI应用所需的算力。

这是全球首个投入运行的海风直连海底数据中心。距离平台约500米,50多座海上风机通过光电复合电缆为其直接供电。

项目采用无动力冷媒循环技术,利用年均约15摄氏度的海水带走服务器产生的热量,无需再通过蒸发淡水降温。

项目负责人陈希怡测算,这座功率为2.3兆瓦的数据中心,如果采用传统冷却方式,每年约需消耗4万吨淡水。

改用海水冷却后,这部分淡水消耗可以降为零。

陆上数据中心也在寻找新的降温方案。

英伟达GB200 NVL72机架将72颗GPU和36颗Grace CPU置于全液冷系统中,通过紧贴芯片的冷板和密闭循环的冷却液带走热量,减少对蒸发式冷却的依赖。 

液冷技术的加速应用,与AI芯片功耗快速上升直接相关。英伟达A100芯片的热设计功耗为400瓦,B200已经升至1000瓦。 

随着单机柜发热量不断增加,传统风冷越来越难以满足散热需求。 

此外,多伦多利用深层湖水为数据中心降温,都柏林则将数据中心产生的余热接入城市供暖系统。 

无论是海底数据中心、液冷机架,还是区域供冷和余热回收,都在提高能源和水资源的利用效率。

这些技术的价值不应被低估。以海底数据中心为例,每年减少4万吨淡水消耗,是明确而具体的节水成果。 

但它们解决的主要仍是数据中心的冷却问题。 

AI带来的用水,还发生在电力生产和芯片制造环节。数据中心运营商可以改造冷却系统,却很难直接改变电网的发电结构。 

如果电力仍主要来自需要大量用水的发电方式,数据中心每消耗一度电,上游就可能伴随相应的水资源消耗。 

芯片制造也是同样的道理。晶圆在进入数据中心之前,已经经历了多轮超纯水清洗。 

无论服务器最终采用风冷、液冷还是海水冷却,这部分用水都不会因此减少。 

因此,数据中心节水是必要的,却不足以解决AI产业的全部用水问题。 

预计到2030年,全球数据中心全产业链的用水量将达到9.3万亿升。 

在这一规模下,仅优化机房冷却,能够减少的仍只是其中一部分。 

要真正降低AI对水资源的消耗,除了改进数据中心的冷却方式,还需要减少发电环节的用水,并提高芯片制造过程中水资源的循环利用效率。 

当AI以越来越快的速度进入社会生活,衡量其资源代价的方式也需要随之改变。 

比“每次对话用了几滴水”更重要的,是整个产业能否建立一套完整、透明且可比较的用水标准。

只有先把消耗算清楚,节水才不会停留在最容易被看见的地方。