“这是科技和人类需求的一种间接竞争。”负责这项研究的加州大学河滨分校电气与计算机工程系副教授任绍磊(Shaolei Ren)在接受《每日经济新闻》记者(以下简称NBD)专访时坦言,AI与人类争夺水资源在现实中已经发生。他主导的研究表明,用ChatGPT3对话10~50次用水量就达到500毫升。任绍磊介绍,AI的用水量还会不断上升,2027年可能会达到40~60亿立方米,大概相当于4~6个丹麦的用水量。
随着AIGC的研发突破和广泛应用,训练人工智能大模型对环境的影响逐渐受到重视。但是,与广受关注的“碳足迹”相比,“水足迹”却很少被提及,甚至鲜有数据披露。“重视程度大概晚于碳足迹10年。”任绍磊说。他早在10多年前就开始研究数据中心的耗水问题,一直以来缺乏关注度,AI大模型的走红让他觉得“蹭上了热点”。
AI大模型训练过程中大量使用数据中心(服务器),数据中心现场的冷却用水(范围1),场外的所需电能发电用水(范围2),AI芯片制造等供应链用水(范围3),都会使用并蒸发消耗大量清洁淡水。任绍磊认为,测量AI的水足迹并将其公开很简单,也是减少耗水的第一步。
让任绍磊欣慰的是,欧盟和国际标准组织(ISO)近期都开始行动,试图要求或呼吁相关企业披露AI或数据中心的用水量。他正在关注一个新的研究方向——环境公平的AI。“我们需要确保环境成本在不同地区公平分配,不希望把所有的负面效应让个别地区全部承担。”
任绍磊表示,暂时我们应该看不到AI在自主意识下争夺资源,但是间接的争夺是有的。图为任绍磊受访者供图
“水足迹”正好蹭上AI热点
NBD:何时开始关注AI的“水足迹”问题?
任绍磊:其实我们十多年前就开始研究数据中心的“水足迹”,但是当时外界关注得非常少,现在也相对比较少。我觉得其实也是蹭到AI这个热点。这项研究出炉的时间也刚好跟谷歌和微软用水量猛增时间契合。之前他们其实都不公开这些数据的,也就是从2020年开始披露。
用水量增长具体多少是由于AI所带来很难讲,但是至少他们新建的很多数据中心是专门做AI。而且AI 一般来说在他们整体业务占比应该是越来越高。因为其他业务相对比较稳定,增长可能没有那么多,需求也没有增长那么快。但现在AI除了一方面他推出产品,另一方面他们内部要做很多测试开发。
NBD:AI对水的需求会越来越大吗?
任绍磊:随着AI应用全面普及,大家用得越来越多,这个过程中数据中心对水的消耗量会越来越大。而且现在化石能源发电过程中,它除了产生碳排放,也需要水。
随着能耗越来越大,有些公司可能就会做一些“小把戏”。比如,把耗水量大的冷却方式改为能耗更大的方式,这个“水足迹”暂时没有记在他自己头上了。把直接用水改成了间接用水,其实发电厂可能需要消耗更多的水,从整个地区的水资源利用效率来说反而是更差了。
有研究表明,2027年AI的用水量可能会达到40亿~60亿立方米,大概相当于4~6个丹麦的全国用水量。
NBD:很多科幻作品都曾出现AI与人类争夺资源的场景,您认为未来会出现这种情况吗?
任绍磊:暂时我们应该看不到AI在自主意识下争夺资源,但是间接的争夺是有的。建设数据中心会影响当地用水,还是有可能的。
在一些地方,企业想去那儿建一个数据中心,要先承诺说建水厂之类的设施,因为当地的水容量是不够的。美国媒体已经有报道,这样的事情在美国已经发生。这可能也是一种间接的竞争,科技和人类需求的一种竞争。
很多人把数据中心和谷歌、微软等大科技公司画等号,其实他们的数据中心在整个数据中心产业都是非常小的一部分,更大的部分是第三方的托管数据中心。
比碳排放晚10年被重视
NBD:“水足迹”为何一直被忽视?
任绍磊:一般来说,科技巨头对水资源的重视程度大概是晚于碳排放10年。10年前那些大公司就开始提减少碳排放,那时候没有人提到水,都没有关于水足迹任何信息。
我觉着大家可能对水资源的认识不是那么深刻。很多人觉得反正水是循环的,所以无所谓,然后说农业用的水更多,数据中心用水不算个事儿。
我觉得这个逻辑是很不成立的。数据中心的整体碳排放占全世界比例大概也只有0.2%~0.4%,为什么这么受关注呢?我们谈环保总要找一个目标。
NBD:该如何减少AI的“水足迹”?
任绍磊:我们可以在做调度的过程中把“水足迹”也考虑进去,从技术上来说也不是那么难。只要作一些考量,作一些优化,从这方面也可以减少很多用水量,减少30%~40%是比较轻松的。
比如建一个汽车生产线,想要把订单转移到其他地方,可能需要好几年的周期,时间比较长。但对于AI来说,这种平衡是分分钟的事,其实他们时时刻刻都在做这种平衡。
他们现在在做的平衡主要是考虑电费,或者离用户的距离。比如这个地区突然有一些网络拥塞,可能就会把这部分的用户转移到其他地方。他们时时刻刻都在做这种监控和优化调整。
NBD:有大型科技公司也提出了实现水资源正效应的目标,这会有效果吗?
任绍磊:实现水资源正效应属于一个补救方案。这是模仿过去十年在碳排放上的做法。比如在这块儿用了很多化石能源的电,就在其他地方建个太阳能发电场,或者去市场上买点绿电或碳汇。
水资源正效应其实方法类似,在这儿用了这么多水,在别的地方“打个井”补偿回来。当然说“打井”是一个比较通俗的表达方式,实际上是恢复水源的一种方式。
这也不是那么容易的事儿,因为水资源它是一个比较特殊的东西。这种投资有很大不确定性,投资周期又相对长一些,可能需要3~5年,甚至更长时间来才能产生效益。
减少水足迹目前主要是靠三个方面的路径,一方面是减少用水量,直接减少;另一方面就是说既然我用了,我就给你补充点儿;第三方面,除了让我自己节水,我还可以帮助别人节水。
AI也需要环境公平
NBD:现在AI的“水足迹”似乎并不透明?
任绍磊:目前来说,大型科技公司为了他们自己的形象,也作一些披露。占大头的那些传统的数据中心,还完全没有走到这一步。有两家全球最大的托管数据中心,都是上市公司,比谷歌上市要早很多。他们都没有披露关于水的信息,是完全没有的。但是他们其实体量远比谷歌要大很多,他们相当于站在幕后,比较低调一点儿。
我觉得现在很多人已经意识到水足迹的重要性。欧盟已经有最新的法律要求企业汇报自己的水资源使用情况,包括数据中心,甚至规模很小的数据中心都开始需要汇报自己的用水量。国际标准组织(ISO)2024年也会发布一个技术报告,要求AI大模型开发者汇报自己的碳排放和用水量。
如果各国政府都出台像欧盟这样的法律,那就会形成一个底线,所有企业就不得不这么做了。
NBD:AI的水消耗会不会在某些区域比较严重?
任绍磊:我们不希望把所有的负面效应让某个个别地方去全部承担。因为AI是比较灵活的。空间上、时间上以及它的规模大小都可以很自由的调节。所以我们希望在运行过程中,能够考虑到不同地区的环境公平性以及其他方面的。
加州州政府的一个报告提及AI未来的问题,也提到了需要保证AI的环境公平。包括联合国教科文组织、世界经合组织,在讨论AI的环境问题时,也提到了这种环境均衡性。
NBD:我们是否可以这样理解环境均衡性导致的问题。一些很先进的AI可能是在南美洲、非洲训练出来的,靠低成本的、贫困国家的水资源换来的,因为可能在那个地方训练对公司来说盈利最大化。
任绍磊:这个理解是正确,但是目前还没有到那个程度。我们不希望仅仅由于那个地方便宜,就在大夏天的去在那儿去做训练,消耗他们的水资源。我们需要确保环境成本在不同地区公平分配,以实现环境公平的人工智能,这是负责任的人工智能的一个重要考虑因素。