AI 文摘

文勇刚:大模型时代,我们需要怎样的数据中心?丨GAIR2023


  • By AiBard123
  • September 12, 2023 - 2 min read



作者: AI科技评论 来源: AI科技评论

如何平衡AI发展和能耗间的关系,是未来数字化科技发展的重要课题。

**作者丨代润泽

编辑丨刘 伟

2023年8月14日、15日,由GAIR研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办的第七届GAIR全球人工智能与机器人大会,在新加坡乌节大酒店举办。

8月15日在多模态与跨境电商论坛上,南洋理工大学协理副校长、新加坡工程院院士、红点数智科技(新加坡)首席科学家 文勇刚教授,发表了《AI and Digital Infrastructure for a Sustainable Future:A Tale of Twin Transition(可持续未来的人工智能和数字基础设施:双重转型)》的主题演讲。

其中,文勇刚教授提出了数字化转型和可持续发展的双轮驱动的观点。以下是文勇刚教授的现场演讲内容,雷峰网作了不改变原意的编辑及整理。

1

数字化转型和可持续发展的双轮驱动

何谓数字化转型和可持续发展的双轮驱动?文勇刚表示,具体来看,一方面,目前越来越多诸如跨境电商等行业带来数字经济的发展,给可持续发展带来新的挑战;另一方面,由于数字经济的发展,尤其是人工智能和数据科学的发展,也将为可持续性发展带来新的机会,夯实相关行业可持续发展的基石。

例如过去的三年,疫情期间的碳排放量仅降低3%。事实上,尽管大家的活动从线下转移到线上,这直接拉高数字基建的需求。可以看到过去的几年,整个东南亚数据中心的发展已经超过两位数,那么意味着线上活动依然能够带来碳排放。这便是数字经济发展带给可持续性发展的挑战之一。

文勇刚认为,真正的愿景是双驱动后,AI、数据和各种生产活动形成共赢态势。

首先,AI科研和AI技术的发展,最大的挑战是带来很大的能耗及伴生碳排放。

例如数据中心就是一个大机房,耗电量巨大。某研究表明,到 2030 年数据中心将占到全球总耗电量的8%。这已经和航空行业差不多了。这可能就是尽管疫情期间,航空行业的减少并没带来大幅度碳排放量降低的原因之一。

正如新加坡,预计到 2030 年,其数据中心将占到总耗电量的12%。就此发现,2019年开始,新加坡政府暂停发放新的数据中心牌照,直到2023年才逐渐恢复。

结合人工智能最新的发展,大语言模型的能耗到底是怎样呢?

文教授比较了三个大语言模型:一个是Llama,一个是GPT-3,还有一个是Palm。它们每次运行的耗电量是多少呢?大致认为这是一个“线性趋势”,意味着预训练带来的电力成本与模型大小正相关。然而碳排放并没有满足线性增长,我们发现,出现该现象的原因是,不是每个平台都环保。例如Google,Google是全球绿色数据中心技术发展最好的大公司之一。所以在同等情况下,Google的碳排放要低得多。

就此文勇刚得出结论,在BT营销行业里,要继续绿色数据中心技术的发展。

2

如何利用AI技术降低能耗?

过去十年里,文勇刚的主要的科研方向之一是绿色数据中心节能减排。

他不断在思考,10 年、 15 年之后,数据中心应该发展成什么样子,到底该怎样去驱动?随着 AIGC 和大模型的出现,未来能耗趋势将为怎样?

一个经典AI 模型能好大致可以拆解成两步, 第一步是训练(Training),第二步是推理(Inference)。

首先,文教授预计训练过程能耗对人工智能渗透率敏感性不高。其次,看推理过程,伴随着模型使用的增加,产生的能耗越大。

随着这些变化,需要找更多绿色能源。从传统的风电、煤电,转向用清洁能源。例如氢能驱动的数据中心的方案,将储能和数据中心结合在一起,类似于能源一体的解决方案。

也就是未来十几年后,尽管数据中心的建设带来能耗增加,然而也能带来可持续发展。

AI同样也是非常好的工具,帮其他行业解决可持续发展的挑战问题。

文勇刚提到工业人工智能,利用AI手段去优化物理操作系统,提高能源效率、降低碳排放量。例如办公室、数据中心、工厂、发电厂等。

一般规模较大的企业,其运营有两部分构成,一部分为线上,AI应用于员工和客户管理。很多大企业也在做财务营销。其实面向工厂,去做工业物理空间优化方面,其实具有很大的挑战。

文勇刚提到,部分数据中心的任务繁重,无法直接使用AI技术来降低能耗,这时候需要利用数字孪生技术。

将数字孪生作为验证平台,AI 对它进行管理和优化,然后再去用到物理环境。通过这套算法去分析优化,进而验证。

如果将机房的温度从17度调成22度,可以很大程度减少能耗。但是,普遍认为AI是黑匣子解决方案,运营人员出于风险考虑,不会采纳人工智能的推荐,那就很难进一步操作。而利用数字孪生去验证,就不会对数据中心产生影响了。

数字孪生技术有巨大潜能大幅度降低数据中能耗问题。例如某新加坡数据中心,大概有1.18兆瓦的规模。利用数字孪生技术去设计验证,仅在设计阶段可以降低成本大约20倍,减少碳排放量3500倍。运营阶段降低10%的PUE,减少大约2000吨碳排放量。这仅仅是一个小数据中心的优化空间。

那么,对于人工智能这样的新兴技术,如何平衡发展和能耗之间的关系呢?目标是要做到可持续发展。

新兴技术的出现大概有三个阶段,从初始阶段到成长阶段再到成熟阶段。如今,AI为社会发展带来的益处大于弊端,其能耗是一个增长过程。借助科研手段,是可以精确地刻画出各个阶段的拐点。

提到如何做好某个AI的项目落地,有五大关键要素:

1、计算力平台(Platform)。

2、科技人才(Researcher)。

3、算法(Algorithm)。

4、数据(Data)。

5、应用场景(Application)。

用这五个方向的首字母,可以看成“穿PRADA”的人工智能。

那么跨境电商属于数字企业重点的部分,基于IT和AI的发展对数字经济GDP的影响, 主要有以下几个观点:

1、每花费1美元,可以带来15美元的数字经济产出,和29美元的GDP产出。

对比其他行业一块钱撬动8-9元,IT可以撬动29元,差距近4倍。

2、某机构通过研究大约15 个国家算力投入的研究,发现计算能力指数每增加1%,具体的经济增长是3.3‰,由此产生的GDP增长是1.8‰。

在数字化转型和 AI 时代,每一块钱的投入或每一个 百分比的增长,对数字经济以及GDP的增长都带来很大的想象空间。

总结来看,数字化可持续性发展是把双刃剑,一方面带来挑战,另一方面促进各行各业的发展。

那么利弊交互过程中,要思考怎样才能让利益超过成本,以及要判断是否值得去做这些投入。

更多内容**,点击下方关注:**

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具