2022年初,“东数西算”工程正式启动。作为继“南水北调”“西气东输”“西电东送”等工程之后的又一项国家级战略工程,“东数西算”工程的建设将推动“算力”向水、电、气一样的公共基础设施转化。那么在这个转变中,有哪些行业和领域将从中受益呢?
“东数西算”的双重目标
根据“东数西算”引导政策《全国一体化大数据中心协同创新体系算力枢纽实施方案》显示,该工程建设目的在于推动数据中心合理布局、供需平衡、绿色集约和互联互通,构建数据中心、云计算、大数据一体化的新型算力网络体系,促进数据要素流通应用,实现数据中心绿色高质量发展。
因此,“东数西算”工程具有两方面的意义。
一是建立新型算力网络体系,促进我国算力基础设施的建设发展,建立完善的算力生产、供给和一体化调度体系,构建普适的、互联的、可调度的算力网络,实现数据中心资源最大化共享、流通和利用。
二是在“双碳”和能源战略的需求下,实现数据中心产业整体的绿色、可持续发展。一方面分布在东部的众多核心城市对以数据中心为核心的算力基础设施需求旺盛,项目数量与规模增长迅速,同时却面临能耗、摊牌双重高企,水、电等资源紧缺的瓶颈,寸土寸金的现状也导致数据中心建设成本居高不下;另一方面则是广阔的西部地区具有丰富的风、光、水等可再生清洁能源和优良的适合数据中心运营的自然环境,以及地广人稀带来的土地价格优势,但却面临着市场需求严重不足的现状。“东数西算”工程将通过整体布局的调整,实现算力服务、市场需求和能源供给上的平衡。
同时也应该注意到,“东数西算”中的“东、西”并不是简单的“东部地区”、“西部地区”的地理概念。从实际布局看,在“东数西算”首批建立的8个枢纽节点中,除京津冀枢纽、长三角枢纽、粤港澳枢纽外,位处西南的成渝枢纽同样属于“东数”的序列,而更偏东一些的贵州枢纽则毫无疑问的属于“西算”序列。
此外,是否“东数西算”也应因地制宜,以实现算力基础设施的合理布局和可持续发展为最终目标。例如随着一带一路的推进,面向“一带一路”沿线国家的数字化需求也会同步增长,西部数据中心集群也可能成为“西数西算”的中心。
谁需要东数西算?
基于算力和能源供给的整体需求,“东数西算”的基本思路是在“东部”4个枢纽建设高算力、高响应、高智能的,用以承接核心区域实时算力需求为主的高性能算力基础设施。在“西部”区域则建设基于温、冷数据存储,灾备,离线分析,后台加工等非实时算力需求的算力基础设施。
不同的建设模式,面对不同的应用场景,“东数西算”可以提供的算力服务将是多种多样的。而算力需求方也将一改过去简单购买云服务或租赁数据中心服务的IT部署模式,在“东数西算”时代发展出更加适合业务需求的算力部署方案。
网盘、医疗、视频网站——东数西存
中国工程院院士邬贺铨表示,“从一般的统计来看,冷、温、热的数据分别占到80%、15%和5%,也就意味着冷数据是最多的。对冷数据来讲,计算不是常态,主要是存储。”并提出“东数西算”的一个重要方向就是“东数西存”。
而目前看来,对于“东数西存”需求最迫切的,莫过于以网盘为代表的存储类业务。网盘对于存储的需求不必多说,例如苹果面向国内用户的iCloud业务就选择在了“云上贵州”。而对于视频网站来说,存储同样是重要的成本构成。
医疗领域同样有海量数据存储的需求。据统计,一个普通的市级医院,年PACS影像数据达上百TB规模,且数据按照国家规定需要至少保存15年以上,并保证安全、持续性、可追溯性,对医疗IT系统资源占用巨大。同时,这些数据在诊疗后被访问的频率极低,平均6个月就会成为“冷数据”。
视频网站的存储支出是运营成本占比极高的一部分,根据Bilibili发布的2021年财报,该站在服务器及带宽方面付出的成本高达15亿元人民币,占总成本的10%。而随着时间推移和受众对清晰度要求的进一步提升,视频网站需要存储成本将越来越大,带宽成本占比却会随着技术的进步逐步减小。
此外如灾备系统、档案资料、工业设计、监控存底等需要长期保存但调用概率小的重要数据,都适合“东数西存”。
影视、设计——“东数西渲”
“渲染农场”是云渲染的别称,主要面向影视、CG、3D设计、建筑设计、游戏、AR制作等行业。随着用户显示设备分辨率的不断提升,4K、裸眼3D日渐普及,对精细、高分辨率的作品有了更多的需求,传统的视频、图形工作站渲染的方式已经难以满足业务发展,“渲染农场”已经成为业界主流。
2019年上映的科幻大片《阿丽塔》,全片时长125分钟,平均每一帧需要100小时来渲染。为了完成这一任务,制作方动用3万台电脑参与渲染,平均下来用了14400小时,一天24h,两年制作周期,累计4.32亿小时。这显然已经不是任何单独的计算设备能够承担的工作,只有数据中心才能胜任。
近日,央视报道了中国横店的“云渲染”业务模式——影视制作单位可以通过渲染平台租赁渲染算力,将以往需要按“月”计算的渲染时间缩短到几天之内。相关负责人介绍:“考虑制作成本,可以选择低成本的西部资源池进行渲染,通过自动配置网络带宽和算法模型,远程高效调用西部算力完成视频渲染,也就是我们说的‘东数西算’。”
AI——东数西训
AlphaGo完胜人类围棋顶级高手、AI绘画难分真伪、智能驾驶日渐普及、各类机器人随处可见……近年来AI技术的发展可以用超乎想象来形容,这得益于芯片、算力、算法的不断完善和进步,特别是近年诞生的大模型训练带来的AI解决实际问题能力的提升。
对于AI的能力产生来说,分为训练和推理两个部分。其中训练是AI的深度学习过程,需要庞大的数据“投喂”和强大的算力支撑,这一过程只能在算力中心完成,对即时性没有要求。推理部分则是对已经完成的AI程序的应用,对即时性要求很高,一般通过终端设备提供算力,部分通过附近的云服务器或边缘服务器来提供。
技术的成熟,带来了产业分工的明确。目前AI领域已经形成了芯片+算力基础设施+算法+应用的产业分工。企业和AI开发者获取AI算力的方式可以选择有自建算力和租用算力中心,而就如数据中心产业的发展一样,租用算力中心逐渐成为AI训练的主要选择。在“东数西算”框架下,西部数据中心可以为AI训练和深度学习提供低成本的大规模算力资源,实现AI生产的产业最优化组合。
云计算
云计算是当前算力最重要的载体,也是算力调度系统的技术基础。因此,云计算是最积极响应“东数西算”的产业之一。对于云计算企业来说,承接的业务类型往往很复杂,既有需要即时响应的算力服务,也有海量的数据存储需求。
观察数据中心建设规律也会发现,云计算企业因为业务需求,更倾向于建设大规模、超大规模数据中心,其布局也和“东数西算”枢纽节点分布有很大重合。如阿里云张北数据中心、腾讯贵安七星数据中心、华为乌兰察布云数据中心、百度云计算(阳泉)中心、金山云庆阳数据中心、优刻得乌兰察布数据中心等。
通过“东数西算”布局,云服务商可以搭建成由中心云、边缘云等构成的多区域协同云架构,并通过细致的业务分类,为客户提供更加低成本、高收益的服务。利用“东数西算”带来的政策红利迅速构建起面向新业态的云体系,也将成为云厂商的下一个竞争优势来源。
数据中心行业与东数西算
虽然“东数西算”工程的目的是促进数据中心布局的优化和绿色发展,但数据中心行业中对这一政策的响应却并不热烈。究其原因,在于数据中心产业市场化充分,更多的是随着需求来布局,企业也更关注市场需求度高的地区。
相比之下,西部市场需求少,而“存、渲、训”等业务场景还没有成为主流,数据中心企业自然缺乏西进的动力。
不过,随着“东数西算”的逐步推进,越来越多的算力用户会意识到东、西算力服务的差异,并对自身业务作出相应的优化,对西部算力的需求也会逐渐提升。这种改变也必然对数据中心服务商提出新的需求,比如提供面向特殊业务的专属数据中心,或者可以实现东、西联动的“东数西x”服务等。
当类似的业务需求成为主流,那么依靠租赁单点数据中心,无差异提供电、网、运维等传统服务的数据中心服务商将面临算力成本、算力质量、客户业务满足等方面的全面挑战,业务转型势在必行。
同时,由于“双碳”战略下绿色、节能等可持续发展需求,数据中心产业需要不断加强相关领域的产品技术创新以及应用。“东数西算”的推进,将逐渐推动数据中心供应链向枢纽节点地区转移,并反过来影响到数据中心产业生态的建设。
算力基础设施建设具有产业链庞杂、周期长、投资大等特点,同时还具备一定的资源独占性。企业如果“看到”需求再布局建设,显然会失去最佳的发展时机。只有在行业发展期抢占先机,成为产业生态体系的一部分,才能实现业务的长久可持续发展。