国家“东数西算”工程背景下新型算力基础设施发展研究报告-智能计算.pdf
1 国家“东数西算”工程背景下新型算力基础设施发展研究报告 单志广 何宝宏 张云泉 著 国家“东数西算”工程背景下 新型算力基础设施发展研究报告 出品单位 支持单位 2 编写委员会 顾问 陈润生 陈国良 郑纬民 袁国兴 主编 单志广 何宝宏 张云泉 执行主编 安 静 王海峰 张广彬 编委 沈文海 陈学斌 方 娟 贾海鹏 赖能和 袁 良 张延强 王丹丹 陈 栩 涂菲菲 刘 殷 戴 彧 宋心荣 舍日古楞 徐凌验 张 翼 李英浩 特别鸣谢 清华大学 益企研究院 参编单位 国家信息中心 信通院云大所 中科院计算所 清华大学 国家气象中心 国家“东数西算”工程背景下 新型算力基础设施发展研究报告 3 国家“东数西算”工程背景下新型算力基础设施发展研究报告 P04 “东数西算”定义和解读 P08 前言 P09 第一章 东数西算对算力新基建的影响 P10 数据中心布局向供需协调有序、综合能效优化演进 P13 东数西算向时延要求低、存算要求高类型应用场景拓展 P15 算力结构呈现多元算力协同、算网一体化发展态势 P16 产业链上下游集聚发展,生态体系逐步壮大完善 P16 绿色低碳技术推广应用,清洁能源供给不断加大 P18 新老节点加快有序衔接,强化算力网络智能调度 P19 数字技能水平要求提升,技能人才需求不断凸显 P21 第二章 算力新基建呈现的 10 大挑战和实践 P23 算力基础设施化 保障资源多元供给 P32 关键信息基础设施的安全性要求 P36 信创产业化国产化、自主化 P38 算力设施整体能耗偏高,绿色低碳应用仍需持续推广 P43 高密度 机柜功率密度提升 P46 算力智能调度跨区域、跨云、云边调度 P50 多元算力 多样计算 P52 算力服务成为新业态 P54 原生应用云原生、AI 原生 P57 规模化和算网融合 P63 第三章 展望 null面向 2030 年的算力基础设施 P64 数字文明时代加速到来,要求算力基础设施资源充沛、泛在普惠 P65 隐私计算为代表的技术为组织间数据流通提供解决方案 P67 可信隐私计算是未来数据要素化的理想技术方案之一 P69 Web3.0 驱动规模化、泛在化的智能算力构建 P71 第五范式 AI for Science 对算力的需求 P73 大模型成为人工智能工程化重要方向,智能算力需求几何级增长 P75 边缘创新与新兴应用 P76 自动驾驶进入无人化新阶段,云边端高效协同 目录 CONTENTS 4 “东数西算”定义和解读 一、东数西算工程 今年 2 月,国家发展改革委会同中央网信办、工业和信息化部、国家 能源局等有关部门,同意在京津冀、长三角、粤港澳大湾区、成渝、内 蒙古、贵州、甘肃、宁夏 8 地启动建设国家算力枢纽,并设立 10 个国 家数据中心集群,正式启动“东数西算”工程,构建全国一体化大数据中 心协同创新体系。 与“西气东输”“西电东送”“南水北调”等工程相似,“东数西算”是一个国 家级算力资源跨域调配战略工程,针对我国东西部算力资源分布总体 呈现出“东部不足、西部过剩”的不平衡局面,引导中西部利用能源优势 建设算力基础设施,“数据向西,算力向东”,服务东部沿海等算力紧缺 区域,解决我国东西部算力资源供需不均衡的现状。 “东数西算”定义和解读 图片来源 https//www.ndrc.gov.cn/fzggw/jgsj/gjss/sjdt/202209/t20220923_1336061.htmlcodestate123 5 国家“东数西算”工程背景下新型算力基础设施发展研究报告 二、东数西算内涵 “东数西算”是“全国一体化大数据中心协同创新体系”的一个下辖概念,而 后者旨在推进技术、业务、数据融合,实现跨层级、跨地域、跨系统、跨 部门、跨业务的数据协同管理和服务,其实现方式不是固定不变的。 因此,不一定过度强调“东数西算”,面对不同应用场景,还可能有东数 东算、南数北算等模式,应因地制宜。但无论哪种模式,都有着共同 的目标一是促进数据中心资源最大化共享、流通和利用,二是通过 数据中心的系统化布局,促进国家碳达峰、碳中和战略实现。 三、东数西算与算力基础设施化 算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也 是数字经济时代的核心生产力。东数西算项目是促进算力、数据流通,激 活数字经济活力的重要手段。 东数西算首次将算力资源提升到水、电、燃气等基础资源的高度,统 筹布局建设全国一体化算力网络国家枢纽节点,助力我国全面推进算 力基础设施化。 算力基础设施化并不简单等同于算力总量的拉升。算力的基础设施化 并不是简单的算力堆砌,当前各类机构的算力总量测算方式都是将各 行业、各公司的私有算力进行累加,甚至还会加上手机终端等移动端 的算力,这些算力确实能够服务一定的群体,但算力资源并不能面向 全社会提供统一一致的服务。 6 四、东数西算与绿色节能 东数西算是促进绿色节能,助力实现碳达峰、碳中和目标的重要手段。 目前东部算力需求旺盛,但东部地区在气候、资源、环境等方面不利 于低碳、绿色数据中心的建设。通过算力基础设施的西部迁移,可以 充分发挥西部区域气候、能源、环境等方面的优势,引导数据中心向 西部资源丰富地区聚集,扩大可再生能源的供给,促进可再生能源就 近消纳,加强数据、算力和能源之间的协同联动,助力我国数据中心 实现低碳、绿色、可持续发展,完成碳达峰、碳中和目标。 “东数西算”工程聚焦创新节能,在集约化、规模化、绿色化方面着重发 力,支持高效供配电技术、制冷技术、节能协同技术研发和应用,鼓 励自发自用、微网直供、本地储能等手段提高可再生能源使用率,降 低数据中心电能利用率(PUE),引导其向清洁低碳、循环利用方向发 展,推动数据中心与绿色低碳产业深度融合,建设绿色制造体系和服 务体系,力争将绿色生产方式贯彻数据中心全行业全链条,助力我国 在 2060 年前实现碳中和目标。 五、“东数西算”工程“五个一体化”的目标建设 东数西算把东部地区的非实时算力需求以及大量生产生活数据输送到 西部地区的数据中心进行存储、计算并反馈。在其上则是希望构建更 绿色、更平衡和更高效的国家算力网络体系,以满足新时代各行各业 数字化转型、数字技术与生活场景加速融合所带来的海量计算、传输、存 储需求,最大化实现数据中心产业绿色集约发展,推动资源统筹利用 和西部数字经济建设。 “东数西算”定义和解读 7 国家“东数西算”工程背景下新型算力基础设施发展研究报告 网络一体化 围绕集群建设数据中心直连网,建立合理网络结算机 制,增大网络带宽,提高传输速度,降低传输费用。围绕集群稳妥 有序推进新型互联网交换中心、互联网骨干直连点建设。 能源一体化 从国家双碳战略整体规划出发,充分发掘西部丰富的风 光等可再生资源,应对好可再生能源波动性问题,扩大清洁能源市 场化交易范围,促进建立清洁能源消纳的市场化机制。从整体规划 层面对数据中心集群进行统一能耗指标调配。 算力一体化 在集群和城区内部的两级算力布局下,推动各行业数据 中心加强一体化联通调度,促进多云之间、云和数据中心之间、云 和网络之间的资源联动,构建算力服务资源池。 数据一体化 建设数据共享开放、政企数据融合应用等数据流通共性 设施平台。试验多方安全计算、区块链、隐私计算、数据沙箱等技 术模式,构建数据可信流通环境。 应用一体化 开展一体化城市数据大脑建设,选择公共卫生、自然灾 害、市场监管等突发应急场景,试验开展“数据靶场”建设,探索不 同应急状态下的数据利用规则和协同机制。 关于“东数西算”工程“五个一体化目标”阐述来源 中国工程院院士、清华大学计算机科学与技术系教授郑纬民 https//www.ndrc.gov.cn/xwdt/ztzl/dsxs/zjjd1/202203/t20220321_1319866.htmlcodestate123 8 前言 2022 年初,国家发展改革委、中央网信办、工业和信息化部、国 家能源 局联合印发通知,同意在京津冀、长三角、粤港澳大湾 区、成渝、内蒙古、贵 州、甘肃、宁夏等 8 地启动建设国家算 力枢纽节点,并规划了 10 个国家 数据中心集群,标志着“东数西算” 工程正式全面启动。 数据中心不仅是算力的聚集地,也是数据应用的发祥地,更是企 业数字化 转型的根据地。2022 年发布的“十四五”数字经济发 展规划第一条支线即为底层信息网络基础设施建设领域, 包括 5G、数据中心、光纤宽带等, 可以理解为此前反复强调的“新基建” 的延续。 东数西算工程从国家战略、技术发展、能源政策等多方面综合考 虑,将算力资源提升到水、电、燃气等基础资源的高度,统筹布 局建设全国一体化算 力网络国家枢纽节点,在实现数据中心一体 化协同创新的要求方面,给出了高质量的解决方案,助力我国全 面推进算力基础设施化,其战略价值已经被大家认同。但在具体 实施落地过程中,需要解决诸多问题,诸如实现数据中心有效整 合、优化算力布局,降低算力成本、完成算力调度、实现算网融 合、政府作用与市场力量有机结合等关键问题。 为此,中国智能计算产业联盟、益企研究院基于实践调查、探索 研究后提 出了几个维度的洞察,并分析东数西算对新型算力基础 设施发展的影响、新型算力基础设施的技术架构的迭代和演进,以 及如何通过技术驱动提升算力新基建的竞争力。 9 国家“东数西算”工程背景下新型算力基础设施发展研究报告 CHAPTER1 东数西算 对算力新基建的影响 国家“东数西算”工程背景下新型算力基础设施发展研究报告 10 数据中心布局向供需协调有序、综合能效优化演进 数据中心按照规模,分为超大型数据中心、大型数据中心和中小型数据中心。按照主 要处理的业务类型,又可分为边缘计算类、低时延类、中时延类和高时延类。数据中 心建设作为资本密集、技术密集型投资,数据中心地理位置的选择与其投资规模、投 资成本、数据中心类型、服务质量、经济效益等因素紧密相关。随着全国一体化大数 据中心体系总体布局的实施,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘 肃、宁夏启动建设 8 个国家算力枢纽节点,并规划了张家口集群、长三角生态绿色一 体化发展示范区集群、芜湖集群、韶关集群、天府集群、重庆集群、贵安集群、和林 格尔集群、庆阳集群、中卫集群等 10 个国家数据中心集群。重点从顶层设计层面加强 数据中心布局、算力、数据、网络、电力、能耗等方面的全国性统筹规划、一体化发展,数 据中心的布局也将更加规范和优化。数据中心在选址布局时也将呈现如下变化。 一是数据中心选址向算力需求中心聚集。当前我国数据中心分布以大湾区、长三角、京 津冀经济人口等较发达地域为主,在用数据中心中约 80 集中在用户规模较大、应用 需求强烈的互联网骨干节点所在省市及周边人口稠密、经济发达、总部企业密布一线 城市。截至 2021 年底,北京及周边、上海及周边的数据中心机架数量排列分列一二。 CHAPTER1 null 东数西算对算力新基建的影响 图片来源2021 中国云数据考察报告 11 国家“东数西算”工程背景下新型算力基础设施发展研究报告 但是随着北京、上海、广州等一线城市土地、能耗指标日益缩紧,对数据中心的政策 约束愈加严格,已建数据中心已远远不能满足城市经济发展对算力的需求,一线城市 周边地区逐渐成为互联网数据中心的首要选择。例如,紧邻北京的张家口、廊坊,靠 近上海的南通、昆山,距离广深不远的韶关、云浮、清远等都是数据中心密集落户的 地区。阿里云五大超级数据中心选址乌兰察布、张北、南通、杭州、河源,均位于在 中心城市周边。随着 10 个数据中心集群的规划建设,数据中心供给结构优化,扩展 算力增长空间,政策方面也明确要求对于符合条件且纳入国家枢纽节点数据中心集群 范围的建设项目,积极协调安排能耗指标予以适当支持,实现大规模算力部署与土地、用 能、水、电等资源的协调可持续。 二是数据中心选址向综合能效最优聚集。数据中心的主要运营成本包括土地、水、电、运 维等要素,运营成本因为区位的不同有显著的差异,其中,高能耗导致的高电力成本 是制约数据中心发展的主要因素之一。在土地、气候、政策、能源供给等优势加持下, 数据中心建设选址向可再生能源丰富、气候适宜、数据中心绿色发展潜力较大、综合 能 效最优的节点城市聚集,着重提升算力服务品质和利用效率,充分发挥资源优势,夯 实网络等基础保障,积极承接全国范围需后台加工、离线分析、存储备份等非实时算 数据中心选址 向算力需求 中心聚集 数据中心选址 向综合能效 最优聚集 数据中心选址 向用户终端 靠近 01 02 03 12 力需求,打造面向全国的非实时性算力保障基地。通信运营商、互联网企业等也纷纷 将数据备份存储、大数据处理等对网络时延要求较低的业务向综合能效优势地区转移。 例如,内蒙古乌兰察布“草原硅谷”,吸引了华为、阿里、快手等知名企业来此设立数 据中心。西南地区的“云上贵州”吸引了苹果、腾讯、华为等企业,2021 年贵阳贵安成 为全球集聚超大型数据中心最多的地区之一,数字经济占比达 34。甘肃的“云天中卫” 建成了亚马逊、美利云、中国移动、中国联通、天云网络、创客超算 6 个大型、超大 型数据 中心,中国电信、炫我科技、爱特云翔、中国广电 4 个数据中心也在加快建设。 三是数据中心选址向用户终端靠近。随着超高清视频、虚拟现实/增强现实(VR/ AR)、金融支付、金融证券、自动驾驶、工业制造、远程医疗等对网络时延要求较高 的业务的广泛应用,靠近用户侧,作为算力“边缘”端的边缘计算型、中小型数据中心 建设逐渐成为趋势。广东省 5G 基站和数据中心总体布局(2021-2025)提出,原 则上只可建中型及以下的数据中心,承载边缘计算和低时延业务,中时延业务逐步迁 移至粤东粤西粤北地区,高时延业务更要求迁移至省外。北京市数据中心统筹发展 实施方案(2021-2023 年)提出,适度利用腾退后资源和空间改造建设边缘计算中 心,支撑低时延业务应用,服务智慧城市、车联网等重点应用场景落地。除边缘计算 中心外,东、西城区禁止新建或扩建数据中心。因此,数据中心选址时还会考虑数据 CHAPTER1 null 东数西算对算力新基建的影响 13 国家“东数西算”工程背景下新型算力基础设施发展研究报告 中心功能定位、数据处理要求、所承载业务的时延敏感性等因素合理选择 新建数据中心的地理位置,例如自动驾驶车联网、工业制造机器人、远 程医疗、金融证券等对时延非常敏感的网络应用的数据中心,可以选择在 节点城市内部发展,服务后台加工、离线分析、冷数据存储备份等对时延 不敏感的网络应用的数据中心,就可以优先向贵州、内蒙古、甘肃、宁夏 节点转移,实现资源优化配置,提升资源使用效率。 东数西算向时延要求低、存算要求高类型应用场景拓展 带宽和时延是信息传输的两个关键指标,受限于物理规律,无论网络带宽 多大,传输速度多快,传输时延都是客观存在的。因此,在 “东数西算” 中,工 业互联网、灾害预警、远程医疗、自动驾驶等需要被计算节点频繁访问、网 络时延要求高的实时在线类 “热数据” 不适合 “西算”,而离线分析、后台加 工、存储备份等离线类访问频率低、网络时延要求不高的“冷数据”以及介于 两者之间的“温数据”,则更适合“西算”。虽然“东数西算”在网络时延上的限 制使其不适用于时效紧迫型的数据应用,但是“东数西存” “东数西渲”“东数 西训”,以及未来的“东云西库”等对存力、算力要求高,但对数据实效性要 求不高的应用场景将成为“东数西算”未来应用的重要支点。 一是“东数西存”应用空间极其广阔。数字经济的发展推动海量数据的产生,这 些数据的存储需要有强大的存力支持。从一般的统计来看,社会运行所产 生的数据中,冷、温、热数据的占比分别为 80、15、5,其中冷数据 是存量最多的数据 1 。对于冷数据来讲,计算不是常态,其最主要的需求还 1. 邬贺铨东数西算实为“东数西存”如何处理冷热数据值得研究 https//www.163.com/dy/article/HDHNHS2G0512D3VJ.html “东数西算”只是“全国一体化大数据中心协同创新体系” 的一个下辖概念,而后者旨在推进技术、业务、数据融 合,实现跨层级、跨地域、跨系统、跨部门、跨业务的 协同管理和服务,其实现方式不是固定不变的。 14 是存储。随着“东数西算”工程的逐渐深入,内蒙古自治区、甘肃省、宁夏回族自治区、贵 州省等枢纽节点省份存力规模将持续扩大,为西部数据中心承接东部“冷数据”“温数据” 夯实了基础,其发展空间和发展潜力巨大。 二是“东数西渲”应用价值逐渐凸显。随着网络游戏、影视媒体的快速发展,云游戏 XR、视频制作等渲染视频数据需求凸显,完成大规模的视频渲染离不开算力的支持,“东 数西算”工程的实施为这些渲染业务提供了良好的基础能力支撑。随着云计算技术的逐 渐成熟,渲染业务云化发展是大势所趋,通过建立渲染云应用平台,业务需求方可以 将渲染任务快速提交到平台,从而获取算力、网络、存储一体化资源,实现资源编排、调 度等的最优匹配。 三是“东数西训”应用潜力逐步释放。随着人工智能技术的快速发展,人工智能产业与 经济社会发展的结合日益紧密。面向指数级增长的海量数据,想要有效激发数据资源 的价值,离不开高级人工智能算法和强大算力的支持。特别是针对大规模人工智能任 务应用场景下的复杂计算,东部算力资源的成本过高,为降低算力资源的使用成本,可 以将训练数据和训练任务调度至西部枢纽数据中心集群进行上亿级参数的大模型深度 学习,实现算网资源综合成本最优。 四是“东数西算”应用前景非常可期。随着一批中西部地区数据中心建成投运,国家高 性能计算环境进一步完善,从试点走向规模应用,实现科学计算“东数西算”的基础条 件日益成熟。一些算力需求巨大的科学计算应用,如格点量子色动力学、分子动力学 CHAPTER1 null 东数西算对算力新基建的影响 15 国家“东数西算”工程背景下新型算力基础设施发展研究报告 模拟、材料计算、生物信息等开始探索适用于“东数西算”场景。如格点量子色动力学 的大规模数值模拟,涉及场景多、应用广,是最耗费计算资源的科研领域之一,其运 算过程以及运算后海量组态数据分析,就适合于东数西算场景。又如材料基因组工程 的各类高通量计算,每个计算任务之间无耦合,可以分配到任何可用节点,因此可以 充分利用超算互联网连接的各超算中心的闲置资源。目前,中西部地区新建的数据中 心已经开始面向全国科研用户提供绿色普惠的高性能一体化算力服务。 总的来说,“东数西存”“东数西渲”“东数西训”等应用场景是推动“东数西算”均衡发展的 有效途径,通过对东西部算力、存力等资源供需关系的合理匹配,让“东数西算”融入 到各个实际业务场景中,赋能千行百业的高质量发展。 算力结构呈现多元算力协同、算网一体化发展态势 一是算力设施多元化布局加快推进。一方面,“东数西算”工程布局空间跨度大,增加 了数据传输时延,为有效解决这一问题,不仅需要高效灵活的东西部算力资源调度机 制,也需要对东西部各类算力资源,包括通用算力、智算算力、超算算力、边缘算力 等的配比进行优化,算力设施的异构化、多样化供给需求将明显增强。另一方面,智 能化正以前所未有的速度在我国重塑各行各业,人工智能应用场景呈现出多元化、规 模化发展趋势,除了通用算力,对智能算力的需求与日俱增。工信部新型数据中心 发展三年行动计划 2021-2023 年 提出,到 2023 年底,全国数据中心总算力超 过 200EFLOPS,高性能算力占比达到 10。综上,我国算力基础设施迎来了大规模 需求的繁荣期,结合不同应用场景需求的多元化布局将加快推进。 二是算力网络一体化格局加速形成。全国一体化大数据中心协同创新体系算力枢纽 实施方案提出要构建一体化的新型算力网络体系,在通用算力方面,工信部数据显 示,截至 2021 年底,我国在用数据中心机架总规模超过 520 万标准机架,平均上架 率超过 55。在智算算力方面,公开资料显示,当前全国智算中心已超过 20 个,主 要分布在东部和中部地区。在边缘算力方面,我国还处于起步阶段,但在工信部公布 的 2021 年国家新型数据中心典型案例名单中,已有 12 个边缘数据中心入选。随着“东 数西算”工程的推进,以及多元算力适配与调度、算网融合等关键技术的突破,全国算 力网络一体化格局将加速形成。 16 产业链上下游集聚发展,生态体系逐步壮大完善 算力新基建产业链条长、覆盖门类广、投资规模大、带动效应强,“东数西算”工程将 推动新建数据中心尤其是大型、超大型数据中心向中西部地区以及北上广深等一线城 市周边布局,同时带动相关产业有效转移集聚,促进东西部数据流动、价值传递。如 中科曙光近年来在重庆、太原等地积极布局,探索实现了“以算促用”、“以算带动创新”。 一方面,从中短期看将直接拉动产业链上游和中游发展。“东数西算”工程的启动实施,将 直接拉动新一轮数据中心建设投资,IDC 基建率先受益。据统计,自 2022 年以来,全 国 10 个数据中心集群中,新开工项目达到 25 个,数据中心规模达 54 万标准机架,带 动各方面投资超过 1900 亿元 2 。网络建设是算力均衡布局的基础,符合“东数西算”需 求的网络特别是西部网络建设将全面提速,加速光纤通信向全光网演进。此外,在全 球数据激增和“双碳”战略的大背景下,“东数西算”工程对数据中心建设标准更为严格,平 均上架率至少要达到 65 以上,对 PUE 也提出了更高的要求,绿色、低能耗的数据 中心基建设备、边缘计算等环节将迎来持续发展机遇,温控散热技术有望实现升级。 另一方面,从长期看将逐步壮大完善产业生态体系。“东数西算”工程实施后将加速推 动数据中心上游设备制造业和下游数据要素流通、数据创新型应用和新型消费产业等 集聚发展,西部地区有望吸引数据加工、数据清洗、数据内容服务等偏劳动密集型产 业落地。此外,随着数据规模和算力水平的提升,将有效激发数据要素创新活力,培 育涌现出一批数据交易所、算力运营商、余热利用经销商、绿色数据中心评价机构等 新模式新业态。 绿色低碳技术推广应用,清洁能源供给不断加大 因此,不一定过度强调“东数西算”,面对不同应用场景,还可能有东数东算、南数北 算等模式,应因地制宜。但无论哪种模式,都有着共同的目标,一是促进数据中心资 源最大化共享、流通和利用,二是通过数据中心的系统化布局,促进国家碳达峰、碳 中和战略实现。 2. 国家发展改革委高技术司负责同志就“东数西算”投资建设进展相关问题答记者问 https//www.ndrc.gov.cn/fggz/fgzy/shgqhy/202204/t20220425_1323056.htmlcodestate123 CHAPTER1 null 东数西算对算力新基建的影响 17 国家“东数西算”工程背景下新型算力基础设施发展研究报告 一是数据中心绿色低碳发展。数据中心作为“东数西算”工程重要算力基础设施,高能 耗是其显著特征。面向“碳达峰”“碳中和”发展目标,国家和地方持续出台一系列政策 , 进一步规范了数据中心的能耗管理和 PUE 值,如图所示, 明确要求全国新建大型、超 大型数据中心平均电能利用效率 PUE 降到 1.3 以下,国家枢纽节点进一步降到 1.25 以下,绿色低碳等级达到 4A 级以上。北京根据数据中心建设规模,将 PUE 准入水平 分别设定为 1.3、1.25 和 1.15。上海数据中心新建项目 PUE 控制在 1.3 以下,改建项 目控制在 1.4 以下,集聚区新建大型数据中心综合 PUE 降至 1.25 以下。旨在有序推 动数据中心绿色高质量发展。 二是推动清洁能源有效利用。据统计,2021年,我国数据中心年耗电量2161亿千瓦时,约 占全国总用电量的 2.6。且我国当前在用数据中心机架主要分布在北上广及其周边地 区,能源使用压力巨大。从一体化大数据中心算力枢纽节点来看,内蒙古、甘肃、宁夏、贵 州等省份是我国清洁能源大省,除贵州拥有丰富的水电资源外,其他三地都是风光资 源的“富集区”,“东数西算”工程实施,承接东部算力需求的潜力,将大幅提升绿色能源 PUE值 要求 年份 2017 2018 2019 2020 2021 2022 国家和地方政策对数据中心 PUE 值要求演变图 18 的需求,提高西部地区的绿色能源消纳水平。 三是节能减排实践加速涌现。液冷、蓄冷、高压直流、余热利用、蓄能电站等技术应用,以 及太阳能,风能等可再生能源利用,进一步降低数据中心能耗及碳排放。中科曙光经 过十年研制成功的浸没式相变液体冷却技术可以将计算系统的 PUE 值降到 1.04,达到 全球领先水平。建设运营绿色低碳数据中心实践不断涌现,百度云计算(阳泉)中心 应用市直供 HVDC、自研“零功耗”置顶冷却单元及 AI 调优技术,年均达到 1.08。西 部(重庆)科学城先进数据中心通过采用浸没液冷、光伏发电、微模块等技术,整体 综合 PUE 低至 1.14。 新老节点加快有序衔接,强化算力网络智能调度 一方面,将加快新建算力设施和已有算力设施衔接配合。“东数西算”工程是一个让算 力资源从过去的分散到相对集中,从个体运营到国家统筹的过程。“东数西算”不是单 CHAPTER1 null 东数西算对算力新基建的影响 图片来源2021 中国云数据考察报告 19 国家“东数西算”工程背景下新型算力基础设施发展研究报告 纯的覆盖原有的算力设施,按照算力设施目前布局情况,除了“东数西算” 要建设的节点集群外,原来各个地方已经有大量的数据中心、超算中心和 智算中心,将促进新建和已有算力设施的有机融合。当前,京津冀、长三 角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏、山东等地出台了 一体化算力网络建设方案,通过科学规划布局,使国家数据中心的集群和 现有的各地各类型的算力设施统筹衔接和配合,从而形成合理分工、科学 联动、高效协作的机制。 另一方面,将推动东西部算力设施供需匹配和智能调度。“东数西算”要面 临很多类型的数据处理需求,以及多样化的业务需求,如何保证东数和西 算形成有效的供需匹配成为一个重要难题。如果没有业务保障,算力设施 就无法发挥应有作用,从而造成设施空置和能源空耗。算力设施供需匹配 将会在国家层面、省市级层面、企业层面、业务层面等多个层级开展面向 性能、面向价格、面向效益的多方面测算,从而形成真正的应用需求供给 和可持续的劳动力机制。进一步地,作为“东数西算”未来的神经中枢,算 力网络的集中化调度是重中之重,有利于将所有的网络资源包括带宽资源 和云资源进行统一调度,实现算力网络的云网协同。 数字技能水平要求提升,技能人才需求不断凸显 一方面,算力基础设施规模化绿色化智能化趋势明显,数据中心运营人才短 缺。数据中心是数字技术创新的高地,随着数据中心绿色低碳、智能运营、算 网调度等要求的不断升级,将加大对大数据、云计算和人工智能等相关高 技术领域的人才需求。人社部中国就业培训技术指导中心的新职业在线 学习平台发展报告指出,未来 5 年,大数据、云计算产业人才缺口将高 达 150 万。掌握云架构、云配置管理、IT 基础设备管理、信息安全、数据 中心综合管理以及节能减排等技能人员成为未来数据中心最为抢手的技术 “东数西算”工程是一个让算力资源从过去的分散到相 对集中,从个体运营到国家统筹的过程。 20 领域人才。目前,就业与招工难在数据中心行业同时并存,数据中心权威机构 Uptime Institute 的报告显示,调查的受访人当中,有一半表示目前很难找到空缺职位,远远高 于 2018 年的 38;从企业端看,数据中心对复合人才需求巨大,很多求职者并不符合 招聘职位的要求,高等院校目前难以培养出足够的技术人才。 另一方面,算力设施普及将加速各领域数字化转型步伐,数字技能人才需求加大。“东 数西算” 不仅有助于改善数字基础设施不平衡的布局,而且有助于企业更好地提供云 存储、云计算、数据工具、研发平台、AI 技术等服务,进一步降低上云用数成本,加 快更多传统企业及中小企业实现数字化转型。数字化人才储备是数字化转型的关键,当 前中国劳动力市场的数字化人才短缺。根据 IDC中国中小企业调查企业数字化 挑战,2022报告显示,超 10 的企业不具备数字化的 IT 能力,15 的企业不了解 如何进行数字化转型,超 20 的企业存在员工 IT 技能不足的问题。数字经济就业 影响研究报告指出,2020 年中国数字化人才缺口接近 1100 万。根据人社部发布的 相关报告测算,我国人工智能人才目前存在较大缺口,国内供求比例为 1 ∶ 10,供需 比例严重失衡。 10 15 20 超 10 的企业 不具备数字化 的 IT 能力 超 20 的企业 存在员工 IT 技能不足的问题 15 的企业 不了解如何进行 数字化转型 IDC中国中小企业调查企业数字化挑战,2022 CHAPTER1 null 东数西算对算力新基建的影响 21 国家“东数西算”工程背景下新型算力基础设施发展研究报告 CHAPTER2 算力新基建 呈现的10大挑战和实践 国家“东数西算”工程背景下新型算力基础设施发展研究报告 22 2021 年 12 月,国务院印发“十四五”数字经济发展规划提出,到 2025 年,数字 经济迈向全面扩展期, 数字经济核心产业增加值占 GDP 比重达到 10%。发展数字经 济,已经成为中国经济战略的重中之重。 发展数字经济,算力又是重要支撑,算力作为核心生产力成为共识。2018 年,中国科 学院计算技术研究所研究员张云泉提出算力经济概念,指出以计算为核心的算力经济 将成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段,算 力经济涵盖算力基础设施、算力资源、算力服务和算力应用等产业。从中国信通院发 布的数据来看,在算力中每投入 1 元,带动 3-4 元经济产出;算力发展指数每提高 1 点,GDP 增长约 1293 亿元。 数据来源中国算力发展指数研究报告 同样,将罗兰贝格算力估算结果同 IMD 智能化水平评估结果进行比对,发现国家分类 结果基本吻合,从而证明人均算力与国家智能化水平正相关。 算力在生产生活中的应用越来越多,数据潜力才会不断被挖掘,因此加快算力基础设 施建设,优化算力资源布局、支持跨区域算力网络实时、灵活调度运营,提升算力应 用强度至关重要。 CHAPTER2 null 算力新基建呈现的 10 大挑战和实践 23 国家“东数西算”工程背景下新型算力基础设施发展研究报告 一、算力基础设施化 保障资源多元供给 综合来看,算力是硬件和软件配合共同执行某种计算需求的能力。算力服务是提供算 力的一种商业模式,是包括算力生产者、算力调度者、算力服务商以及算力消费者在 内的算力产业链上算力经济模式的统称。 在加速算力服务核心技术创新发展方面,未来需要加强算力网络、基础设施化、开放 应用模型、云边协同、云原生等算力服务核心技术布局,打造开放灵活的算力服务用 户平台,推动算力经济供给侧改革,激发算力服务的范式创新。 让算力像水、电资源一样随取随用,使算力服务成为一种公共服务,是 61 年前“人工 智能之父”约翰麦卡锡的预测。但不同于标准化的电力,因为数据来源、结构存在多 样性和复杂性,一些特定场景对计算能力的要求或者对计算特性的要求会越来越多,如 24 云计算的推广,使得算力得以普惠化。用户按需采购 算力、存储、带宽即可开展业务,可以将精力集中在 拓展、开发新的应用,专注于本行业的知识创新 AI 服务、音视频服务等场景有足够的市场,显然通用计算无法满足其效率 需求。与此同时,企业为寻求更加敏捷、灵活和高效的应用开发模式,以 加速应用的创新和快速上市,如容器、微服务和 DevOps,这些应用开发 模式拉近了业务和计算平台之间的联系,应用开发团队将定义基础设施的 性能、可用性和规模,直接推动计算平台架构的变革和创新。 算力基础设施化并非易事,随着多样性技术路线的引入和发展,以 GPU、FPGA 为代表的异构计算与以 ARM 为代表 CPU 架构的兼容性问题 更加突出,多样性算力的标准化度量与输出成为挑战。不同算力平台(超 级计算中心、云数据中心、智能计算中心)的技术方案、系统架构、软件 平台、硬件设备、服务保障存在很大差异。 要加快算力基础设施化进程,需要多类算力基础设施并行发展,保障算力 资源的多元供给,围绕强化数字转型、智能升级、融合创新支撑来统筹布 局云数据中心、智能计算中心,超级计算中心等算力基础设施建设。 1)算力服务能力是云数据中心的基石 云计算的推广,使得算力得以普惠化。用户按需采购算力、存储、带宽即 可开展业务,可以将精力集中在拓展、开发新的应用,专注于本行业的知 识创新,而不必在基础硬件、系统、网络、安全等需求上重复建设,也不 用担心业务快速发展时受困于系统瓶颈。自此,不论是大中小型企业,亦 或是个人, 都可以通过不同形式的云IaaS、PaaS、SaaS 获得需要的服务。 我国的云数据中心作为数字化基础设施的核心节点,这几年飞速发展。云 数据中心不仅是算力的聚集地,还是数据应用的发祥地,更是企业数字化 CHAPTER2 null 算力新基建呈现的 10 大挑战和实践 25 国家“东数西算”工程背景下新型算力基础设施发展研究报告 转型的根据地。益企研究院在实地考察 8 个国家算力枢纽节点、7 个数据中心集群后 发现,算力基础设施的使用效率,会直接影响到云服务商的创新能力和盈利能力。 全方位的计算力服务能力是云服务商竞争力的基石,云服务商不断优化硬件基础设施 提升算力效率,尤其在服务器产品层面,通过高计算密度提供高算力和能效比,通过 高速互联技术提升集群的扩展性,通过高度集成化设计、模块化和冗余设计简化交付 部署流程,通过高效率散热系统打造绿色节能的集群系统。 在数据中心内部,基于云数据中心规模化优势,云服务商通过规模化、定制化能力支 撑各项新型业务,将新的技术应用于云服务器来适配云端业务场景,通过完善从底层 到应用层的自研技术体系,不断优化硬件基础设施提升算力效率,快速灵活对市场做 出反应。 为通用算力输出单元的 CPU 也走向多元化ARM 阵营百花齐放。对云服务商而言,一 方面需要 CPU 有更强的核心和更多的核心数,另一方面需要不同的 CPU 满足客户多 元化细分场景的需求,都与效率有着密不可分的关系。最大的变化是,在自主可控的 大潮推动下,中国“芯”力量正在崛起,国产 CPU 龙头海光信息成功登陆科创板,成为 2022 年半导体领域知名的 IPO 事件,海光、龙芯、飞腾等产品的技术成熟度和应用 范围正在追赶主流。 26 从数字中国万里行的洞察中发现,云数据中心完成多元算力的布局,但多元算力的多 元的开发生态体系相对独立,应用的跨架构开发和迁移困难,亟需通过开源、开放的 方式建立可屏蔽底层硬件差异的统一异构开发平台。 在数据中心基础设施层面, 新基建、双碳、东数西算,每年都有新热点,背后的指导 思想则是一以贯之,兼顾效率与均衡、可持续的发展。从国家战略层面来说,希望通 过建设高效集约、普适普惠的新型基础设施,推动计算力向绿色化和集约化方向加速 演进。 2)智算中心成为新热点 人工智能需要海量的计算资源和存储空间,再加上非结构化数据的大爆发以及 AI 算法 的快速演进,对传统计算范式造成了巨大的冲击,很多特定计算任务开始涌现,且需 要在并行度、吞吐量和时延上做到极致。 无论是智慧城市还是智能制造、无人驾驶、数字孪生等场景,除了要有数据支撑以外,还 要和各领域、各场景的知识模型、机理模型甚至物理模型相叠加,形成基于人工智能 的新应用和场景实现。复杂模型、复杂场