1.1 算力概述
算力,英文全称computational power。2018年诺贝尔经济学奖获得者威廉·诺德豪斯(William D.Nordhaus)在《计算过程》一文中对算力下了一个定义:“算力是设备根据内部状态的改变,每秒可处理的信息数据量。”
通俗来讲,算力是对数据处理能力的统称,是构成信息社会的“心脏”。算力是一种服务,是由多种芯片、部件和封装形成的可量化服务。算力通过网络进行聚合,形成大的资源池,供需求者调用。
1.1.1 算力的分类
算力的分类有多种维度。从具体产生算力的实物资源来看,智能手机就是一种最常见的典型算力资源,我们日常用的笔记本电脑、PC机也是算力资源——算力遍布于我们生活的各个角落。但是,我们通常所说的算力资源一般是指服务器以及由众多服务器组成的集群所产生的算力。因此,本书主要围绕服务器算力展开论述。
服务器的核心部件是各类芯片,如CPU、GPU、FPGA、ASIC等芯片。CPU主要用作执行一般任务,其算力称为“通用算力”或“基础算力”。CPU的芯片分为多种架构,主要包含x86和ARM等。GPU主要承担图形显示、大数据分析、信号处理、人工智能和物理模拟等计算密集型任务,其算力是高性能算力。
在人工智能等新型数字化技术对算力产生需求时,单纯使用CPU无法满足。因此,GPU、FPGA、ASIC等芯片的高并行、高密集算力,以及由多种芯片组成的异构高性能算力成为必然选择。
综上所述,根据构成服务器的芯片类型的不同,我们可将算力分为基础算力、智能算力和超算算力:
(1)基础算力:由基于CPU芯片的服务器所提供的算力,主要用于通用计算。通常所说的云计算、边缘计算,大都属于基础算力。随着时间的推移,基础算力占整体算力的比重会逐步下降,但其份额目前仍然超过一半。
(2)智能算力:由基于GPU、FPGA、ASIC等芯片的计算平台提供的算力,主要用于人工智能的训练和推理计算,比如语音、图像和视频的处理。在技术架构上,人工智能的核心算力由训练、推理等专用计算芯片提供,注重单精度、半精度等多样化的计算能力。在应用方面,人工智能计算主要支持人工智能与传统行业的融合创新与应用,提升传统行业的生产效率,在自动驾驶、辅助诊断、智能制造等方面大显身手。近年来,智能算力规模增长迅速,大有赶超基础算力之势。
(3)超算算力:由超级计算机等高性能计算集群所提供的算力,主要用于尖端科学领域的计算,比如行星模拟、药物分子设计、基因分析等。在技术架构上,超算算力的核心计算能力由高性能CPU或协处理器提供,注重双精度通用计算能力,追求精确的数值计算。在应用方面,超算中心主要应用于重大工程或科学计算领域的通用和大规模科学计算,如新材料、新能源、新药设计、高端装备制造、航空航天飞行器设计等领域。超算算力在整体算力中的占比较为稳定,不到10%。
1.1.2 算力的计量
算力有不同的类型,因此需要一个统一的衡量标准。目前公认的算力基本计量单位是FLOPS(floating-point operations per second,每秒浮点运算次数)。FLOPS为每秒执行的浮点运算次数,是对计算机性能的一种衡量方式。在计算机系统的发展过程中,人们曾经提出过多种方法以表示计算能力,而目前使用最广泛的就是“浮点运算次数表示法”。FLOPS的概念最早由Frank H.McMahon在其报告中提出,国内外不少文献以及服务器产品参数都采用FLOPS对算力进行描述。“浮点运算次数表示法”主要包含3种常见类型:
(1)双精度浮点数(FP64):采用64位二进制来表达一个数字,常用于处理数字范围大而且需要精确计算的科学计算。
(2)单精度浮点数(FP32):采用32位二进制来表达一个数字,常用于多媒体和图形处理计算。
(3)半精度浮点数(FP16):采用16位二进制来表达一个数字,适合在深度学习中应用。
浮点运算包含双精度(FP64)和单精度(FP32)浮点计算能力。通常用双精度(FP64)浮点计算能力评估高性能算力,用单精度(FP32)浮点数计算能力评估通用算力。除此之外,其他的计算精度也越来越广泛地被用于智能计算领域:半精度(FP16)常用于人工智能算力评估;INT8也越来越多地被用于深度学习推理领域。
除了基本单位FLOPS,常用的算力单位还包括GFLOPS(每秒10亿次的浮点运算次数,即109次)、TFLOPS(每秒10000亿次的浮点运算次数,即1012次)、PFLOPS(每秒1000万亿次的浮点运算次数,即1015次)、EFLOPS(每秒100京次的浮点运算次数,即1021次)等。
1.1.3 算力的发展趋势
全球数字经济持续稳定增长,算力作为数字经济时代的关键生产力要素,已经成为推动数字经济发展的核心支撑力和驱动力。一个国家或地区增加对算力的投资可以带来经济的增长,且这种增长具有长期性和倍增效应。国际数据公司(International Data Corporation,IDC)、浪潮信息、清华大学全球产业研究院联合编制的《2021—2022全球计算力指数评估报告》[1]显示:当一个国家的算力指数达到40分以上时,算力指数每提升1点,对GDP增长的推动力将增加1.5倍;而当算力指数值达到60分以上时,算力指数每提升1点,对于GDP增长的推动力将提高到3.0倍(如图1-1所示)。
图1-1 算力指数与GDP回归分析趋势
从国家排名来看,美国和中国分别以77分和70分位列前两位,同处领跑者位置;追赶者国家得分在40~55分区间,包括日本、德国、英国、法国等7国;得分低于40分的为起步者国家,包括印度、意大利、巴西等国。
工信部发布的数据显示,2021年,我国算力达到130 EFLOPS。随着数字技术向经济社会各领域全面持续渗透,全社会对算力的需求迫切,预计算力总量每年将以20%以上的速度增长。
2022年2月,国家发展改革委等多部门联合发文,“东数西算”工程全面启动,计划推进构建国家算力网络体系。在需求与政策的双重驱动下,全国多地正在加快算力基础设施建设。据测算,到2025年,我国基础算力和智能算力总量将分别超过300 EFLOPS和1800 EFLOPS,智能算力将大幅超越基础算力。
在技术和行业的双重驱动下,当前算力呈现多样化、网络化、智能化、绿色化、安全化等发展趋势,预计未来算力将呈现出三个方面的特点:
一是算力呈多样性态势。作为新一轮技术革命的衍生品,数据资源正在以极低的边际成本加速涌现。这些数据资源既可以与新材料技术、先进制造技术相结合,也可以作为独立生产资料存在,从生产、管理、计算、交流等多方面赋能企业经营,成为新的关键生产要素。在此背景下,没有任何一种计算架构可以满足所有行业诉求,围绕数据分析处理的算力被赋予更加丰富的内涵。另外,在基础算力之外,还诞生了智能算力、超算算力以及前沿算力(如量子计算、光子计算)等专业化的算力设施。
二是算力布局呈现泛在化趋势。算力资源正在从集中的部署方式往多级化的方向发展,尤其是以边缘计算、终端计算为代表的算力形态的出现已与规模化中心算力形成互补之势。新型的云计算基础设施现已成为各行各业转型升级的“数字底座”。算力网络化技术将整合不同归属、不同地域、不同架构的算力资源,打破“数据孤岛”,推动数字经济走向繁荣。
三是“智能敏捷、绿色安全”将成为算力发展新要求。算力智能化、算力绿色化、算力可信化成为未来发展方向。随着数字世界和物理世界的边界逐步消融,人工智能将从无人驾驶、工业互联网等上层应用向底层基础设施蔓延,“智能敏捷”将成为智能社会算力设施的重要标签。当前,绿色安全与数字经济相伴发展,在坚定不移地推进“联接+算力”朝着生态优先、绿色低碳目标演进的同时,云网融合的数字信息基础设施也将筑牢安全堤坝,为数字经济保驾护航。