3.4 高性能计算与分布式计算
发展高速度、大容量、功能强大的高性能计算,对科学研究、国家安全、提高经济竞争力具有重要意义。
1. 高性能计算
高性能计算(High Performance Computing,HPC)指使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)组成的计算系统和环境。有许多类型的HPC系统,其范围从标准计算机的大型集群,到高度专用的硬件。
如图3-56所示,一个控制节点作为HPC系统和客户机之间的接口,它管理计算节点的工作分配。整个HPC单元的操作和行为像是单个计算资源,它将实际请求加载到各个计算节点。HPC解决方案被专门设计和部署为能够充当大型计算资源。
图3-56 网状HPC
“天河二号”是由国防科学技术大学研制的超级计算机系统,峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算。“天河二号”由16000个节点组成,每个节点有2颗基于Ivy Bridge-E Xeon E5 2692处理器和3个Xeon Phi,累计共有32000颗Ivy Bridge处理器和48000个Xeon Phi,总计有312万个计算核心,如图3-57所示。
图3-57 “天河二号”计算机
2016年6月20日,全球超级计算机500强榜单公布,使用我国自主芯片制造的“神威·太湖之光”取代“天河二号”登上榜首。2017年11月13日公布的全球超级计算机500强榜单中,“神威·太湖之光”以每秒9.3亿亿次的浮点运算速度第四次夺冠。
2. 分布式计算
分布式计算(也称网格计算),它研究如何把一个需要巨大计算能力的问题划分成许多小的部分,然后把它们分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终结果。分布式计算系统的关键元素是网格中的各个节点,它们可能由多个相同的专用硬件或者多个完全不同的硬件组成。最近的分布式计算项目通过因特网使用世界各地成千上万志愿者的计算机的闲置计算能力,用以完成需要惊人的计算量的庞大项目。