激活时间 | 2015年12月31日 |
---|---|
承建商 | 国家并行计算机工程 技术研究中心 |
作业管理者 | 国家超级计算无锡中心 清华大学 |
置放地点 | 中国江苏省无锡市 |
架构 | 40,960枚申威处理器 SW26010型 260核心CPU |
最大消耗功率 | 15,371.00kW |
操作系统 | 基于Linux核心的神威睿思 2.0.5 |
容积、占地面积 | 605 平方米 |
内部存储器 | 1.31PB |
运算速率 | 实际性能:93.0146PFlops 理论性能:125.4359PFlops |
造价 | 18亿元人民币 (约合2.73亿美元) |
排名 | TOP500: #4, 2020年6月 |
用途 | 石油勘探,生命科学 天气预报,工业设计 药物研发 |
成就 | 戈登贝尔奖获得平台,打破30年来该奖都由美日获得的情况 |
官方网站 | www.nsccwx.cn |
资源 | top500.org |
神威·太湖之光 (英语:Sunway TaihuLight)是由中国国家并行计算机工程技术研究中心研制的超级计算机,2016年6月20日在LINPACK性能测试中以 93 PFLOPS 的测试结果超越同为中国组建的天河二号(LINPACK成绩约为34 PFLOPS),成为当时世界上最快的超级计算机[1][2][3][4],直到2018年6月8日被美国的超级计算机高峰(Summit)超越[5]。“太湖之光”的命名来源于无锡旁边的太湖。目前神威·太湖之光部署在江苏省无锡市的国家超级计算无锡中心[3][1],由清华大学负责运营[6]。
神威·太湖之光也是中国大陆首度自行设计不使用英特尔等美国公司的核心产品而登上TOP500第一名宝座的超级计算机。[7]该机组在天河二号被禁之后,也被认为是中国政府面对美国政府限制英特尔、英伟达等厂商对华出售运算设备的正面回应[8],在中国大陆的媒体报导中,也多强调该机组的组件均由中国自主设计并于中国生产。[9] 不过国产化程度仍有提升空间,特别是美国对于中国超算技术已经进展到连设计工具跟代工制造都加以限制的地步,仍在不断加强制裁力度[10]。
硬件
神威·太湖之光使用国家高性能集成电路(上海)设计中心研发的SW26010。[11]此款处理器,基于DEC Alpha 64微架构、64位、精简指令集、乱序执行、支持SIMD的申威-64架构,制程未知。每个处理器芯片中有260个核心,采用大规模多核心并发运算的结构,其中4个为资源管理用途,称为MPE(Management Processing Element,管理处理组件),采用对称多处理器的结构;另外256个作通用运算用途,每64个核心组成一个处理器核心阵列,共计4个阵列,合称为CPE(Computing Processing Element,运算处理组件)。MPE和CPE的连接布局类似于Cell的协处理器式、非对称多处理的布局(PPE+SPE),而CPE的阵列则与Xeon Phi、GPGPU等的流处理器形式相近。CPE核心和MPE核心都是相同的指令集,同样具备256比特SIMD单元,但不同的是MPE均支持用户模式和系统模式、32KiB一级指令缓存、32KiB一级资料缓存、256KiB二级缓存,而CPE仅支持用户模式、16KiB一级指令缓存、64KiB本地暂存式存储器而无资料缓存,而且访问系统存储器需要与MPE沟通。该CPU主频设置在 1.45GHz。不过,存储器访问方面的规格相对较为贫弱,使用的是四通道DDR3 SDRAM,而不是最新的DDR4 SDRAM,各通道拥有独立的、128位位宽的存储器控制器,每通道容量 8GiB,一颗CPU可最大支持32GiB的DDR3-2133,尽管如此,每个芯片的存储器带宽仍达 136.5GB/s。除此以外,每颗芯片上还内置了片上网络互联,而非传统的缓存一致性处理。因此,该CPU与Cell宽带引擎一样,偏重于浮点数运算。[12][13]
整套系统高达 40,960 个 SW26010处理器,共有 10,649,600 个CPU核心。每个处理器为一个节点单元,一块主板上有两颗处理器,32块这样的主板组成一架主机,每台主机作为一个“超级节点”,一共有256个这样的超级节点。根据资料图显示,这样的构造使得主机需采用非标准设计,而非标准的刀片服务器机架和机柜,这样的一种机柜可以容纳4台主机机架。运算节点单元之间全数采用PCIe总线互联,互联结构分为三层,顶层网络是“中央切换网络”,中间层是“超级节点网络”,底层是“资源共享网络”。[13]
软件
神威·太湖之光采用的是基于Linux核心的神威睿思(即RaiseOS 2.0.5),也是分布式操作系统[13],已有10多年历史,主要面向高性能领域和通用计算领域。中国工程院院士陈左宁表示,在通用计算领域,神威睿思操作系统的主要优势在于自主可控度高和安全性强等方面[14]。
性能
理论浮点数运算性能为125,435.9 TFlops,而LINPACK测试中的实际性能为93,014.6 TFlops,有74%的效率,相比天河二号(62%)以及排名第三的泰坦(65.8%)都要高。本机组的图形性能也较为突出,在Graph500排名中位列亚军。[16]不过遇上存储器访问较为频繁的运算处理操作、整数数值较多的运算,存储器访问的樽颈效应就开始显现了。[17]
相较天河二号系统功耗达17.8百万瓦(开启散热系统全速运转时则高达24百万瓦),神威·太湖之光仅使用15.3百万瓦,且每瓦性能达到 6 GFLOPS/W,截至2017年11月为止,在Green 500能效比排名中排名第20位。[18][16]
应用
清华大学地球系统科学研究中心与计算机系合作,利用“神威·太湖之光”首次实现了百万核规模、高分辨率的地球系统数值模拟。此前,中国大陆的地球模拟系统模式只能达到200公里网格规模的分辨率,但现在已可开展25公里网格分辨率的地球系统模拟工作,在海洋上可达到10公里分辨率。
目前,三十多家用户单位在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等领域与国家超算无锡中心开展了合作[6]。2016年神威·太湖之光超级计算机上的“全球大气非静力云分辨模拟”应用软件得戈登贝尔奖,该奖项是颁发给超级计算机上的应用软件设计奖,因为硬件性能的有效发挥最终还是取决于软件设计,此前30年该奖都由美日两国获得,首次有第三国打破此规则。[19][20]
逸闻
2017年网络春晚,举办了欢唱太湖之光桥段,由羽泉演唱成名曲《奔跑》,与太湖之光20多位科学家连线接龙对唱。[21]
同时网络春晚公开了目前太湖之光计算机的维护与操作小组成员,由清华大学博士(在读)丁楠领队,杨晋喆(伦敦帝国理工学院博士),甘霖(清华大学博士后),刘加贺(清华大学硕士在读)等20多人组成。[22]
参见
参考文献
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.