【甘肃紫金云】高性能计算:联想如何助力“东数西算”战略落地?

智慧算力 2022-11-30 09:49:08 868浏览

mh58t1uydi1kl2sjd753785hh5eyak261262.jpg

案例简介

在国家战略性工程“东数西算“大背景下,紫金云依托联想强大算力技术优势以及丰富的智能化转型经验,搭建了高性能计算平台的系统、存储、网络、登录管理系统、集群系统软件等整个运行环境。联想与紫金云从设计、建设,以及后续运维全方位合作,以实际行动推动“东数西算”战略落地。 

客户介绍

甘肃紫金云大数据开发有限责任公司(以下简称为“紫金云”)位于甘肃省,是国有的云服务提供商,核心业务包括机柜租赁、IT外包服务、云计算和高性能计算。紫金云数据中心坐落在甘肃省金昌市大数据产业园,主要与政府部门、教育机构和大型国有企业合作,满足甘肃全省以及周边省份气象、能源、制造、生物信息、材料、人工智能、大数据等科研领域对高性能算力的需求。其中,紫金云高性能计算平台是紫金云数据中心基础平台的重要组成部分,从规模上看,是甘肃省目前最大的高性能计算平台。

业务痛点

“东数西算”八个国家算力枢纽节点中,其中一个就位于西北部的甘肃省。这些枢纽将发展数据中心集群,实现不同数据中心间的协同建设,开展云计算和大数据分析,消除东西部地区在计算资源方面的差距。 紫金云在甘肃省运营的大型数据中心,是助力“东数西算“工程的集群之一。因此,紫金云需要大规模扩展计算能力,增加新的高性能计算和大数据存储资源以满足项目需求。   

同时,紫金云数据中心作为甘肃省发展数字经济的重要基础平台,对高性能计算和大数据存储资源有极高要求。数据中心不仅要求打造一个技术领先的高性能计算平台,还需要成熟的建设运营经验和相关技术人才推进落地。

解决方案

在全面评估来自多家厂商的解决方案后,紫金云选择了联想的 ThinkSystem服务器和存储解决方案。具体来看,联想为整个紫金云搭建了高性能计算平台的系统、存储、网络、登录管理系统、集群系统软件等整个运行环境,包含:

  • 安装了100个联想 ThinkSystem SD630 V2高密度机架式计算节点(搭载第三代英特尔至强可扩展处理器)及50个联想 ThinkSystem SR670 V2 GPU节点(搭载4个NVIDIA A100 Tensor Core GPU)。

  • 部署了一个高度并行化的存储系统:用于IBM Spectrum Scale的联想分布式存储解决方案,总存储容量接近10 PB;并通过高速的Mellanox InfiniBand HDR网络架构与联想服务器相连。

在联想的技术支撑下,紫金云高性能计算平台还具备五大特点

特点一:联想高性能计算节点包含高密度机架式计算节点和GPU节点两类,支持异构加速。

配置50台联想GPU服务器,每台服务器采用了4块NVIDIA A100 GPU显卡,以满足科学计算、人工智能等应用场景。

特点二:采用主流计算节点配置,提供强大的单节点计算性能。

配置100台CPU计算节点,采用目前先进的英特尔®至强® Platinum 8358 32C 2.6GHz处理器,提供强大的单节点计算性能。

特点三:存储系统采用并行存储系统架构,性能优越支持大规模I/O并发处理。

存储系统裸容量近10PB,总聚合I/O读带宽:50GB/s,写带宽:45GB/s。

特点四:采用高速HDR Infiniband高速网络互联,实现节点间网络高速带宽访问。

计算、存储网络采用目前业界先进100Gb HDR Infiniband高速网络,实现计算和存储网络融合设计,全线速无阻塞。

特点五:提供核心数据备份功能,保障数据安全。

用户收益

选择联想作为战略IT服务提供商之后,紫金云凭借10.65亿元的高性能计算基础架构发展计划赢得了领先优势。

目前,紫金云高性能计算平台计算能力已达到2.73Pflops,为实现“东数西算”的愿景迈出了重要一步。该高性能计算平台满足了西北地区计算和存储资源需求,极大推动了西北地区的数字经济发展。

同时,在联想的牵头下,紫金云成功引入了某高校的数据计算服务,成为了目前甘肃省乃至西北地区率先投入商用的高性能计算平台。

最重要的是,联想平台还帮助紫金云为将来继续实现业务增长奠定了可扩展的坚实基础。紫金云公司计划在不久的将来将该高性能计算集群的计算能力再提高3 PFLOPS。这样,峰值计算性能就可以达到5.7 PFLOPS,使它成为中国西北地区用于商业应用的最大型高性能计算中心。

在未来,紫金云将与联想在人工智能、大数据、物联网等领域展开深入合作。

“联想团队从零开始,帮我们设计、建设、再到后续运维,同时还帮我们穿针引线拓展业务,为企业带来了切实的赋能效果。我们的高性能计算中心是国内首个东数西算的真实案例。 我们很自豪能够提供这些开创性的算力来支持我们地区和整个国家的数字发展。”

——紫金云技术总监、数据业务部主任 顾婷婷

适用领域

对高性能计算有需求领域