【南京大学】高校科研:算力如何赋能高校科研,释放数据真正价值?

智慧科研 2023-05-18 18:08:12 0浏览

pj7c9zlqqkl3kd2f91ta41uw0c8b49587611.jpg

案例简介

南京大学携手联想集团,借助联想高性能计算解决方案进行算力升级,以支持大规模计算作业展开、提升运营效率,释放数据真正价值,驱动实现的科研成果。

客户介绍

南京大学高性能计算中心,是面向全校科学与工程计算的公共服务平台,集高性能计算、大数据、人工智能等新一代信息技术为一体,实现计算资源、数据资源、科学与工程计算应用的有效整合,服务于学校世界一流学科的建设,能够为南京大学各院系的老师和学生提供高效可靠的高性能计算资源和相关技术服务。

2010年至 2022年期间,大学建设了两期算力排名国内高校首位的高性能计算集群。在高校垂直领域排名中,南京大学高性能计算中心位于全球超级计算机Top500榜单第215位,国内高校首位。

业务痛点

高性能计算平台开户人数稳步增长,南京大学计算池中资源使用已经触顶,从一期到二期升级,有以下痛点亟待解决:

  • 生命周期:高性能计算服务器的生命周期为6到8年,5年质保期过了还需要继续付费质保。

  • 能耗过高:以前单台算力有限,上百台服务器电费成本过高,如今单台服务器可提供的算力更多,能够降低电费成本。

  • 科学计算需求增加:随着科研需求的快速增长,作业排队量非常大,当时400多台机器只有3000多核,但随着作业排队量多,排队的任务作业在七八千核,对学校科研的影响很大,原有的服务器已无法支撑学校科学计算的用量。

2022年10月,南京大学申请计算设备升级改造,以缓解计算资源紧张局面,实现大规模并行计算密集型场景算力覆盖。

解决方案

联想为南京大学提供高性能服务解决方案,可以为大学提供从最底层基础设施到上层资源管理门户在内的一套完整的HPC系统架构,用户通过联想高性能服务可以享受到交钥匙工程,通过统一的WEB界面可以为计算任务自动调取最合适的计算资源,并在统一的管理平台上完成各类计算任务的全部处理流程,包括设计建模、计算求解和结果展示等操作。

此外,AI时代,整个科学计算对计算力的要求、硬件设备的要求、软件的要求将会越来越高,特别是HPC领域,对计算密度、散热、如何高效利用硬件资源都有很高的要求。联想采用温水冷却技术,拥有如下领先优势:

  • 节省功耗:温水水冷功耗比风冷节省45%的能耗,PUE能降到1.05%左右。

  • 提升CPU性能:温水水冷技术可以实现对机器性能提包括把CPU性能提高20%-25%,可提高数据中心的使用效率。

  • 降低器件使用的故障率,延长器件寿命:若器件长期在一个比较良好的温度环境下工作的话,寿命也相应延长。

用户收益

  • 计算数量:能够跑更多的计算,做更多的计算任务,研究更多的科研问题;以前没有大的算力,ChatGPT 没办法做到,现在有算力支撑以后,很多应用可以跑起来,大数据带来的新的应用,解决很多大模型,体系性复杂的问题。

  • 计算质量:研究的同一科学问题,研究的精细度显著提升,模拟模型更大,更精细,网格划分的更细,比如做气象预测,天气预报可以更准确。

  • 影响力:2009年,高性能计算建成当年,南京大学为全国高校里算力第一,一期二期建立高性能计算中心开国内高校先河。

  • 科研成果:2019年至2021年,三年期间中心用户发表 6 篇Nature顶级论文,高质量论文一百多篇;国家级重点科研项目超过三十个;在顶级论文中,科学计算比重逐年增加。

适用领域

高校科研计算