中国科学院大学作为顶尖科研人才培养与前沿基础研究重镇,面向物理、化学、材料、生物、人工智能等多学科领域,存在大规模算力与仿真计算刚性需求。为此,建设开放式超算平台,完善学科实验配套环境,夯实学科发展算力基础。
近日,北京景阳雷诺科技有限公司(以下简称“景阳雷诺”)针对中国科学院大学算力资源分散、运维独立造成的算力孤岛、利用率低、运维成本偏高等问题,革新传统硬件建设模式,以资源池化、服务化为理念,整合算力、存储、网络及软件资源,搭建统一超算平台。平台依托异构融合、分层存储、三网隔离等技术,实现资源集中管控与智能调度,构建标准化、自动化、可计量审计的精细化运维体系,优化算力供给模式,为全校科研教学提供普惠稳定的算力支撑。
01 算力革新:破解建设难点,构筑校级科研算力底座
中国科学院大学超算平台承担教学支撑、科研创新、人才培养三大核心职能,是学校建设高水平研究型大学的重要算力基础设施。本次建设并非简单的硬件集成,核心旨在构建多学科适配、易用高效、长期稳定的科研算力生态。
此次平台建设过程中需攻克多项建设难点:技术层面需实现异构算力融合、海量数据高效管控,兼顾标准化运行环境与学科个性化使用需求;服务层面打破学科算力应用壁垒,推动平台从基础算力供给向数据、算法一体化的知识服务升级;运营层面统筹资源共享、数据安全与运维成本,建立跨部门协同治理与长效保障机制。
作为全校关键算力底座,平台算力、存储、网络及综合稳定性将直接赋能科研攻关与实践教学,为学校深耕前沿研究、培育高层次科研人才夯实硬件与服务根基。
02 硬核架构:四大系统协同,搭建一体化高性能超算平台
针对中国科学院大学超算平台建设需求,景阳雷诺深度整合计算、存储、网络、软件四大核心能力,采用异构计算集群、分布式并行存储、三层隔离网络架构及统一智能调度设计,打造高性能、高可靠、易扩展、易运维的校级超算系统。
计算子系统:构建异构计算集群,集成GPU加速、通用计算、大内存胖节点及管理登录节点,搭载高性能处理器、大容量内存与高速互联组件,全面支撑科学计算、并行仿真、AI模型训练等多场景算力需求。
存储子系统:采用分布式并行存储架构,融合混闪与全闪双存储体系,通过高速缓存与大容量存储组合,为海量科研数据提供高效读写、安全存储与长期归档能力。
网络子系统:构建三层隔离网络架构,采用高速IB交换机组建计算存储网络,通过万兆交换机搭建管理网络,以千兆交换机构建IPMI硬件管理网络,实现数据通信、集群管控与硬件运维的独立高效传输,保障网络稳定与低时延交互。
软件子系统:部署操作系统、并行文件系统、集群管理与统一监控平台,集成并行编译环境与数学库套件,实现集群统一部署、智能调度、状态监控与全生命周期自动化运维。
03 价值落地:效能全面升级,赋能院校科研教学发展
超算平台正式投用后,全面解决中国科学院大学原有算力体系的核心问题,实现教学与科研支撑能力跨越式升级。
提升资源利用效能:通过算力集中与统一调度,打破算力孤岛,避免资源闲置与重复采购,提升资源利用率与投资回报。
降低科研教学使用门槛:提供标准化预配置环境,师生无需自行搭建复杂软硬件,可专注科研与教学,提升效率。
促进跨学科协同创新:依托统一平台与共用工具环境,为不同学科师生提供协同研究基础,推动跨领域协同创新,助力复合型人才培养。
实现运维管理现代化:建立标准化、自动化运维体系,实现资源分配可计量、可追溯、可审计,提升集群管理规范性与安全性,保障平台长期稳定运行。
本次为中国科学院大学落地的超算平台,是景阳雷诺在高校高性能基础设施领域的标杆实践。项目贴合院校科研教学需求,以科学架构与标准化流程搭建高性能、高稳定的校级超算集群,沉淀出可复制、可推广的高校算力平台建设经验,为国内高校超算体系建设提供优质参考。
未来,景阳雷诺将持续深耕高性能计算、分布式存储等核心技术,聚焦高校与科研机构应用痛点,优化平台扩展能力与服务体验,打磨适配科研教学场景的定制化超算方案,以稳定算力赋能前沿科研与人才培育,助力我国科教融合事业高质量发展。

评论