集群部署服务

集群安装调试服务:

  • 集群实施方案沟通:

集群实施前与客户沟通项目方案,确认实施方案和服务内容

  • 集群硬件设备安装:

包括机柜,服务器设备,存储设备,网络设备的上架,及加电测试。

  • 集群网络布线:

根据机房走线要求,对管理网、计算网、ipmi网络布线、理线、线缆标签黏贴,线缆布线整齐、美观,符合客户机房要求

  • 集群操作系统安装及配置:

集群管理节点,计算节点及存储节点的系统安装,及系统常用配置。

  • 集群基础并行环境调试:

集群用户统一管理NIS服务、集群用户目录统一管理NFS服务、集群节点无秘钥访问SSH服务、集群节点时间同步NTP等服务

  • 集群编译运行环境调试:

Intel试用版编译、调试软件 、Intel试用版C++/Fortran 编译器、Intel试用版MKL数学核心库、高性能消息传递并行库IntelMPI、高性能消息传递库OpenMPI、GCC编译器、GPU环境、CUDA环境

  • 集群管理及作业调度软件安装调试:

常用作业调度平台安装配置,集群队列资源划分,集群资源个性化限制,集群用户队列资源限制,集群作业脚本撰写,支持torque+maui或者slurm作业调度系统。

  • 集群性能测试:

集群网络性能测试调优,文件系统性能测试调优,、集群CPU-linpack性能测试调优。

  • 集群应用软件安装调试服务:

协助客户安装开源计算软件,商业应用软件(由客户提供安装介质及license授权)数量不多于3款,超出三款,费用一单一议

  1. 生命科学领域常用软件安装:BLAST、MPIBLAST、FASTA
  2. 计算化学领域常用软件安装:Gaussian、Dacapo、GeomosM、aterial studio
  3. 分子动力学领域常用软件安装:Gromacs、NAMD、AMBER、VASP、CHARMM、Abinit
  4. CFD、CAE领域常用软件安装:Ansys、CFX、Fluent、LS-dyna、comsole、starccm++、Q-CHEM、ADF+GUI
  5. 大气学领域常用软件安装:WRF、MM5、openfoam、netcdf
  6. 电子物理学领域常用软件安装:Q-CHEM、MATLAB、AMBER
  • 集群系统验收:

撰写集群验收移交报告,验收项目

  • 集群基础使用培训:

集群系统基础使用,包括集群管理维护,集群登录,和集群作业调度系统使用,0.5天

  • 售后技术支持:

一年远程技术支持服务,远程shell、远程电话、邮件技术支持

并行文件系统调试服务:

  • lustre文件系统调试:
  1. lustre并行文件系统部署、搭建;
  2. lustre并行文件系统性能测试;
  3. lustre并行文件系统性能调优;
  4. lustre多元数据节点HA功能调试;
  5. lustre文件系统客户端编译安装,挂载;
  • Beegfs文件系统调试:
  1. Beegfs文件系统指定版本操作系统安装;
  2. Beegfs并行文件系统部署、搭建;
  3. Beegfs并行文件系统性能测试;
  4. Beegfs并行文件系统性能调优;
  5. Beegfs多元数据节点HA功能调试;
  6. Beegfs文件系统客户端编译安装,挂载;
  • 售后技术支持:

一年远程技术支持服务,远程shell、远程电话、邮件技术支持

集群扩容服务:

  • 计算节点扩容:

节点操作系统安装,配置,扩容节点到集群里,包括并行环境配置,扩容节点到作业调度系统,实现现有集群对扩容节点的监控及管理。

  • 售后技术支持:

对扩容的节点,提供一年远程技术支持服务,远程shell、远程电话、邮件技术支持

运维服务:

  • 1年在线运维服务:

依托网络和IPMI远程开关机服务,由景阳雷诺公司资深技术专家远程负责客户集群运维管理工作,可以保障集群高效,稳定的运行。

  1. 集群硬件维护,远程开关机,硬件故障诊断,报修等。
  2. 集群系统维护,用户管理,用户需求对接;
  3. 集群并行环境运行状态监控及故障处理;
  4. 作业调度平台运行状态监控、故障处理、队列划分,资源限制,用户限制;
  5. 客户应用软件的安装,调优,软件故障排查,软件PBS脚本撰写;
  6. 存储文件系统维护,设置,调优,故障处理;