集群安装调试服务:
- 集群实施方案沟通:
集群实施前与客户沟通项目方案,确认实施方案和服务内容
- 集群硬件设备安装:
包括机柜,服务器设备,存储设备,网络设备的上架,及加电测试。
- 集群网络布线:
根据机房走线要求,对管理网、计算网、ipmi网络布线、理线、线缆标签黏贴,线缆布线整齐、美观,符合客户机房要求
- 集群操作系统安装及配置:
集群管理节点,计算节点及存储节点的系统安装,及系统常用配置。
- 集群基础并行环境调试:
集群用户统一管理NIS服务、集群用户目录统一管理NFS服务、集群节点无秘钥访问SSH服务、集群节点时间同步NTP等服务
- 集群编译运行环境调试:
Intel试用版编译、调试软件 、Intel试用版C++/Fortran 编译器、Intel试用版MKL数学核心库、高性能消息传递并行库IntelMPI、高性能消息传递库OpenMPI、GCC编译器、GPU环境、CUDA环境
- 集群管理及作业调度软件安装调试:
常用作业调度平台安装配置,集群队列资源划分,集群资源个性化限制,集群用户队列资源限制,集群作业脚本撰写,支持torque+maui或者slurm作业调度系统。
- 集群性能测试:
集群网络性能测试调优,文件系统性能测试调优,、集群CPU-linpack性能测试调优。
- 集群应用软件安装调试服务:
协助客户安装开源计算软件,商业应用软件(由客户提供安装介质及license授权)数量不多于3款,超出三款,费用一单一议
- 生命科学领域常用软件安装:BLAST、MPIBLAST、FASTA
- 计算化学领域常用软件安装:Gaussian、Dacapo、GeomosM、aterial studio
- 分子动力学领域常用软件安装:Gromacs、NAMD、AMBER、VASP、CHARMM、Abinit
- CFD、CAE领域常用软件安装:Ansys、CFX、Fluent、LS-dyna、comsole、starccm++、Q-CHEM、ADF+GUI
- 大气学领域常用软件安装:WRF、MM5、openfoam、netcdf
- 电子物理学领域常用软件安装:Q-CHEM、MATLAB、AMBER
- 集群系统验收:
撰写集群验收移交报告,验收项目
- 集群基础使用培训:
集群系统基础使用,包括集群管理维护,集群登录,和集群作业调度系统使用,0.5天
- 售后技术支持:
一年远程技术支持服务,远程shell、远程电话、邮件技术支持
并行文件系统调试服务:
- lustre文件系统调试:
- lustre并行文件系统部署、搭建;
- lustre并行文件系统性能测试;
- lustre并行文件系统性能调优;
- lustre多元数据节点HA功能调试;
- lustre文件系统客户端编译安装,挂载;
- Beegfs文件系统调试:
- Beegfs文件系统指定版本操作系统安装;
- Beegfs并行文件系统部署、搭建;
- Beegfs并行文件系统性能测试;
- Beegfs并行文件系统性能调优;
- Beegfs多元数据节点HA功能调试;
- Beegfs文件系统客户端编译安装,挂载;
- 售后技术支持:
一年远程技术支持服务,远程shell、远程电话、邮件技术支持
集群扩容服务:
- 计算节点扩容:
节点操作系统安装,配置,扩容节点到集群里,包括并行环境配置,扩容节点到作业调度系统,实现现有集群对扩容节点的监控及管理。
- 售后技术支持:
对扩容的节点,提供一年远程技术支持服务,远程shell、远程电话、邮件技术支持
运维服务:
- 1年在线运维服务:
依托网络和IPMI远程开关机服务,由景阳雷诺公司资深技术专家远程负责客户集群运维管理工作,可以保障集群高效,稳定的运行。
- 集群硬件维护,远程开关机,硬件故障诊断,报修等。
- 集群系统维护,用户管理,用户需求对接;
- 集群并行环境运行状态监控及故障处理;
- 作业调度平台运行状态监控、故障处理、队列划分,资源限制,用户限制;
- 客户应用软件的安装,调优,软件故障排查,软件PBS脚本撰写;
- 存储文件系统维护,设置,调优,故障处理;