目录

浪潮信息发布元脑企智DeepSeek“双模”一体机,支持671B R1与V3同机2000并发

jyhpc 行业新闻657阅读模式

3月25日,浪潮信息正式发布元脑企智DeepSeek“双模”一体机,该产品首次实现单机同时部署DeepSeek R1 671BDeepSeek V3 671B/685B两大模型,并支持2000用户并发服务。结合元脑企智EPAI企业大模型应用开发平台,该方案为企业用户提供高效、易部署的AI应用系统,助力企业智能化升级。

“快思考”与“深度思考”并行,赋能企业全场景AI应用

DeepSeek V3与R1均基于混合专家架构(MoE)和多头潜在注意力(MLA)技术,但在应用定位上形成互补:

  • DeepSeek V3(671B/685B):主打低成本、高通用性,适用于智能客服、多语言翻译、内容生成等场景,最新V3-0324版本在长文本理解、多轮对话等方面表现显著提升。
  • DeepSeek R1(671B):专注复杂逻辑推理,如数学证明、代码生成、决策分析,支持“思维链”输出,提升推理透明度和可信度。

企业常面临实时响应深度分析的双重需求,传统方案需分别部署不同模型,而元脑企智DeepSeek一体机通过“双模”架构,在一台设备上同时满足“快思考”(V3)与“深度思考”(R1),显著提升任务处理效率。

技术突破:单机全量部署,极致性能优化

该一体机基于NF5698A7服务器,具备以下核心优势:

  1. FP8计算引擎+1536GB HBM3显存,提供5.3TB/s内存带宽,完美适配R1“短输入长输出、显存带宽敏感”特性,确保全量模型推理时的KV缓存空间。
  2. 896GB/s P2P高速通信架构,优化张量并行效率,实现解码阶段极致加速。
  3. SGLang推理框架专项优化(Version: 0.4.3.post2),单用户推理速度达44 tokens/s,并发支持超2000路服务,保障高负载稳定性。

无缝集成EPAI平台,加速企业AI落地

该一体机已与元脑企智EPAI开发平台深度适配,提供四大核心能力:

  • 知识检索增强:基于Yuan-EB嵌入模型,检索精度超90%,降低模型幻觉。
  • 智能体编排:支持多模型协同决策,回答准确率提升至95%。
  • 低代码开发:分钟级上线DeepSeek全参数模型,复杂应用开发周期缩短80%(如质检系统从3周压缩至3天)。
  • 企业级安全:多层防护机制覆盖输入过滤、输出审核及数据加密,确保隐私与合规。

典型应用场景:融合“双模”能力,提质增效

产品项目管理、智能会议助手等复杂业务流中:

  • DeepSeek V3快速生成文档、会议纪要,处理多语言交互;
  • DeepSeek R1进行资源分配、风险评估等深度分析,输出可解释的“思维链”。
    通过EPAI平台灵活调度,企业可构建端到端智能解决方案,实现业务效率与决策质量的双重提升。

浪潮信息表示,元脑企智DeepSeek“双模”一体机将推动大模型在企业级市场的规模化应用,为金融、制造、政务等行业提供“开箱即用”的AI基础设施。

HTML5+CSS3 响应式设计,博客、杂志、图片、公司企业多种布局可选,集成SEO自定义功能,丰富的主题选项,众多实用小工具。