NEW
NVIDIA Spectrum-X 通过战略合作提升 AI 存储性能 48% - Blockchain.News

NVIDIA Spectrum-X 通过战略合作提升 AI 存储性能 48%

realtime news Feb 04, 2025 20:01

NVIDIA 的 Spectrum-X 网络平台通过与 DDN、VAST Data 和 WEKA 等关键合作伙伴的合作,将 AI 存储性能提升至 48%。

NVIDIA Spectrum-X 通过战略合作提升 AI 存储性能 48%

在人工智能基础设施方面的一项重大进展中,NVIDIA 的 Spectrum-X 网络平台将彻底改变 AI 存储性能,据 NVIDIA 官方博客所述,实现高达 48% 的显著加速。这一突破通过与领先存储供应商的战略合作实现,包括 DDN、VAST Data 和 WEKA,他们正在将 Spectrum-X 集成到其解决方案中。

增强 AI 存储能力

Spectrum-X 平台解决了在 AI 工厂中对高性能存储网络的关键需求,其中传统的 GPU 间东西向网络被强大的存储结构所补充。这些结构对于管理高速存储阵列至关重要,在 AI 过程中如训练检查点和推理技术(如检索增强生成 RAG)中扮演重要角色。

NVIDIA 的 Spectrum-X 通过缓解流量冲突和增加与现行 RoCE v2 协议相比的有效带宽来提升存储性能。平台的自适应路由能力显著增加了读写带宽,加快了 AI 工作流程的完成。

推动创新的合作

包括 DDN、VAST Data 和 WEKA 在内的关键存储合作伙伴与 NVIDIA 联手,集成 Spectrum-X,优化其存储解决方案以应对 AI 负载。这一合作确保了 AI 存储结构能够满足复杂 AI 应用日益增长的需求,从而提高整体性能和效率。

以 Israel-1 实现的真实影响

NVIDIA 的 Israel-1 超级计算机成为 Spectrum-X 的测试平台,提供了其对存储网络影响的见解。使用 NVIDIA HGX H100 GPU 服务器客户端进行的测试显示,与标准 RoCE v2 配置相比,读写带宽分别有 20% 至 48% 和 9% 至 41% 的显著改善。

这些结果凸显了平台处理大型 AI 模型和数据库所产生的大量数据流的能力,确保了最佳网络利用率和最小延迟。

创新功能和工具

Spectrum-X 平台结合了从 InfiniBand 技术中改进的自适应路由和拥塞控制等高级功能。这些创新允许动态负载均衡并防止网络拥塞,这对于在 AI 存储网络中保持高性能至关重要。

NVIDIA 还提供了一套工具来增强存储到 GPU 的数据路径,包括 NVIDIA Air、Cumulus Linux、DOCA、NetQ 和 GPUDirect Storage。这些工具提高了编程能力、可见性和效率,进一步巩固了 NVIDIA 在 AI 网络解决方案中的领导地位。

欲了解更详细的见解,请访问NVIDIA 博客

Image source: Shutterstock