NVIDIA 的 Blackwell 架构在 MLPerf Training 中设立新性能标准
根据NVIDIA 的博客,在最近的 MLPerf Training 基准测试中,NVIDIA 的 Blackwell 架构在各种 AI 工作负载中表现卓越。这些基准测试是自 2018 年以来的第 12 次迭代,强调了该架构在处理大型语言模型(LLMs)、推荐系统等方面的能力。
在基准测试中创纪录的表现
NVIDIA AI 平台在每个基准测试中均表现出领先的性能,包括具有挑战性的 Llama 3.1 405B 预训练测试。这一成就突显了该平台在大规模 AI 操作中的多功能性和卓越能力。该平台是唯一一个在每个 MLPerf Training v5.0 基准上提交结果的,展示了其广泛的适用性。
先进的基础设施和合作
NVIDIA 利用两台 AI 超级计算机 Tyche 和 Nyx(由 Blackwell 平台提供动力)取得了这些结果。Tyche 是使用 NVIDIA GB200 NVL72 机架级系统构建的,而 Nyx 基于 NVIDIA DGX B200 系统。与 CoreWeave 和 IBM 的合作进一步提升了性能,利用了 2,496 个 Blackwell GPU 和 1,248 个 NVIDIA Grace CPU。
显著的性能提升
在 Llama 3.1 405B 预训练基准测试中,Blackwell 的性能较早期架构提高了 2.2 倍。同样,配备八个 Blackwell GPU 的 NVIDIA DGX B200 系统在 Llama 2 70B LoRA 微调基准测试中表现出 2.5 倍的性能提升,标志着 AI 训练效率的重大进步。
技术创新
Blackwell 架构的增强包括高密度液冷机架、13.4TB 的一致性内存,以及先进的 NVIDIA NVLink 和 NVLink Switch 互连技术。这些发展有助于规模扩大和扩展操作,对于下一代多模态 LLM 训练和自治 AI 应用至关重要。
扩展的 AI 生态系统
NVIDIA 的数据中心平台整合了 GPU、CPU、高速网络和广泛的软件套件,包括 CUDA-X 库、NeMo 框架和 NVIDIA TensorRT-LLM。这个生态系统加速了 AI 模型的训练和部署,缩短了上市时间并增强了价值创造。
本次 MLPerf 轮次有广泛的 NVIDIA 合作伙伴生态系统参与,其中包括 ASUS、Cisco、戴尔科技、谷歌云等公司的提交。这种合作努力突显了 AI 在各个行业日益重要的地位。
Read More
NVIDIA's Blackwell Architecture Sets New Performance Standards in MLPerf Training
Jun 04, 2025 1 Min Read
Exploring the Path to Stablecoin Integration in Global Finance
Jun 04, 2025 1 Min Read
BounceBit Launches USD1 Stablecoin, Enhancing CeDeFi Yield Strategies
Jun 04, 2025 1 Min Read
CoreWeave Elevates Ernie Rogers to Lead Strategic Financing Initiatives
Jun 04, 2025 1 Min Read
Hong Kong Government Successfully Prices HK$27 Billion in Green and Infrastructure Bonds
Jun 04, 2025 1 Min Read