NVIDIA发布DOCA 3.0以增强AI平台网络
realtime news Jun 25, 2025 11:33
NVIDIA宣布推出DOCA 3.0,通过BlueField DPUs和ConnectX SuperNICs提供高级基础设施服务,提升AI平台的可扩展性和安全性。

NVIDIA发布了DOCA 3.0,这是其数据中心基础设施框架的重大更新,旨在显著提升AI平台网络。根据NVIDIA的说法,此次升级在前代基础上,进一步提高了AI部署的可扩展性、性能和安全性。
DOCA 3.0:关键特性和增强功能
最新发布的DOCA引入了一系列新功能,旨在优化AI基础设施。它扩展支持NVIDIA BlueField数据处理单元(DPUs)和ConnectX SuperNICs,支持超大规模部署,超过100,000个GPU,同时保持严格的租户隔离和资源效率。DOCA 3.0的安全增强包括针对容器化AI工作负载的硬件级威胁检测,而不影响性能。
DOCA 3.0的显著特性包括:
- 支持ConnectX-8 SuperNICs和InfiniBand Quantum-X800
- 新的Argus服务用于NIM容器威胁检测
- 平台框架(DPF)信任主机用例
- Perftest RDMA基准测试工具用于AI计算集群
推进多租户AI工厂
AI模型复杂性的上升需要能够支持大规模GPU部署的基础设施。DOCA通过其先进的网络库解决了这些需求,优化了资源利用,确保多租户环境中的工作负载隔离。DOCA RDMA库促进了大型分布式AI训练所需的低延迟通信,而GPUNetIO库提高了GPU与GPU间通信效率。
强大的安全性和威胁检测
随着AI系统成为业务运营的重要组成部分,DOCA的安全能力提供了关键保护。该框架支持应用程序的快速开发,这些应用程序能够卸载并加速安全任务,如加密和入侵检测,提供实时威胁监控,而不影响性能。DOCA Argus是一个新的网络安全框架,为BlueField DPUs提供无代理威胁检测,增强AI工作负载的安全性。
优化数据处理和网络
DOCA的数据加速能力通过DPU加速解决现代AI工作流的挑战,降低CPU负担并提高性能。DOCA压缩库提供硬件加速数据压缩,而纠错编码库则提供可靠的数据存储解决方案。此外,DOCA流库优化了跨网络的数据移动,这对AI数据管道至关重要。
基础设施服务管理和编排
DOCA 3.0引入了DOCA平台框架(DPF),扩展了Kubernetes的功能到DPUs,简化了AI基础设施服务的部署和编排。该框架支持高级网络、数据服务和安全功能,为数据密集型AI工作负载提供显著的性能提升。
随着AI领域的发展,NVIDIA的DOCA 3.0作为构建和管理下一代AI平台的综合解决方案脱颖而出,确保组织能够应对未来的需求。随着开发者社区的不断壮大,DOCA继续在AI基础设施中推动创新。
Image source: Shutterstock