NVIDIA 推出 DGX Cloud 无服务器推理,助力可扩展 AI 解决方案

realtime news   Mar 19, 2025 14:55  UTC 06:55

1 Min Read

NVIDIA 宣布推出 DGX Cloud 无服务器推理,这是一项突破性的自动扩展 AI 推理解决方案,旨在简化在各种云环境中部署应用程序的过程。据 NVIDIA 官方博客称,该创新平台旨在简化独立软件供应商(ISVs)在全球部署 AI 应用程序时面临的复杂性。

革新 AI 部署

借助 NVIDIA 云函数(NVCF),DGX Cloud 无服务器推理抽象了多集群基础架构设置,允许在多云和本地环境之间无缝扩展。该平台提供了一种统一的 AI 工作负载、高性能计算 (HPC) 和容器化应用程序的部署方法,使 ISVs 可以在无需管理复杂基础架构的情况下扩展其业务范围。

独立软件供应商的优势

这项无服务器推理解决方案为独立软件供应商提供了几个关键优势:

  • 降低运营复杂性: 不论云提供商如何,ISVs 可以借助单一统一服务将应用程序部署到更接近客户基础架构的地方。
  • 提高灵活性: 该平台允许快速扩展以适应突发或短期的工作负载。
  • 灵活的集成: 可使用自有的计算能力(BYO)集成现有计算设置。
  • 探索自由: ISVs 可以在不需投入长期投资的情况下尝试新的地理区域和提供商,以支持例如数据主权和低延迟要求的多样化用例。

支持多样化的工作负载

DGX Cloud 无服务器推理配备有适应各种工作负载的能力,包括 AI、图形和作业负载。它在运行大型语言模型(LLMs)、物体检测和图像生成任务方面表现出色。该平台还优化了图形工作负载,例如数字孪生和模拟,利用了 NVIDIA 在图形计算领域的专业知识。

工作原理

ISVs 可通过使用 NVIDIA NIM 微服务和蓝图开始使用 DGX Cloud 无服务器推理。该平台支持自定义容器,允许在多个计算目标之间自动扩展和全局负载平衡。这种设置使 ISVs 能够高效地部署应用程序,使用单一 API 端点进行请求管理。

先锋用例

几个 ISVs 已经采用了 DGX Cloud 无服务器推理,展示了其在变革多个行业方面的潜力。像 Aible 和 Bria 这样的公司正在利用该平台提升其 AI 驱动的解决方案,展示了在成本效率和可扩展性方面的显著改进。

随着 NVIDIA 在 AI 和云计算领域的持续创新,DGX Cloud 无服务器推理标志着在帮助 ISVs 轻松高效地充分利用 AI 技术潜力方面迈出了重要一步。



Read More