根据NVIDIA博客,NVIDIA发布了一系列新的CUDA库,旨在扩展加速计算的能力,承诺在多种应用中实现显著的速度和能源效率提升。
增强的多样化应用能力
新库针对一系列应用,包括大语言模型(LLM)、数据处理和物理AI。主要亮点包括:
- NeMo Curator:促进定制数据集的创建,现在具有图像整理功能。
- cuVS:一个矢量搜索库,可以在几分钟内建立索引,速度远快于传统方法。
- Warp:通过新的Tile API加速物理仿真,实现更高效的计算。
- Aerial:为无线网络仿真添加了更多地图格式。
- Sionna:为无线仿真引入了新的实时推断工具链。
实际影响
全球各地的公司正在越来越多地采用NVIDIA的加速计算解决方案,实现了显著的速度提升和能源节省。例如,CPFD的Barracuda Virtual Reactor软件在回收站中使用时,相比CPU工作站在CUDA GPU加速的虚拟机上运行速度快了400倍,能源效率提高了140倍。
一种流行的视频会议应用在将其实时字幕系统从CPU迁移到云中的GPU之后,速度提升了66倍,能源效率提高了25倍。同样,一个电子商务平台通过切换到NVIDIA的加速云计算系统,减少了延迟,速度提升了33倍,能源效率提高了近12倍。
CUDA GPU上的NVIDIA加速计算是可持续计算
NVIDIA估算,如果所有当前在CPU服务器上运行的AI、HPC和数据分析工作负载都切换到CUDA GPU加速系统,数据中心每年可以节省40太瓦时的能源,相当于500万个美国家庭每年的能源消耗。
加速计算使用CUDA GPU的并行处理能力,比CPU更快、更高效地完成任务。虽然添加GPU会增加峰值功率,但总能源消耗由于任务完成速度更快和随后的低功耗状态而显著降低。
为每个任务提供合适的工具
NVIDIA提供了一套多样化的库,优化了各种工作负载。新的更新扩展了CUDA平台,以支持更广泛的应用:
LLM应用
NeMo Curator和Nemotron-4 340B提供了高级功能,用于创建定制数据集和生成高质量的合成数据。
数据处理应用
cuVS和Polars提供显著的性能提升,使大规模数据处理更加高效。
物理AI
Warp、Aerial和Sionna为物理仿真和无线网络研究引入了新功能,提升了这些平台的能力。
NVIDIA的CUDA库对于加速特定工作负载至关重要,提供了专门的工具来满足多种计算需求。拥有超过400个库,NVIDIA继续在提供强大、高效的现代计算解决方案方面保持领先。
Image source: Shutterstock