NVIDIA 发布 RTX 版 TensorRT:增强 Windows 11 上的 AI 推理
realtime news May 19, 2025 13:21
NVIDIA 推出 RTX 版 TensorRT,这是一个为 Windows 11 优化的 AI 推理库,在创意、游戏和生产力应用程序中增强了 AI 体验。

NVIDIA 公开了 RTX 版 TensorRT,这是一个新的 AI 推理库,旨在提升 Windows 11 上的性能。根据 NVIDIA 的博客,此项开发旨在通过提供标准化 API 的优化加速,为创意、游戏和生产力应用中的 AI 体验提供支持。
RTX 版 TensorRT:主要特点
RTX 版 TensorRT 建立在 NVIDIA TensorRT 推理库成功的基础上,提供 NVIDIA RTX GPU 的显著性能提升。它支持多种量化类型,包括 FP4,使新一代 AI 模型能够在消费级 GPU 上运行。该库轻量化,不到 200 MB,并与微软的 AI 推理框架 Windows ML 无缝集成。
优化的性能
与基线 DirectML 相比,该库在 GeForce RTX 5090 上演示的性能提升超过 50%。它还支持 NVIDIA 张量核心上的 FP4 和 FP8 计算的原生加速,为 AI 工作负载释放更高吞吐量。
简化的开发者体验
RTX 版 TensorRT 采用即时 (JIT) 编译,在几秒钟内对 RTX GPU 优化神经网络。这个在应用程序安装期间进行的过程支持包括 CNN、音频、扩散和变压器模型在内的一系列模型。该库的高效编译过程旨在增强 PC AI 用例的开发者工作流程。
更广泛的影响和可用性
RTX 版 TensorRT 的推出恰逢微软 Build 大会,此时库已在 Windows ML 公共预览版中发布。独立版本将于六月在 NVIDIA 的开发者门户网站提供。该库承诺减少构建时间和提高运行时性能,为 Windows 平台上的 AI 推理功能提供了飞跃。
开发者可以通过微软 Build 会议进一步探索 RTX 版 TensorRT 的功能,NVIDIA 将展示如何在 RTX PC 上强力提升 AI 性能。
Image source: Shutterstock