What is tensorrt? tensorrt news, tensorrt meaning, tensorrt definition

NVIDIA H100 GPUs 和 TensorRT-LLM 实现 Mixtral 8x7B 的突破性性能

NVIDIA 的 H100 Tensor Core GPU 和 TensorRT-LLM 软件展示了 Mixtral 8x7B 模型在 FP8 精度下的破纪录性能。

by realtime news
Jul 03, 2024

NVIDIA TensorRT-LLM 提升希伯来语 LLM 性能

NVIDIA 的 TensorRT-LLM 和 Triton Inference Server 优化了希伯来语大型语言模型的性能，克服了独特的语言挑战。

by realtime news
Aug 07, 2024

NVIDIA发布TensorRT Model Optimizer v0.15，提升推理性能

NVIDIA发布了TensorRT Model Optimizer v0.15版本，通过缓存扩散和扩大AI模型支持等新功能提升推理性能。

by realtime news
Aug 16, 2024

使用 NVIDIA Triton 和 TensorRT-LLM 在 Kubernetes 上增强大型语言模型

探索 NVIDIA 使用 Triton 和 TensorRT-LLM 优化大型语言模型的方法，同时在 Kubernetes 环境中高效地部署和扩展这些模型。

by realtime news
Oct 23, 2024

NVIDIA 的 TensorRT-LLM 多模块注意力在 HGX H200 上提升 AI 推理性能

NVIDIA 的 TensorRT-LLM 引入多模块注意力，显著提升了 HGX H200 上的 AI 推理吞吐量，提升幅度高达 3.5 倍，解决了长序列长度的挑战。

by realtime news
Nov 22, 2024

NVIDIA使用TensorRT-LLM提升Llama 3.3 70B模型性能

了解NVIDIA的TensorRT-LLM如何利用先进的推测解码技术将Llama 3.3 70B模型推理吞吐量提升3倍。

by realtime news
Dec 18, 2024

NVIDIA NIM革新AI模型部署，优化微服务

NVIDIA NIM简化了微调AI模型的部署，提供性能优化的微服务以实现无缝推理，从而增强企业AI应用。

by realtime news
Nov 22, 2024

NVIDIA TensorRT-LLM 在飞行批处理中增强编码器-解码器模型

NVIDIA 的 TensorRT-LLM 现在支持具有飞行批处理功能的编码器-解码器模型，为 AI 应用提供优化的推理。探索 NVIDIA GPU 上生成式 AI 的增强功能。

by realtime news
Dec 12, 2024

NVIDIA通过TensorRT-LLM中的ReDrafter支持增强LLM推理

NVIDIA的TensorRT-LLM现在支持Apple的ReDrafter，通过投机解码优化大语言模型推理，在NVIDIA GPU上提供显著的性能提升。

by realtime news
Dec 19, 2024

NVIDIA TensorRT 革命性提升 Adobe Firefly 的视频生成

NVIDIA TensorRT 优化了 Adobe Firefly，将延迟降低了60%，成本减少了40%，通过对 Hopper GPU 的 FP8 量化，提高了视频生成效率。

by realtime news
Apr 22, 2025

NVIDIA 的 FP4 图像生成提升 RTX 50 系列 GPU 性能

NVIDIA 最新的 TensorRT 更新引入了针对 RTX 50 系列 GPU 的 FP4 图像生成，提升了 AI 模型的性能和效率。探索生成式 AI 技术的进步。

by realtime news
May 14, 2025

NVIDIA 发布 RTX 版 TensorRT：增强 Windows 11 上的 AI 推理

NVIDIA 推出 RTX 版 TensorRT，这是一个为 Windows 11 优化的 AI 推理库，在创意、游戏和生产力应用程序中增强了 AI 体验。

by realtime news
May 19, 2025

NVIDIA发布TensorRT for RTX以提升AI应用性能

NVIDIA推出TensorRT for RTX，这是一款新的SDK，旨在提升NVIDIA RTX GPU上的AI应用性能，支持Windows和Linux上的C++和Python集成。

by realtime news
Jun 12, 2025

NVIDIA TensorRT 提升 RTX GPU 上的 Stable Diffusion 3.5 性能

NVIDIA 的 TensorRT SDK 显著提升了 Stable Diffusion 3.5 的性能，将 VRAM 需求减少了 40%，并使 RTX GPU 的效率翻倍。

by realtime news
Jun 12, 2025

FLUX.1 Kontext 通过低精度量化技术革新图像编辑

黑森林实验室推出的 FLUX.1 Kontext，利用 NVIDIA 的 TensorRT，优化了使用低精度量化的 RTX GPU 图像编辑性能。

by realtime news
Jul 02, 2025

NVIDIA RTX AI 通过 FLUX.1 Kontext 发布提升图像编辑

NVIDIA RTX AI 和 TensorRT 提升了 Black Forest Labs 的 FLUX.1 Kontext 模型，通过更快的性能和更低的 VRAM 要求简化了图像生成和编辑。

by realtime news
Jul 03, 2025

使用 TensorRT 优化 LLM 推理：全面指南

探索如何通过基准测试和调优优化性能，TensorRT-LLM 提升大型语言模型推理，为开发者提供一个高效部署的强大工具集。

by realtime news
Jul 07, 2025

提升AI模型效率：Torch-TensorRT加速PyTorch推理

了解Torch-TensorRT如何为NVIDIA GPU优化PyTorch模型，通过最少的代码更改将扩散模型的推理速度翻倍。

by realtime news
Jul 25, 2025

tensorrt

Trending topics