FLUX.1 Kontext 通过低精度量化技术革新图像编辑
realtime news Jul 02, 2025 15:50
黑森林实验室推出的 FLUX.1 Kontext,利用 NVIDIA 的 TensorRT,优化了使用低精度量化的 RTX GPU 图像编辑性能。

黑森林实验室推出了最新的 FLUX.1 Kontext 模型,承诺通过创新的低精度量化技术提升图像编辑领域。该新模型与 NVIDIA 合作开发,通过集成尖端的优化技术,转变了图像到图像的转换任务,为扩散模型推理性能带来了范式转变。
创新的编辑能力
FLUX.1 Kontext [dev] 模型以提供用户更大的灵活性和效率进行图像编辑而脱颖而出。与依赖于复杂提示和难以获得的遮罩的传统方法不同,该模型引入了一种更直观的编辑过程。用户现在可以执行多回合的图像编辑,使复杂任务分解为可管理的阶段,同时保持原始图像的语义完整性。
针对 NVIDIA RTX GPU 的优化
利用 NVIDIA RTX GPU 的能力,FLUX.1 Kontext [dev] 使用 TensorRT 和量化来实现更快的推理速度和降低的 VRAM 需求。这种优化依赖于 NVIDIA 在 RTX 50 系列 GPU 的 FP4 图像生成领域的现有进展,展示了低精度量化如何革新用户体验。
流水线和量化技术
该模型整合了若干关键模块,包括视觉变压器骨干和自动编码器,经过优化以增强性能。变压器模块消耗了大量的处理时间,因此针对其进行了优化,采用了 FP8 和 FP4 格式等量化策略。这些技术减少了内存使用和计算需求,使模型在各种硬件配置上更易于访问。
性能与效率
性能测试表明,从 BF16 过渡到 FP8 精度时,效率显著提高,而在 FP4 精度上更有提升。作为变压器架构关键组成的缩放点积注意力算子的量化,在提升推理效率的同时保持了高数值精度发挥了关键作用。
性能改进在消费级 GPU(如 NVIDIA RTX 5090)上尤为显著,受益于减小的内存占用,允许多个模型实例同时运行,提高了吞吐量和成本效率。
结论
FLUX.1 Kontext [dev] 模型结合低精度量化与 NVIDIA 的 TensorRT,展示了图像编辑能力的重大进步。通过优化推理性能和降低内存消耗,该模型提供了一种鼓励创意探索的响应式用户体验。黑森林实验室与 NVIDIA 的合作为先进 AI 技术的广泛应用铺平了道路,民主化了对强大图像编辑工具的访问。
有关 FLUX.1 Kontext 模型及其优化技术的更多详细见解,请访问 NVIDIA 开发者博客。
Image source: Shutterstock