NEW
快讯列表

关于 MoE GEMM 的快讯列表

时间 详情
2025-02-26
01:00
DeepGEMM库提升Hopper GPU上的FP8 GEMM性能

根据@deepseek_ai, 新推出的DeepGEMM库支持稠密和MoE GEMM,在Hopper GPU上实现了高达1350+ FP8 TFLOPS。这一进步对V3/R1训练和推理具有重要意义,为交易者提供了硬件投资和性能效率的潜在洞察。这一库设计轻量,无需重依赖,这对优化交易软件基础设施至关重要。此外,其完全即时编译的特性提升了性能,这对高频交易应用尤为重要。

来源