关于 FlashMLA 的快讯列表
时间 | 详情 |
---|---|
2025-02-24 01:34 |
FlashMLA内核为Hopper GPU提升性能,支持BF16
根据DeepSeek,新的FlashMLA内核针对Hopper GPU进行了优化,支持可变长度序列并已投入生产,提供BF16支持,实现3000 GB/s的内存带宽和580 TFLOPS,这可以显著提高加密交易算法的计算效率。 |