cuda
NVIDIA CUDA Toolkit 12.4 加强运行时 Fatbin 的创建
NVIDIA CUDA Toolkit 12.4 引入了 nvFatbin 库,简化了运行时 fatbin 的创建并增强了 GPU 代码的兼容性。
NVIDIA 推出适用于 CUDA 应用程序的 CRIU 检查点工具
NVIDIA 的新工具 cuda-checkpoint 结合 CRIU,可实现 Linux 上 CUDA 应用程序的透明检查点和恢复功能。
NVIDIA通过CUDA-X加速增强Polars数据处理
NVIDIA将CUDA-X与Polars集成,大幅提升数据处理速度。此次更新可将性能提高至13倍,增强数据科学家和工程师的效率。
Numbast 架起 CUDA C++ 和 Python 生态系统的桥梁
Numbast 通过引入自动化管道,将 CUDA C++ API 转换为 Numba 绑定,增强了 Python 开发者对 CUDA 性能的访问。
NVIDIA通过CUDA-Q平台增强谷歌量子AI处理器设计
NVIDIA与谷歌量子AI合作,利用NVIDIA的CUDA-Q平台推进量子计算设计,实现大规模模拟以解决量子硬件中的噪声挑战。
通过 nvmath-python 的矩阵乘法和后记融合增强深度学习
探索 nvmath-python 如何利用 NVIDIA CUDA-X 数学库进行高性能矩阵运算,通过后记融合优化深度学习任务,详细信息由 Szymon Karpiński 提供。
NVIDIA 发布 CUDA-QX 库以提升量子超级计算
NVIDIA 推出 CUDA-QX,一组旨在通过将 AI 工具与量子处理单元 (QPU) 集成来增强量子超级计算能力的库。
解码 PTX:NVIDIA CUDA GPU 计算的核心
探索 PTX,这种用于 NVIDIA CUDA GPU 的汇编语言,它在实现向前兼容性方面的作用,以及其在 GPU 计算领域的重要性。
NVIDIA 的 cuEmbed 提升 GPU 嵌入查找性能
NVIDIA 发布了 cuEmbed,这是一个 CUDA 库,显著增强了 GPU 上的嵌入查找功能,承诺为推荐系统和其他应用程序带来更好的性能。
使用 NVIDIA CUDA-X 和 Coiled 增强云端数据科学
探索 NVIDIA CUDA-X 和 Coiled 如何简化云端数据科学,提供显著的计算速度提升并简化数据科学家基础设施管理。
Infleqtion 利用 NVIDIA 的 CUDA-Q 通过 Q-CHOP 增强投资组合优化
Infleqtion 利用 NVIDIA 的 CUDA-Q 平台,通过 Q-CHOP 算法增强投资组合优化,承诺通过量子计算改善财务成果。
半导体行业拥抱 NVIDIA Blackwell 和 CUDA-X 以增强制造
领先的半导体公司正在采用 NVIDIA 的 Blackwell 和 CUDA-X 平台,以加速制造流程、改善光刻技术,并增强模拟能力。