根据 NVIDIA 技术博客,NVIDIA 宣布将在即将发布的 R560 驱动程序中,彻底转向开源 GPU 内核模块,这标志着其驱动策略的重大转变。此举建立在公司于 2022 年 5 月发布的 R515 驱动程序中首次推出的开源 GPU 内核模块之基础,该版本旨在针对数据中心计算 GPU。
性能和新功能
在过去两年中,NVIDIA 努力确保开源 GPU 内核模块的性能达到或超过其专有模块的性能。公司还引入了几个新功能,包括:
- 异构内存管理 (HMM) 支持
- 机密计算
- 针对 Grace 平台的相干内存架构
- 等等
这些进展使得 NVIDIA 认为现在是全面转向开源 GPU 内核模块的最佳时机。
支持的 GPU
并非所有 GPU 都兼容开源 GPU 内核模块。对于如 NVIDIA Grace Hopper 或 NVIDIA Blackwell 之类的尖端平台,开源模块是必须的,因为不支持专有驱动程序。NVIDIA 建议为 Turing、Ampere、Ada Lovelace 或 Hopper 架构的新型 GPU 切换到开源模块。
然而,旧版 GPU,如 Maxwell、Pascal 或 Volta 架构,将无法兼容开源模块,应该继续使用专有驱动程序。对于混合部署旧版和新版 GPU 的情况,专有驱动程序仍为推荐选项。
NVIDIA 提供了一个检测辅助脚本,帮助用户确定适合其系统的驱动程序。
安装程序更改
通过所有方法安装的默认驱动程序将从专有驱动程序变为开源驱动程序。需要注意的具体场景包括:
- 包含 CUDA 元包的包管理器
- Runfile 安装
- 安装辅助脚本
- 包管理器具体信息
- Windows 子系统 (WSL) 的 Linux
- CUDA 工具包
使用包含 CUDA 元包的包管理器
通过包管理器安装 CUDA 工具包时,用户通常会安装顶层 cuda
包,其中包括 CUDA 工具包和相关的驱动程序版本。随着即将发布的 CUDA 12.6 版本,此过程将切换以默认更倾向于开源模块。
使用 Runfile
对于使用 .run
文件安装 CUDA 或 NVIDIA 驱动程序的用户,安装程序将自动选择最适合系统的驱动程序。用户还可以通过 UI 切换或命令行覆盖来手动选择专有或开源驱动程序。
使用安装助手脚本
NVIDIA 创建了一个帮助脚本,引导用户选择适合其 GPU 的驱动程序。该脚本可在安装 nvidia-driver-assistant
包后运行。
包管理器详细信息
NVIDIA 建议使用包管理器安装 CUDA 工具包和驱动程序。不同发行版的具体命令包括:
apt:基于 Ubuntu 和 Debian 的发行版
$ sudo apt-get install nvidia-open
dnf:Red Hat Enterprise Linux、Fedora、麒麟、Amazon Linux、Rocky Linux
$ sudo dnf module install nvidia-driver:open-dkms
zypper:SUSE Linux Enterprise Server、OpenSUSE
$ sudo zypper install nvidia-open
Windows 子系统 (WSL) 的 Linux
WSL 使用主机 Windows 操作系统中的 NVIDIA 内核驱动程序,因此无需在 WSL 中安装特定驱动程序。
CUDA 工具包
CUDA 工具包的安装过程保持不变。用户可以通过以下命令使用包管理器安装它:
$ sudo apt-get/dnf/zypper install cuda-toolkit
更多信息
有关驱动程序安装和 CUDA 工具包设置的详细说明,请参阅 CUDA 安装指南。
Image source: Shutterstock