hans

hans

【Linux】NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver


系统是 Ubuntu20,NVIDIA Quadro GP100 是服务器计算卡,和我们平时用的 gtx,rtx 卡不一样。正常卡我都是 apt 安装驱动,然后 nvidia 官网下载对应版本 cuda。但是我在这个卡上,怎么安装都失败,最基本的 nvidia-smi 都调不出来。

废话不多上正文,通过下面是另一种安装方法,驱动和 cuda 会一起安装最新版本的。

第一步:

检查

/etc/modprobe.d/

/lib/modprobe.d/

两个目录下是否有 blacklist-nvidia.conf 文件,有的话删掉。

第二步禁用 nouveau 驱动:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

添加以下两行内容:

blacklist nouveau

options nouveau modeset=0

退出,然后运行:

sudo update-initramfs -u

sudo reboot

可以通过命令 inxi -G 来看你是否禁用 nouveau 成功

第三步清除 nvidia 和 cuda 残余:

sudo apt remove --purge -y nvidia-*

sudo apt remove --purge -y cuda-*

第四步:

sudo wget -O /etc/apt/preferences.d/cuda-repository-pin-600 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin

sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub

sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"

第五步:

sudo apt update 

sudo apt install cuda

第六步设置环境变量:

echo 'export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}' >> ~/.bashrc

重启之后就可以 nvidia-smi 了。

Loading...
Ownership of this post data is guaranteed by blockchain and smart contracts to the creator alone.