解决问题 – Ubuntu环境下NVIDIA-Driver经常掉驱动

Person:
– 下面的方法能够解决的问题
问题1:nvidia-smi显示没有找到硬件

问题2:Unable to load the kernel module ‘nvidia.ko’ 或 Unable to load the kernel module ‘nvidia.modest.ko’

问题3:An NVIDIA kernel module ‘nvidia-drm’ appears to already be loaded in your kernel ······

解决问题的方法
检查显卡硬件是否安装正确,查看列表中是否有NVIDIA显卡的信息;
lspci -nn
2. 删除所有的已安装的NVIDIA驱动的相关文件:

sudo apt-get remove –purge ‘^nvidia-.*’
若打不开命令行(屏幕黑屏),则想办法进入Recovery模式:
进入Rcovery模式,开机时狂按shift键,选择 Advance Options for Ubuntu 选项,然后选一个带(recovery mode)后缀的开机版本(选一个老一点的版本容易进)。
3. 安装NVIDIA驱动:

sudo sh NVIDIA-Linux-x86_64-535.54.03.run –no-opengl-files
4. 检查

nvidia-smi
ERROR: NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

若出现上面的问题

(5. 解决,版本需要对应)

sudo apt-get install dkms
sudo dkms install -m nvidia -v 535.54.03
(6. 再次检查)

nvidia-smi

ChatGPT:
– 你遇到的问题涉及到NVIDIA显卡驱动在Linux系统上的安装和配置问题。这些问题通常涉及到驱动程序的安装、内核模块的加载、硬件的识别等方面。下面是你提到的问题的解决方案:

问题1:nvidia-smi显示没有找到硬件

  • 解决方法 :首先确认显卡硬件是否正确安装。使用命令 lspci -nn 查看系统中是否识别到NVIDIA显卡。如果没有显示NVIDIA显卡,可能是硬件没有正确安装或者主板BIOS设置有问题。

问题2:Unable to load the kernel module ‘nvidia.ko’ 或 ‘nvidia.modest.ko’

  • 解决方法
  1. 删除所有已安装的NVIDIA驱动相关文件:sudo apt-get remove --purge '^nvidia-.*'
  2. 如果因为显卡驱动问题导致无法进入图形界面,可以尝试进入Recovery模式来进行操作。开机时按Shift键,选择 Advance Options for Ubuntu,然后选择一个带有 (recovery mode) 后缀的启动选项。

问题3:NVIDIA kernel module ‘nvidia-drm’ appears to already be loaded

  • 解决方法 :这个问题通常表示NVIDIA的DRM内核模块已经加载。如果你在尝试安装新驱动,可能需要先卸载或停用当前正在运行的模块。

安装NVIDIA驱动

  • 使用命令安装NVIDIA驱动:sudo sh NVIDIA-Linux-x86_64-535.54.03.run --no-opengl-files
  • 安装完成后,使用 nvidia-smi 命令检查。如果出现错误信息(比如无法与NVIDIA驱动通信),可能需要进一步的配置。

如果出现问题

  • 安装DKMS(动态内核模块支持):sudo apt-get install dkms
  • 使用DKMS安装指定版本的NVIDIA驱动:sudo dkms install -m nvidia -v 535.54.03
  • 再次使用 nvidia-smi 检查是否成功。

请确保在整个过程中,你使用的是正确的驱动版本,并且遵循所有安全和兼容性最佳实践。如果遇到问题,可能需要参考NVIDIA的官方文档或寻求社区的帮助。