在这里插入图片描述

一、查看显卡版本命令

  1. 查看GPU驱动版本及支持的最高cuda版本
    • 命令:nvidia-smi
    • 作用:显示GPU驱动版本和driverAPI(支持的最高cuda版本)。
  2. 动态监控显卡状态
    • 命令:watch -n 1 nvidia-smi
    • 作用:每隔1秒动态监控显卡状态。
  3. 查看cuda版本及运行时API
    • 命令:nvcc -V
    • 作用:显示cuda版本和timeAPI(运行时API)。

二、更新驱动

2.1 下载显卡驱动

  1. 查看显卡信息

    • 命令:lspci | grep -i nvidia
    • 作用:查看自己的显卡信息。
      在这里插入图片描述
  2. 下载驱动

    • 登录NVIDIA官方网站(官方驱动 | NVIDIA),根据自己的显卡信息选择适合的驱动型号和版本,保存为.run文件。
      在这里插入图片描述

2.2 安装前配置

  1. 验证系统是否安装必要工具
    • 验证命令:
      • gcc –v
      • g++ -v
    • 安装命令:若未安装,使用yum install gcc gcc-c++ tar make进行安装。
  2. 安装kernel-header包
    • 若未安装,使用yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)进行安装。
  3. 卸载已安装的驱动
    • 命令:sudo /usr/bin/nvidia-uninstall
    • 注意:出现xconfig选择yes。
  4. 查询并禁用Nouveau模块
    • 查询命令:lsmod | grep nouveau
    • 若有输出表示该模块正在运行,需要禁用。
    • 禁用方法:
      • 编辑文件vim /usr/lib/modprobe.d/blacklist-nouveau.conf,按I进入插入模式,写入以下内容:
blacklist nouveau
options nouveau modeset=0
  - 按`esc`退出插入模式,按`shift + :`,输入`wq`保存并退出文件。
- 使内核生效并重启服务器:
  - `dracut -f`
  - `systemctl set-default multi-user.target`
  - `reboot`
- 再次查询:`lsmod | grep nouveau`,若无输出则禁用成功。

2.3 安装显卡驱动

  1. 上传驱动程序:将下载好的驱动程序(如NVIDIA-Linux-x86_64-460.106.00.run)上传至GPU节点(服务器)。

  2. 赋予执行权限并安装

    • 命令:
      • sudo chmod a+x NVIDIA-Linux-x86_64-460.106.00.run
      • sudo ./NVIDIA-Linux-x86_64-460.106.00.run
  3. 安装过程处理在这里插入图片描述

    • 安装过程中若显示问题,选择NO继续。
    • 若出现警告可忽略,直至安装完成。
  4. 验证安装结果:安装后输入nvidia-smi,若显示正常则安装成功。
    在这里插入图片描述

三、下载更换cuda版本

3.1 下载cuda

到官网(CUDA Toolkit Archive | NVIDIA Developer)找到所需的cuda版本,选择对应主机(服务器)的下载安装命令。例如,安装CUDA - 11.1:

wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run

在这里插入图片描述

3.2 安装过程选项处理

  1. 同意协议:选择accept
  2. 不要勾选driver(按空格使[ ]中没有X)。
  3. 选择YES替换旧的软连接。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

3.3 配置环境变量

vi ~/.bashrc文件末端加上配置信息,以下两种配置二选一:

  1. /usr/local中有cuda的软连接时:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
  1. /usr/local没有cuda软连接时,直接硬链接:
export PATH=/usr/local/cuda-xx.x/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH
  1. 刷新配置文件:source ~/.bashrc,使配置生效。
  2. 验证安装结果:安装完成后输入nvcc -V,若显示正常则安装成功。在这里插入图片描述
  3. 分别查看nvidia驱动和cuda版本,更新完成。
    在这里插入图片描述
Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐