前言

ubuntu22.04安装nvidia驱动、cuda以及pytorch记录,主要是为了纠正网上很多文章的错误,避免走弯路。
我是在笔记本电脑测试的,安装了win11和ubuntu22.04双系统。
笔记本配置是12代i7、16G内存、3060 6G 显卡。安装ubuntu的时候就会出现黑屏无法启动的问题,这是显卡驱动的缘故,在grub提示下按e,然后添加nomodeset就可以进入系统了,这个按网上的文章叙述操作,基本都是可以的。
此外,装好系统之后还需要装个anaconda或者miniconda,这个按网上说的操作就行了,我装的miniconda。


一、安装nvidia显卡驱动

这个有很多方法,我是采用比较懒的方式,直接打开附加驱动,然后选择一个nvidia专用驱动安装,我选的是闭源的,目前版本是535和545,我安装的是545。装好之后重启即可。
请添加图片描述

二、安装cuda-toolkit

装好nvdia显卡驱动后,打开终端运行

nvidia-smi

可以看到如下信息:
请添加图片描述

注意右上角显示CUDA Version:12.3,这也是这个版本的显卡驱动最高支持的cuda-toolkit版本。
接下来打开nvidia cuda的官方网页 链接: cuda-downloads
底下的 Archive of Previous CUDA Releases 可以选择其它版本,这里就以安装最新的12.3.2为例,如下图所示选择:
请添加图片描述
installer type我习惯选择network,本地的话总觉得占空间太多。
然后具体安装就按底下的 base installer说明来

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-3

由于前面已经安装了显卡驱动,所以后面的Driver Installer步骤就不要执行了,切记,否则还可能出错。

三、安装pytorch

注意,新版本的pytorch已经自带python版本的cuda了,和前面装的cuda没有关系,换句话说,第二步和第三步是独立的。
这里还是从pytorch的官网找安装步骤(最好新建一个conda环境安装)
请添加图片描述
如上图,安装2.2.1稳定版本,pip方式安装,带cuda12.1,直接执行图上的指令即可

pip3 install torch torchvision torchaudio

安装完成后,可以进入python3环境,执行如下指令查看torch版本

import torch
print(torch.__version__)

请添加图片描述


总结

最后说下两点容易出问题的地方:
1、已经安装了nvidia显卡驱动后,再安装cuda,一定注意只安装cuda-toolkit,不要安装cuda或者cuda-driver,否则有可能显卡驱动出错,进不了系统,如果出现这种情况,还是可以nomodeset进系统,然后重装驱动。
2、pytorch自带了python版本的cuda,与nvdia单独提供的cuda无关,所以无需再考虑版本匹配问题,如果只使用pytorch,那么可以跳过第二步。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐