Windows下PaddlePaddle、CUDA环境安装、PaddleOCR-release-2.6最新版本使用cuda/gpu避坑

在windows系统下搭建paddlepaddle环境，在训练PaddleOCR使用gpu加速避坑

天地立心i

3901人浏览 · 2023-07-13 18:08:16

天地立心i · 2023-07-13 18:08:16 发布

深度学习，搭建环境气人啊！！！

终于把PaddleOCR-release-2.6跑通了，分享下经验，如有错误，恳请批评指正。

在 github中下载好源码后，点击这里，在使用icdar2015数据集做训练测试时，百度网盘数据集自行下载。

链接：https://pan.baidu.com/s/13_VUVLoodgcrgF7WIJwxlA?pwd=6666
提取码：6666

配置好后，运行发现cudnn版本太高，不支持深度学习加速的应用拓展cudnn64_8.dll

如图，我的是CUDA11.1后来又装了11.3,拓展是cudnn64_8.dll，显示如果想使用gpu加速，拓展得是cudnn64_7.dll，否则就报错，显示cudnn配置错误，当我将use_gpu调成false使用cpu跑时，跑通了，如图

但真的巨慢。去飞桨官方，飞桨paddlepaddle快速安装，查明了环境配置原因。如图

目前支持gpu的CUDA环境有CUDA11.7,11.6,11.2,10.2，没办法就又把CUDA11.1,11.3全部卸载，重装了cuda11.2，之前的包版本不匹配也全部删除，血泪史~心态要好，cuda官网地址

安装对应的cudnn,11.x的都能用，cudnn是cuda的一个重要补丁包，深度学习gpu加速必备，cudnn官网地址，下载需要注册。

不想麻烦的，这里给准备了一份cudnn对应cuda11.x、10.1、10.2补丁包以及paddle运行环境可能会出现的dll缺失文件，百度网盘链接如下

链接：https://pan.baidu.com/s/1ak617F-UD_-EVR8ZhEYHMA?pwd=6666

提取码：6666

需要自取。其中11.x版本有三个，建议安装8.5,具体安装cuda和cudnn以及缺失文件处理不多介绍，搜教程就行。

我的python是3.8版本，不想搭建那么多环境，把torch,torchvision,tochaudio装在和paddle一个环境里，但pytorch官网,官网地址，没有python3.8的cuda11.2完整的torch配套环境，直接pip会下成cpu版本的，使用cuda跑torch环境时加速不了，而且会莫名报错。参考这位博主的文章，安装了向下兼容的CUDA11.1版本的，命令如下：

pip install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html

配置了清华镜像源后，安装还是很快的，关于配置清华镜像源教程很多，不多赘述。成功安装gpu版本的torch。

对于paddlepaddle开发环境，安装命令如下(对于CUDA11.2,以下pip命令可直接使用)：

python -m pip install paddlepaddle-gpu==2.4.2.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

安装好后，在pycharm中打开项目文件，切换到根目录下所配置的环境下，新建终端，当然cmd,和Anaconda也是可以的，个人习惯使用pycharm终端，如果要下包的话还是建议去Anaconda。

测试paddle能否正常使用：

python

进入python环境

导入包

import paddle

有以下画面，这并不是报错，不影响，有时候也不出现这种情况，暂时没搞明白原因

输入检查代码

paddle.utils.run_check()

当出现以下标志时，恭喜paddlepaddle环境搭建成功，可以开始使用深度学习paddlepaddle框架了

pip list查看包

成功装上CUDA11.2版本的paddlepaddle

关于使PaddlePaddle支持windows其他版本CUDA：参考飞桨源码编译：官方链接，需要Visual Studio进行编译，高端操作，大佬自试~

关于PaddleOCR-release-2.6训练：具体操作参考链接如文章下方

这里介绍一下我所遇到的问题：raise ValueError( all input arrays must have the same shape）

查了很多资料原因，最终将Eval中loader的 batch_size_per_card调成1才跑通，有没有大佬，请教一下有没有别的解决方式

使用gpu果然快了很多，10倍都不止。

点点赞和关注哦~

参考链接：

cuda11.2版本的对应安装的pytorch版本_cuda11.2对应的pytorch_程序小K的博客-CSDN博客

PPv3-OCR自定义数据从训练到部署_AI浩的博客-CSDN博客

PaddleOCR使用笔记之模型训练_paddleocr training_great-wind的博客-CSDN博客

PaddleOCR 使用以及用自己的数据训练_苏三福的博客-CSDN博客

利用PPOCRLabel标注工具大批量自动标注自己的数据集_自动标注数据集_炮哥带你学的博客-CSDN博客

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

赛项征集 | 第二届开放原子开源大赛——汽车软件开源赛火热进行中

开放原子开发者工作坊

开放原子校源行启动优质开源课程征集，助力高校开源人才培养

校源行启动优质开源课程征集，助力高校开源人才培养

开放原子开发者工作坊

第二届Open Source Congress在北京成功举办

开放原子开发者工作坊

所有评论(0)

查看更多评论

天地立心i

@weixin_47418880

已为社区贡献1条内容