深度学习,搭建环境气人啊!!!

终于把PaddleOCR-release-2.6跑通了,分享下经验,如有错误,恳请批评指正。

在 github中下载好源码后,点击这里,在使用icdar2015数据集做训练测试时,百度网盘数据集自行下载。

链接:https://pan.baidu.com/s/13_VUVLoodgcrgF7WIJwxlA?pwd=6666 
提取码:6666

配置好后,运行发现cudnn版本太高,不支持深度学习加速的应用拓展cudnn64_8.dll

如图,我的是CUDA11.1后来又装了11.3,拓展是cudnn64_8.dll,显示如果想使用gpu加速,拓展得是cudnn64_7.dll,否则就报错,显示cudnn配置错误,当我将use_gpu调成false使用cpu跑时,跑通了,如图

 但真的巨慢。去飞桨官方,飞桨paddlepaddle快速安装,查明了环境配置原因。如图

 目前支持gpu的CUDA环境有CUDA11.7,11.6,11.2,10.2,没办法就又把CUDA11.1,11.3全部卸载,重装了cuda11.2,之前的包版本不匹配也全部删除,血泪史~心态要好,cuda官网地址

 

 安装对应的cudnn,11.x的都能用,cudnn是cuda的一个重要补丁包,深度学习gpu加速必备,cudnn官网地址,下载需要注册。

不想麻烦的,这里给准备了一份cudnn对应cuda11.x、10.1、10.2补丁包以及paddle运行环境可能会出现的dll缺失文件,百度网盘链接如下

链接:https://pan.baidu.com/s/1ak617F-UD_-EVR8ZhEYHMA?pwd=6666

提取码:6666

需要自取。其中11.x版本有三个,建议安装8.5,具体安装cuda和cudnn以及缺失文件处理不多介绍,搜教程就行。

我的python是3.8版本,不想搭建那么多环境,把torch,torchvision,tochaudio装在和paddle一个环境里,但pytorch官网,官网地址,没有python3.8的cuda11.2完整的torch配套环境,直接pip会下成cpu版本的,使用cuda跑torch环境时加速不了,而且会莫名报错。参考这位博主的文章,安装了向下兼容的CUDA11.1版本的,命令如下:

pip install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html

配置了清华镜像源后,安装还是很快的,关于配置清华镜像源教程很多,不多赘述。成功安装gpu版本的torch。

对于paddlepaddle开发环境,安装命令如下(对于CUDA11.2,以下pip命令可直接使用):

python -m pip install paddlepaddle-gpu==2.4.2.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

安装好后,在pycharm中打开项目文件,切换到根目录下所配置的环境下,新建终端,当然cmd,和Anaconda也是可以的,个人习惯使用pycharm终端,如果要下包的话还是建议去Anaconda。

测试paddle能否正常使用:

python

进入python环境

导入包

import paddle

 有以下画面,这并不是报错,不影响,有时候也不出现这种情况,暂时没搞明白原因

 输入检查代码

paddle.utils.run_check()

当出现以下标志时,恭喜paddlepaddle环境搭建成功,可以开始使用深度学习paddlepaddle框架了

 pip list查看包

成功装上CUDA11.2版本的paddlepaddle

关于使PaddlePaddle支持windows其他版本CUDA:参考飞桨源码编译:官方链接,需要Visual Studio进行编译,高端操作,大佬自试~

 关于PaddleOCR-release-2.6训练:具体操作参考链接如文章下方

这里介绍一下我所遇到的问题:raise ValueError( all input arrays must have the same shape)

查了很多资料原因,最终将Eval中loader的 batch_size_per_card调成1才跑通,有没有大佬,请教一下有没有别的解决方式

 使用gpu果然快了很多,10倍都不止。

 点点赞和关注哦~

参考链接:

cuda11.2版本的对应安装的pytorch版本_cuda11.2对应的pytorch_程序小K的博客-CSDN博客

PPv3-OCR自定义数据从训练到部署_AI浩的博客-CSDN博客

PaddleOCR使用笔记之模型训练_paddleocr training_great-wind的博客-CSDN博客

PaddleOCR 使用以及用自己的数据训练_苏三福的博客-CSDN博客

利用PPOCRLabel标注工具大批量自动标注自己的数据集_自动标注数据集_炮哥带你学的博客-CSDN博客

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐