可以去Github查看tesseract-ocr的信息:https://github.com/tesseract-ocr/tesseract
在写这篇随笔的时候(2018年8月21日)最新版本是3.05.01,下载地址是:https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01
下载好之后进行安装,我安装的过程中勾选了一个语言是“English-Middle”的,不过好像它默认就有英文和数字……
设置环境变量TESSDATA_PREFIX
为tesseract的安装位置,我这里是:D:\Program Files (x86)\Tesseract-OCR
。
并将其添加到环境变量PATH
中。
然后再命令行输入tesseract -v
查看是否安装成功。
PS C:\Users\zifeiy\Pictures> tesseract -v
tesseract 3.05.02
leptonica-1.75.3
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.2.0
然后测试一下下面这张图片:
结果是:
PS C:\Users\zifeiy\Pictures> tesseract CheckCode.jpg stdout
Warning. Invalid resolution 0 dpi. Using 70 instead.
0481
成功!
所有评论(0)