可以去Github查看tesseract-ocr的信息:https://github.com/tesseract-ocr/tesseract
在写这篇随笔的时候(2018年8月21日)最新版本是3.05.01,下载地址是:https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01

下载好之后进行安装,我安装的过程中勾选了一个语言是“English-Middle”的,不过好像它默认就有英文和数字……
设置环境变量TESSDATA_PREFIX为tesseract的安装位置,我这里是:D:\Program Files (x86)\Tesseract-OCR
并将其添加到环境变量PATH中。

然后再命令行输入tesseract -v查看是否安装成功。

PS C:\Users\zifeiy\Pictures> tesseract -v
tesseract 3.05.02
 leptonica-1.75.3
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.2.0

然后测试一下下面这张图片:
1235863-20180821081704233-2143411068.jpg

结果是:

PS C:\Users\zifeiy\Pictures> tesseract CheckCode.jpg stdout
Warning. Invalid resolution 0 dpi. Using 70 instead.
0481

成功!

转载于:https://www.cnblogs.com/zifeiy/p/9509234.html

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐