centos7 下的python使用tesseract-ocr完成验证码识别
1.tesseract-ocr安装没找到直接命令安装,所以需要手动下载安装包。GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)在上述地址中下载最新的tesseract-ocr的安装包,并解压。通过以下命令安装:(1)cd tesseract-3.04.01(2)./autogen
1.tesseract-ocr安装
没找到直接命令安装,所以需要手动下载安装包。
GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
在上述地址中下载最新的tesseract-ocr的安装包,并解压。
通过以下命令安装:
(1)cd tesseract-3.04.01
(2)./autogen.sh
(3)./configure
注意,如果出现**error: leptonica not found**,需要下载安装**leptonica**
http://www.leptonica.org/download.html
(4)make
(5)make install
(6)ldconfig
2.pytesseract安装
sudo pip install pytesseract
3.Pillow 安装
sudo pip install pillow
如果报错:
1.pytesseract.pytesseract.TesseractError: (1,'Error opening data file /usr/local/share/tessdata/eng.traineddata')
eng.traineddata.gz
下载地址:
链接:https://pan.baidu.com/s/1hQ3E8OW4T4xKj4x4tOpEZA
提取码:isf1
解决方法:(原文地址ocr - Tesseract running error - Stack Overflow)
(1)$ wget https://tesseract-ocr.googlecode.com/files/eng.traineddata.gz
(2)$ gunzip eng.traineddata.gz
(3)$ sudo mv -v eng.traineddata /usr/local/share/tessdata/
更多推荐
所有评论(0)