1.tesseract-ocr安装

没找到直接命令安装,所以需要手动下载安装包。

GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)

在上述地址中下载最新的tesseract-ocr的安装包,并解压。

通过以下命令安装:

(1)cd tesseract-3.04.01

(2)./autogen.sh

(3)./configure

注意,如果出现**error: leptonica not found**,需要下载安装**leptonica**

http://www.leptonica.org/download.html

(4)make

(5)make install

(6)ldconfig

2.pytesseract安装

sudo pip install pytesseract

3.Pillow 安装

sudo pip install pillow

如果报错:

1.pytesseract.pytesseract.TesseractError: (1,'Error opening data file /usr/local/share/tessdata/eng.traineddata')

eng.traineddata.gz

下载地址:

链接:https://pan.baidu.com/s/1hQ3E8OW4T4xKj4x4tOpEZA 
提取码:isf1 

解决方法:(原文地址ocr - Tesseract running error - Stack Overflow)

(1)$ wget https://tesseract-ocr.googlecode.com/files/eng.traineddata.gz

(2)$ gunzip eng.traineddata.gz

(3)$ sudo mv -v eng.traineddata /usr/local/share/tessdata/

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐