Python-pytesseract OCR识别
使用方法:
- pip install pytesseract
- 下载安装 Tesseract-OCR
修改 pytesseract 源码中的路径
(文件位置:Python安装目录 \Lib\site-packages\pytesseract\pytesseract.py
将 tesseract_cmd 的值 改为 Tesseract-OCR 的安装路径\tesseract.exe
tesseract cmd = r*D:\Tools\Tesseract-OCR\tesseract.exe
- 识别中文需要下载新的字库
- 将下载的中文库放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中
运行代码:
import pytesseract
from PIL import Image
image = Image.open(r'路径\1.png')
print(pytesseract.image_to_string(image), lang='chi_sim')