Python-pytesseract OCR识别


使用方法:

  1. pip install pytesseract
  2. 下载安装 Tesseract-OCR
  3. 修改 pytesseract 源码中的路径

    (文件位置:Python安装目录 \Lib\site-packages\pytesseract\pytesseract.py

  4. 将 tesseract_cmd 的值 改为 Tesseract-OCR 的安装路径\tesseract.exe

    tesseract cmd = r*D:\Tools\Tesseract-OCR\tesseract.exe

  5. 识别中文需要下载新的字库
  6. 将下载的中文库放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中

运行代码:

import pytesseract
from PIL import Image
image = Image.open(r'路径\1.png')
print(pytesseract.image_to_string(image), lang='chi_sim')

Last modification:July 21, 2023
如果觉得我的文章对你有用,请随意赞赏