博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python验证码简单识别
阅读量:5365 次
发布时间:2019-06-15

本文共 727 字,大约阅读时间需要 2 分钟。

使用pytesseract时得先安装tesseract,tesseract-ocr和pytesseract

from PIL import Imagefrom PIL import ImageEnhanceimport pytesseractimport re# 如果报错加上下面两行代码,更改tesseract路径pytesseract.pytesseract.tesseract_cmd = 'D:\\Program Files\\Tesseract-OCR\\tesseract.exe'tessdata_dir_config = '--tessdata-dir "D:\\Program Files\\Tesseract-OCR\\tessdata"'im=Image.open("./img/10.jpg")im=im.convert('L')im.show()im=ImageEnhance.Contrast(im)im=im.enhance(1)#im = im.resize((300, 90))ltext = pytesseract.image_to_string(im)#去掉非法字符,只保留字母数字ltext = re.sub("\W", "", ltext)im.show()print(ltext)#print(pytesseract.image_to_string(im))#print(pytesseract.image_to_boxes(im))#print(im.format, im.size, im.mode)

 

转载于:https://www.cnblogs.com/linyouyi/p/11427171.html

你可能感兴趣的文章
《30天自制操作系统》学习笔记--第14天
查看>>
LGPL协议的理解
查看>>
1、Python基础
查看>>
Unity The Tag Attribute Matching Rule
查看>>
试着理解下kvm
查看>>
WebService学习总结(二)--使用JDK开发WebService
查看>>
Tizen参考手机RD-210和RD-PQ
查看>>
竞价广告系统-位置拍卖理论
查看>>
策略模式 C#
查看>>
[模板]树状数组
查看>>
[HDU 6447][2018CCPC网络选拔赛 1010][YJJ's Salesman][离散化+线段树+DP]
查看>>
设计模式学习的好方法
查看>>
感谢Leslie Ma
查看>>
几种排序方法
查看>>
查看数据库各表的信息
查看>>
第一阶段测试题
查看>>
第二轮冲刺第五天
查看>>
图片压缩
查看>>
Hadoop-2.6.5安装
查看>>
ES6思维导图
查看>>