你可以尝试改变tesseract的-psm参数:
image = Image.open('ocr.png')
image.show()
for p in range(4,14):
print(p, '-', pytesseract.image_to_string(image, config="-psm {}".format(p)))
输出如下:
4 - 3 4'1 4'1 I] I]
5 - D
D
d.
d.
_...I._
6 - 3 4'1 4'1 I] I]
7 - 3 4'1 4'1 I] I]
8 - 34400
9 - 34400
10 - W
11 - 3
£1
I1
I]
I]
12 -
13 - 34400
如果图片只有数字你也能尝试用tessedit_char_whitelist
:
pytesseract.image_to_string(image, config="-psm 8 -c tessedit_char_whitelist=1234567890")
与恶龙缠斗过久,自身亦成为恶龙;凝视深渊过久,深渊将回以凝视…