breezedeus / CnOCR

CnOCR: Awesome Chinese/English OCR Python toolkits based on PyTorch. It comes with 20+ well-trained models for different application scenarios and can be used directly after installation. 【基于 PyTorch/MXNet 的中文/英文 OCR Python 包。】

Home Page:https://www.breezedeus.com/article/cnocr

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

2.3.0.1版本使用自定义的字符集合似乎不起作用

liewstar opened this issue · comments

2.2版本是没有问题的,但是升级到2.3版本之后,使用自定义字符集合之后,识别任何图片都是空字符

升级2.3版本的同时,我的python环境也从3.7升到了3.10

有具体示例吗?可以把代码是图片都发一下

只把cncocr的版本切换到2.2的最后一个版本的话,能够正常输出。切换到2.3.0.1就是如下。

from cnocr import CnOcr

ocr = CnOcr(rec_vocab_fp='label_cn.txt')
out = ocr.ocr('test.png')
print(out)

图片
图片
图片

有具体示例吗?可以把代码是图片都发一下

image 你这用法有问题,V2.3 的 label_cn.txt 跟之前不一样了。如果你是跟默认文件一样,就不用传这个参数。如果你是自己训练的模型,那就得把模型名称和模型文件路径都传进来。

image 你这用法有问题,V2.3 的 label_cn.txt 跟之前不一样了。如果你是跟默认文件一样,就不用传这个参数。如果你是自己训练的模型,那就得把模型名称和模型文件路径都传进来。

原来是这样吗,但是我目前需要把py程序打包成exe的话,2.2的时候我是把txt放在cnocr这个文件夹下面,然后一起打包,没有传rec_vocab_fp这个参数,程序会自己在cnocr里面找到这个txt,运行是没问题的。同样的方法,2.3就不行,即便是一样的不传参数也不行。 如果我打包的成exe时候,文件夹没有这个txt的话,会提示cnocr下面缺少这个txt。

目前2.3的话大概就是打包成exe的话,这个字符集合要从哪里拿。

这是 2.3 的字符集
label_cn.txt