WenmuZhou / OCR_DataSet

收集并整理有关OCR的数据集并统一标注格式,以便实验需要

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

单独数据集里面的文件

xiaozhubenben opened this issue · comments

大佬你好,多谢整理了这么多有用的数据集。
我下载了cocotextv2 baidu中文识别 mtwi2018等几个 发现里面有一些文件是只有600-900字节大小的,部分无法显示比如mtwi识别里面的几个,或者图像看不出文字内容的。训练的时候会报错。这些是原本如此的吗?还是预处理切割导致的?