YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

数据集准备

15737939656 opened this issue · comments

commented

请问下怎样准备自己的数据,有开源的标注工具吗?

可以去百度公众平台

commented

可以去百度公众平台

您好,自己没找到匹配的链接,能麻烦您发送下吗?(目前是通过目标区域检测(craft)检测文本,然后通过比例大小padding之后resize,之后有OCR识别训练样本再人工校验识别错误的)

这个还真不好弄,你需要去百度公众平台,注册成用户

commented

ha

这个还真不好弄,你需要去百度公众平台,注册成用户

好的,谢谢~

你说的数据集是检测的还是识别的啊?
检测的话随便找一个目标检测标注工具就行,开源的很多,打框后用它的脚本转成ctpn要的形式就行。
识别的话自己先裁剪好,然后直接修改图片名为字符串名,这样就可以标注。