guanshuicheng / invoice

Collaboration with wangxupeng(https://github.com/wangxupeng)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

识别区域太少了,楼主有没有兴趣识别更多区域

wulouzhu opened this issue · comments

cannot agree more

commented

更多区域的检测识别模型会在后期开放

您好,只检测了几个区域,是在yolo训练的时候只用了这几个区域的标注数据吧。

commented

用了这几个区域的标注数据

对,只标注了指定的这五个区域

用了这几个区域的标注数据

对,只标注了指定的这五个区域

【您这五个区域,用yolo训练,最终loss能收敛到多少呢?】

我训练时的一些情况:
基于银行卡数据集https://github.com/cuishuaihua/Bankcard_OCR,
用chineseocr原作者训练代码,YOLO_Kmeans生成anchors = '8,46, 8,57, 8,66, 8,75, 8,84, 8,93, 8,103, 8,115, 8,129',因为只是银行卡数字,长度是一样的,只是原始图像尺寸上存在一些变化,所以聚类生成的anchors变化不大。
将chineseocr的文字检测模型作为resume加载,训练了10轮loss下降很慢
1606/1946 [=======================>......] - ETA: 3:28 - loss: 228.6397 - class_loss_loss: 0.0021 - xy_loss_loss: 79.8738 - wh_loss_loss: 0.2713 - confidence_loss_loss: 131.8300

用了这几个区域的标注数据

对,只标注了指定的这五个区域

请问下您的数据量大约多少呢?就是标注发票张数和生成发票张数