WenmuZhou / PytorchOCR

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于训练时精确度的问题

liangcaihua opened this issue · comments

commented

到第2轮的时候,达到了0.08
使用了baidu数据集, 修改了如下参数:
'backbone': {"type": "ResNet", 'model_name': 'small', 'layers': 18},
'neck': {"type": 'PPaddleRNN', "hidden_size": 128},
'head': {"type": "CTC", 'n_class': 6624},

重点是n_class,默认是93,训练一会就报错,找了很久才发现这个问题

2021-10-15 21:12:44,457 - torchocr - INFO - [2/200] - [200/4128] - lr:0.001 - loss:3.5757 - acc:0.0800 - norm_edit_dis:0.3539 - time:25.4649

commented

感觉作者代码写的特别好,但是维护上不太及时

你训练的结果怎么样,能否正常的在测试集上识别

兄弟,這個n_class是不是看使用那個alpha.txt,然後再加上空格1個?

到第2轮的时候,达到了0.08 使用了baidu数据集, 修改了如下参数: 'backbone': {"type": "ResNet", 'model_name': 'small', 'layers': 18}, 'neck': {"type": 'PPaddleRNN', "hidden_size": 128}, 'head': {"type": "CTC", 'n_class': 6624},

重点是n_class,默认是93,训练一会就报错,找了很久才发现这个问题

2021-10-15 21:12:44,457 - torchocr - INFO - [2/200] - [200/4128] - lr:0.001 - loss:3.5757 - acc:0.0800 - norm_edit_dis:0.3539 - time:25.4649

百度数据集标签的英文字符感觉跟字母表里的英文字符不太一样,这个对训练有影响么

当然。

当然。

训练得到的模型和验证时候用的字母表是不是要一样?比如train时候用的字母表跟infer的时候用的字母表字体不一样就准确率不行了么?

你还有训练百度数据集的代码吗,我的这个加载不进去数据。