LBH1024 / CAN

When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition (ECCV’2022 Poster).

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

为什么复现不出论文中的效果

zengyangzang opened this issue · comments

直接使用Github中的代码,没有任何改动,epoch为240,batchsize为8,不使用数据增强,随机种子也没用修改。为什么在CROHME2014数据集的正确率为56.09%,比论文中的57%的正确率低了0.91%。如果想复现出论文中的效果,超参数应该如何设置

请问你使用什么GPU大概训练了多久到240epoch?

请问你使用什么GPU大概训练了多久到240epoch?
我看作者说V100训1天,但是我用A100已经训了三四天了

请问你使用什么GPU大概训练了多久到240epoch?
我看作者说V100训1天,但是我用A100已经训了三四天了

很奇怪,我用的学校的平台的A800,batchsize=8,CROHME训练集、
之前跑大概5分钟就有1epoch,差不多20个小时就可以跑完240轮。
最近不知道怎么回事,可能是学校超算有问题了,大约16分钟一个epoch,240轮需要两天多吧
我觉得你用A100跑三四天应该不太对

请问你使用什么GPU大概训练了多久到240epoch?

A800,两天左右