关于训练过程中loss突然变成nan,acc变成0的问题
isunLt opened this issue · comments
Tianfang-Sun commented
Tianfang-Sun commented
不好意思打扰了,我把python换成3.7,pytorch换成1.6之后就没问题了。
Tianfang-Sun commented
Kaihua Tang commented
不好意思没有遇到过类似问题,我也不知道为什么
Kaihua Tang commented
可能是因为改了batch size,learning rate也需要对应的修改?
Kaihua Tang commented
Tianfang-Sun commented
deepkun commented
请问您问题解决了吗?我改了norm还是会出现nan,我的loss下降很快,在一个epoch内就变nan了
Tianfang-Sun commented
请问您问题解决了吗?我改了norm还是会出现nan,我的loss下降很快,在一个epoch内就变nan了
太久了,我忘记了,不好意思
yufu commented