bn层单独量化和卷积与bn融合量化的问题

Question

bn层单独量化和卷积与bn融合量化的问题

WangQiangItachi opened this issue 4 years ago · comments

谢谢大佬分享这么优秀的project，研究了一下IAO中的量化训练代码，发现在不融合bn层时，bn使用的是原始浮点的参数，没有像卷积层一样做伪量化，但感觉bn层量化也是有误差的，这里直接使用浮点的数据处理是什么原因呢。另外也尝试了一下融合bn的量化训练方式，只修改了代码中的bn_fuse和train_batch_size（修改为128）参数，发现训练了几个epoch后loss变为nan，没办法继续训练了，大佬能帮忙解答一下吗，谢谢了。

dzy · Answer 1 · Sun Jan 10 2021 17:56:49 GMT+0800 (China Standard Time)

考虑两种情况，bn不融合不量化(精度高一些) 和 bn融合量化(速度快一些)，一般使用后者。
loss-nan问题已修复。