关于后训练量化的疑惑，真真诚诚希望得到解答

Question

关于后训练量化的疑惑，真真诚诚希望得到解答

JoeYounger opened this issue 2 years ago · comments

您好，对您的工作表示祝贺，实在太赞了。我是名刚接触量化的萌新，最近需要实现低比特的后训练量化PTQ，由于知识有限，有两个疑问非常希望得到您的解答：
1.是只有iao才支持PTQ吗？
2.readme提到的“加载剪枝后的模型再做量化”中的量化指的是QWT还是PTQ呢？
2.我期望做低精度的PTQ（2～5bit），请问可以迁移您的工作以实现吗？还是说PTQ 只支持8bit的量化呢？
再次感谢您的工作！！！

dzy · Answer 1 · Thu Jan 27 2022 17:16:57 GMT+0800 (China Standard Time)

1、是iao做PTQ效果好一些，所以只在iao里实现了PTQ；
2、都可以，但PTQ的话剪枝比例得给小一点，不然可能精度不够；
3、只是精度问题，可以直接设置bit；但保证精度的前提下，PTQ想做到4-bit以下，很难。