Qwen-14B-Chat-Int4运行后预测结果不对
takemars opened this issue · comments
补充执行第三步的指令为:python build.py --use_weight_only
--weight_only_precision int4_gptq
--per_group
--hf_model_dir Qwen-14B-Chat-Int4
--quant_ckpt_path Qwen-14B-Chat-Int4
可以升级一下transformers版本试试。
顺便问问你用的哪个版本,是当前项目的main分支吗
升级transformers版本后就可以了,该问题是optimum和transformers版本不匹配导致的,
两者都用最新版就可以解决了。