想问一下作者，量化成int4 int8 之后为什么模型大小没有变化，都是240g

Question

想问一下作者，量化成int4 int8 之后为什么模型大小没有变化，都是240g

GXKIM opened this issue a year ago · comments

执行的这一段代码，改的路径和target-tp 4，target-tp 8

python tools/convert_tp.py
--input-folder <SRC_CKPT_PATH>
--output-folder <DST_CKPT_PATH>
--target-tp 4

raygogogo · Answer 1 · Thu Jun 08 2023 16:41:38 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8

python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

想问下，在进行转换的时候，你的机器有多少的内存大于260GB吗

sukibean163 · Answer 2 · Fri Jun 09 2023 12:04:42 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8

python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

我也是，

GXKIM · Answer 3 · Fri Jun 09 2023 15:49:28 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

我也是，

哈哈哈我也，所以想不通

GXKIM · Answer 4 · Fri Jun 09 2023 15:49:43 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

想问下，在进行转换的时候，你的机器有多少的内存大于260GB吗

嗯是的

sukibean163 · Answer 5 · Fri Jun 09 2023 16:11:03 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

我也是，

我猜量化文档命令有点问题，需要--quantization-bit-width，也就是python tools/convert_tp.py --input-folder THUDM/chatglm-130b/glm-130b-sat --output-folder THUDM/chatglm-130b-int4-test --target-tp 4 --quantization-bit-width 4，这样模型就小了

GXKIM · Answer 6 · Fri Jun 09 2023 16:12:27 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

我也是，

我猜量化文档命令有点问题，需要--quantization-bit-width，也就是python tools/convert_tp.py --input-folder THUDM/chatglm-130b/glm-130b-sat --output-folder THUDM/chatglm-130b-int4-test --target-tp 4 --quantization-bit-width 4，这样模型就小了

不过为什么没有一些配置文件呢？

sukibean163 · Answer 7 · Fri Jun 09 2023 16:15:00 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

想问下，在进行转换的时候，你的机器有多少的内存大于260GB吗

我是120G就可以了，swap空间大点就ok

raygogogo · Answer 8 · Mon Jun 12 2023 10:35:30 GMT+0800 (China Standard Time)

执行的这一段代码，改的路径和target-tp 4，target-tp 8
python tools/convert_tp.py --input-folder <SRC_CKPT_PATH> --output-folder <DST_CKPT_PATH> --target-tp 4

想问下，在进行转换的时候，你的机器有多少的内存大于260GB吗

我是120G就可以了，swap空间大点就ok

好的，多谢，我试试

GXKIM · Answer 9 · Mon Jun 12 2023 10:36:57 GMT+0800 (China Standard Time)

int8 120g int4 60g左右

百折不回头 · Answer 10 · Thu Jun 15 2023 09:19:24 GMT+0800 (China Standard Time)

你们是怎么下载的啊 #176

GXKIM · Answer 11 · Thu Jun 15 2023 10:43:05 GMT+0800 (China Standard Time)

你们是怎么下载的啊 #176

aria2 直接下载即可

百折不回头 · Answer 12 · Thu Jun 15 2023 10:58:00 GMT+0800 (China Standard Time)

不能直接下载，需要在docs.google填写申请表格，审批后下载url会发到邮箱里

GXKIM · Answer 13 · Thu Jun 15 2023 10:58:47 GMT+0800 (China Standard Time)

不能直接下载，需要在docs.google填写申请表格，审批后下载url会发到邮箱里

文件里面有链接啊，直接下载就行了啊

百折不回头 · Answer 14 · Thu Jun 15 2023 11:02:39 GMT+0800 (China Standard Time)

文件里面有链接啊，直接下载就行了啊

哪个文件

GXKIM · Answer 15 · Thu Jun 15 2023 11:08:28 GMT+0800 (China Standard Time)

文件里面有链接啊，直接下载就行了啊

哪个文件

填表，之后不是给你一个txt文件吗，你就按照那个下载，命令都有