slim量化模型比原始模型更大，更慢

Question

JinYuannn opened this issue 2 years ago · comments

表格中显示en_PP-OCRv3_rec_slim推理模型只有3.2M，但是下载下来模型+参数有10M，比en_PP-OCRv3_rec还要大。

用CPU推理slim比原始慢了50ms。请问这是为什么，slim版本不应该更小更快吗？

andyjiang · Answer 1 · Fri Jun 24 2022 14:13:19 GMT+0800 (China Standard Time)

3.2M指的是nb模型，cpu慢多少呢？有详细的测试数据吗？

Jin Yuan · Answer 2 · Fri Jun 24 2022 14:43:34 GMT+0800 (China Standard Time)

cpu：i7-11700k
os: windows 11

原始模型：70ms（单线程）/ 35（mkl 10线程）
slim模型：100ms（单线程）/ 50 （mkl 10线程）

另外：en_number_mobile_slim_v2.0_rec有计划更新到v3.0吗？

andyjiang · Answer 3 · Fri Jun 24 2022 15:01:07 GMT+0800 (China Standard Time)

另外：en_number_mobile_slim_v2.0_rec有计划更新到v3.0吗？

en_PP-OCRv3_rec_slim 这个就是v3版本的

andyjiang · Answer 4 · Fri Jun 24 2022 15:05:09 GMT+0800 (China Standard Time)

这边量化的话，可以使用int8精度来测

Jin Yuan · Answer 5 · Fri Jun 24 2022 15:55:15 GMT+0800 (China Standard Time)

另外：en_number_mobile_slim_v2.0_rec有计划更新到v3.0吗？

en_PP-OCRv3_rec_slim 这个就是v3版本的

mobile_slim是比rec_slim更小的模型吧？

Jin Yuan · Answer 6 · Fri Jun 24 2022 15:57:34 GMT+0800 (China Standard Time)

这边量化的话，可以使用int8精度来测

cpp_infer如何使用int8?

andyjiang · Answer 7 · Fri Jun 24 2022 16:14:45 GMT+0800 (China Standard Time)

另外：en_number_mobile_slim_v2.0_rec有计划更新到v3.0吗？

en_PP-OCRv3_rec_slim 这个就是v3版本的

mobile_slim是比rec_slim更小的模型吧？

mobile可以理解是v1,最新的是v3，v2之后就不再区分mobile和server模型了

andyjiang · Answer 8 · Fri Jun 24 2022 16:17:50 GMT+0800 (China Standard Time)

这边量化的话，可以使用int8精度来测

cpp_infer如何使用int8?

通过 precision 参数指定

Jin Yuan · Answer 9 · Tue Jun 28 2022 14:03:52 GMT+0800 (China Standard Time)

谢谢解答！

JavieYuan · Answer 10 · Mon Nov 28 2022 00:34:40 GMT+0800 (China Standard Time)

这边量化的话，可以使用int8精度来测

cpp_infer如何使用int8?

通过 precision 参数指定

python端在utility.py也有'precision'这个参数，用的就是int8，但是依然slim量化训练模型cpu耗时反而比训练模型大呢？