horseee / LLM-Pruner

[NeurIPS 2023] LLM-Pruner: On the Structural Pruning of Large Language Models. Support LLaMA, Llama-2, BLOOM, Vicuna, Baichuan, etc.

Home Page:https://arxiv.org/abs/2305.11627

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

在将部分层进行剪枝之后,不能直接通过tgi加载模型

coderchem opened this issue · comments

在将部分层进行剪枝之后,不能直接通过tgi加载模型,落地难度大,有什么好的idea吗?