li-plus/chatglm.cpp Issues
如何设置更长的上下文(context)
Updated 5为什么4090显卡用不了,编译成功之后也是用的cpu推理
Closed 5显存使用增加
UpdatedCodeGeeX2模型转换错误
Updated 2Q4_0 + CPU转换避坑指南
Updated 9能否提供对P100 GPU的支持
Updated 2请问是否有将chatglm.cpp合并到llama.cpp的计划?
Updated 7跟新cmke版本后出现问题
Updated 2openai api 启动后,测试请求无法并行
UpdatedCmake error on Windows
Closed 4赞👍🏻 文档写得非常漂亮,从头走到尾没有遇到一点阻碍👍🏻
Updatedmacbook convert失败
Updated 1pip安装失败
Closed 1build docker error
Updated 1使用 gpu 时 如何指定使用哪一个设备?
Updated 3构建容器后,运行API接口报错
Closed 1macbookpro m1量化baichuan2-13b失败
Updated 2请问能否在iPhone上跑起来呢?
Updated 1lora微调后的模型部署
Closed 7是否可以修改接口处理messages的逻辑?
Updated 2关于cpp部署
Updated 2device
Closed 1一种可行的解决方案
Closedcmake -B build error
Updated 6chatglm3
Updated 1如何提升CPU利用率
Updated 1