Windows本地部署经过量化的模型貌似无法理解中文Prompt?

Question

Windows本地部署经过量化的模型貌似无法理解中文Prompt?

LainNya opened this issue a year ago · comments

Cathrine Veum commented a year ago

你好，我在推理时遇到了问题,在尝试输入中文Prompt时，模型给出的输出经常是答非所问,但输入英文Prompt就正常输出了,请问是什么问题?我启动模型的命令是完全按照Steps3输入的。而且模型的回复也不是中文的？

Ziqing Yang · Answer 1 · Thu Mar 30 2023 13:57:44 GMT+0800 (China Standard Time)

从回复内容和风格看，似乎不是我们这一版模型。因为合并过程中涉及的的权重文件比较多，请确认下中间转换过程用的权重是否弄混淆了？

Cathrine Veum · Answer 2 · Thu Mar 30 2023 14:09:52 GMT+0800 (China Standard Time)

我的操作如下
1.把原版llama转换成HF格式
2.从谷歌网盘下载了Chinese-Alpaca-7B的Lora
3.对中文词表扩充, llama_model的路径为原版转换后的模型, tokenizer的路径为Chinese-Alpaca-7B的路径
4.合并权重 base_model为第三步扩充后的模型,lora_model为Chinese-Alpaca-7B的路径
我觉得我操作应该没有混淆吧 :( 我的朋友尝试了下也得出了这样的结果

Yiming Cui · Answer 3 · Thu Mar 30 2023 15:41:53 GMT+0800 (China Standard Time)

我的操作如下
1.把原版llama转换成HF格式
2.从谷歌网盘下载了Chinese-Alpaca-7B的Lora
3.对中文词表扩充, llama_model的路径为原版转换后的模型, tokenizer的路径为Chinese-Alpaca-7B的路径
4.合并权重 base_model为第三步扩充后的模型,lora_model为Chinese-Alpaca-7B的路径
我觉得我操作应该没有混淆吧 :( 我的朋友尝试了下也得出了这样的结果

可以把./main运行后马上输出出来的log贴一下吗（到提示符>之前）？

Ziqing Yang · Answer 4 · Thu Mar 30 2023 15:47:20 GMT+0800 (China Standard Time)

你好，我在推理时遇到了问题,在尝试输入中文Prompt时，模型给出的输出经常是答非所问,但输入英文Prompt就正常输出了,请问是什么问题?我启动模型的命令是完全按照Steps3输入的。而且模型的回复也不是中文的？

可以检查一下几个中间文件的SHA256 是否一致：
adapter_model.bin: 0d9b6ed8e4a7d1ae590a16c89a452a488d66ff07e45487972f61c2b6e46e36de
合并后的consolidated.00.pth: fbfccc91183169842aac8d093379f0a449b5a26c5ee7a298baf0d556f1499b90

Cathrine Veum · Answer 5 · Thu Mar 30 2023 15:59:37 GMT+0800 (China Standard Time)

我的操作如下
1.把原版llama转换成HF格式
2.从谷歌网盘下载了Chinese-Alpaca-7B的Lora
3.对中文词表扩充, llama_model的路径为原版转换后的模型, tokenizer的路径为Chinese-Alpaca-7B的路径
4.合并权重 base_model为第三步扩充后的模型,lora_model为Chinese-Alpaca-7B的路径
我觉得我操作应该没有混淆吧 :( 我的朋友尝试了下也得出了这样的结果

可以把运行后马上输出出来的log贴一下吗（到提示符之前）？./main``>

这是我的log日志

Cathrine Veum · Answer 6 · Thu Mar 30 2023 16:10:46 GMT+0800 (China Standard Time)

你好，我在推理时遇到了问题,在尝试输入中文Prompt时，模型给出的输出经常是答非所问,但输入英文Prompt就正常输出了,请问是什么问题?我启动模型的命令是完全按照Steps3输入的。而且模型的回复也不是中文的？

可以检查一下几个中间文件的SHA256 是否一致： adapter_model.bin: 0d9b6ed8e4a7d1ae590a16c89a452a488d66ff07e45487972f61c2b6e46e36de 合并后的consolidated.00.pth: fbfccc91183169842aac8d093379f0a449b5a26c5ee7a298baf0d556f1499b90

貌似我的consolidated.00.pth与你的不一致

Cathrine Veum · Answer 7 · Thu Mar 30 2023 16:16:23 GMT+0800 (China Standard Time)

我尝试重新合并和量化了下模型，这次使用的是Huggingface内的lora,但依旧是同样的结果 :(
我所使用的原版llama来源:https://github.com/facebookresearch/llama/pull/73/files
Chinese-alpaca来源:https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

Ziqing Yang · Answer 8 · Thu Mar 30 2023 16:17:26 GMT+0800 (China Standard Time)

你好，我在推理时遇到了问题,在尝试输入中文Prompt时，模型给出的输出经常是答非所问,但输入英文Prompt就正常输出了,请问是什么问题?我启动模型的命令是完全按照Steps3输入的。而且模型的回复也不是中文的？

可以检查一下几个中间文件的SHA256 是否一致： adapter_model.bin: 0d9b6ed8e4a7d1ae590a16c89a452a488d66ff07e45487972f61c2b6e46e36de 合并后的consolidated.00.pth: fbfccc91183169842aac8d093379f0a449b5a26c5ee7a298baf0d556f1499b90

貌似我的consolidated.00.pth与你的不一致

peft版本是0.2.0吗？同时用最新的export_state_dict_checkpoint.py试试？

Cathrine Veum · Answer 9 · Thu Mar 30 2023 21:03:51 GMT+0800 (China Standard Time)

最新的export_state_dict_checkpoint.py生成的consolidated.00.pth sha256一致了，可以正常中文推理了:D

抱歉，我结束的太早了，貌似还是不能正常?

Cathrine Veum · Answer 10 · Thu Mar 30 2023 21:06:09 GMT+0800 (China Standard Time)

这是我的量化后模型的sha256 f19503385fb3ab92ec96f2b6a2d733f07e368c836ba7a1d575699159156ac0e6

合并后的全量模型权重的SHA256

Ziqing Yang · Answer 11 · Thu Mar 30 2023 21:17:53 GMT+0800 (China Standard Time)

这是我的量化后模型的sha256 f19503385fb3ab92ec96f2b6a2d733f07e368c836ba7a1d575699159156ac0e6

合并后的全量模型权重的SHA256

我q4量化后模型的sha256的和你是一致的

Cathrine Veum · Answer 12 · Thu Mar 30 2023 21:20:03 GMT+0800 (China Standard Time)

那请问我这是什么问题呢?我现在完全不回答我的问题

Ziqing Yang · Answer 13 · Thu Mar 30 2023 21:52:20 GMT+0800 (China Standard Time)

那请问我这是什么问题呢?我现在完全不回答我的问题

你试试用llama.cpp加载原版llama看有没有问题

Cathrine Veum · Answer 14 · Thu Mar 30 2023 22:36:31 GMT+0800 (China Standard Time)

那请问我这是什么问题呢?我现在完全不回答我的问题

你试试用llama.cpp加载原版llama看有没有问题

我将原版llama进行了q4量化,这是它的回答，难道是llama.cpp的问题？

codica · Answer 15 · Fri Mar 31 2023 08:26:03 GMT+0800 (China Standard Time)

我也是类似问题，会不会跟这个有关，protobuf版本太低了，因为安装过程要求只能使用3.20.x

Cathrine Veum · Answer 16 · Fri Mar 31 2023 09:06:41 GMT+0800 (China Standard Time)

我也是类似问题，会不会跟这个有关，protobuf版本太低了，因为安装过程要求只能使用3.20.x

低版本也会导致这个问题吗？我的是3.19.0

Cathrine Veum · Answer 17 · Fri Mar 31 2023 10:41:12 GMT+0800 (China Standard Time)

尝试打印了下main.exe获取的值，貌似中文就没获取到，我的cpp基础很差，不知道怎么更改.
应该是在这行

Cathrine Veum · Answer 18 · Fri Mar 31 2023 12:10:41 GMT+0800 (China Standard Time)

大概就是这个原因，我将关闭这个提问

Ziqing Yang · Answer 19 · Fri Mar 31 2023 21:43:02 GMT+0800 (China Standard Time)

@LainNya #20 这个或许对你有帮助。

Cathrine Veum · Answer 20 · Fri Mar 31 2023 23:26:06 GMT+0800 (China Standard Time)

@LainNya #20 这个或许对你有帮助。

我也已经发现这个问题了，Windows 平台下cmd和poweshell有问题，但我在git bash内执行就没问题了

boholder · Answer 21 · Sat Apr 01 2023 14:41:56 GMT+0800 (China Standard Time)

ggerganov/llama.cpp#646
llama.cpp 项目下对应的讨论，总之先用git-bash或WSL吧。

@ymcui 打扰下，方便把这个知识加进README吗？

Yiming Cui · Answer 22 · Sat Apr 01 2023 14:45:33 GMT+0800 (China Standard Time)

ggerganov/llama.cpp#646 llama.cpp 项目下对应的讨论，总之先用git-bash或WSL吧。

@ymcui 打扰下，方便把这个知识加进README吗？

感谢提供信息，我先把这个issue PIN起来，后续加到合适的位置。

Lex Lim · Answer 23 · Tue Apr 04 2023 15:58:59 GMT+0800 (China Standard Time)

看看readline之后有没有编码转换？CMD和PowerShell默认是GBK（CP936）编码，而Linux Shell默认是UTF-8，可能是这个问题。可以试试先chcp 65001再使用llama.cpp。

Zhennan LI · Answer 24 · Tue Apr 04 2023 16:21:12 GMT+0800 (China Standard Time)

也许可以放到项目的Wiki里，再在README里加个到Wiki的链接。

…

On Tue, Apr 4, 2023 at 3:59 PM Lex Lim ***@***.***> wrote: 看看readline之后有没有编码转换？CMD和PowerShell默认是GBK（CP936）编码，而Linux Shell默认是UTF-8，可能是这个问题。 — Reply to this email directly, view it on GitHub <#11 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AB6EBXDZMYVOFDVDKJDHS5DW7PIFDANCNFSM6AAAAAAWMZGJYY> . You are receiving this because you are subscribed to this thread.Message ID: ***@***.***>

sgcwddhr · Answer 25 · Tue Apr 04 2023 18:34:27 GMT+0800 (China Standard Time)

为什么我在git bash中也不支持中文prompt。有大佬能看看吗？

sgcwddhr · Answer 26 · Tue Apr 04 2023 18:37:04 GMT+0800 (China Standard Time)

@LainNya #20 这个或许对你有帮助。

我也已经发现这个问题了，Windows 平台下cmd和poweshell有问题，但我在git bash内执行就没问题了

我在git bash 中也不支持中文，什么原因

Cathrine Veum · Answer 27 · Tue Apr 04 2023 21:08:59 GMT+0800 (China Standard Time)

看看readline之后有没有编码转换？CMD和PowerShell默认是GBK（CP936）编码，而Linux Shell默认是UTF-8，可能是这个问题。可以试试先chcp 65001再使用llama.cpp。

已经尝试过了，依然无法正常获取

josc146 · Answer 28 · Tue Apr 04 2023 21:34:25 GMT+0800 (China Standard Time)

我改了一下实现, 现在可以支持中文输入了, 配置开箱即用: https://github.com/josStorer/llama.cpp-unicode-windows

用_getwch手动实现了unicode兼容的getline, 目前实现了输入, 退格, 左右移动光标, 以及回车, 足够常规使用 (不确定是不是最佳的解决方案, 但能解决问题)

Yiming Cui · Answer 29 · Wed Apr 05 2023 08:28:12 GMT+0800 (China Standard Time)

我改了一下实现, 现在可以支持中文输入了, 配置开箱即用: https://github.com/josStorer/llama.cpp-unicode-windows

用_getwch手动实现了unicode兼容的getline, 目前实现了输入, 退格, 左右移动光标, 以及回车, 足够常规使用 (不确定是不是最佳的解决方案, 但能解决问题)

感谢，已添加到README中。

boholder · Answer 30 · Thu Apr 06 2023 10:14:34 GMT+0800 (China Standard Time)

我改了一下实现, 现在可以支持中文输入了, 配置开箱即用: https://github.com/josStorer/llama.cpp-unicode-windows

Nice work!

原llama.cpp 项目中已合并了 ggerganov/llama.cpp#420
解决了输入问题但没解决输出问题：

it is currently not possible to insert or display utf-8 characters at moment.
ggerganov/llama.cpp#646 (comment)

我不确定你是否方便提个pr，让原llama.cpp也支持输出UTF-8（和对UTF-8的修改）？...

josc146 · Answer 31 · Thu Apr 06 2023 12:28:25 GMT+0800 (China Standard Time)

@boholder 我的改动不是跨平台的, 并且并不是完全兼容getline, 对于一些依赖命令行输入输出的API服务有兼容问题, 所以我觉得不适合提到官方仓库, 适合直接作为命令行体验

我在原项目问题下也提了我的解决方案, 我想仓库维护者也看到了

boholder · Answer 32 · Thu Apr 06 2023 12:35:55 GMT+0800 (China Standard Time)

@boholder 我的改动不是跨平台的, 并且并不是完全兼容getline, 对于一些依赖命令行输入输出的API服务有兼容问题, 所以我觉得不适合提到官方仓库, 适合直接作为命令行体验

我在原项目问题下也提了我的解决方案, 我想仓库维护者也看到了

原来是这样，不好意思我没了解情况。。再次谢谢你提供了解决方案。

josc146 · Answer 33 · Thu Apr 06 2023 12:38:44 GMT+0800 (China Standard Time)

@boholder 我目前正在针对指令模式把llama做成api服务, 这个方案可以配合应用落地, 并且能够使用中文

https://github.com/josStorer/selfhostedAI 现在已经可用, 但是我还没更新使用说明

这里是一个应用API调用的示例
$64J_YRL$9TRUDH0PQWG8{8$

zetaloop · Answer 34 · Sat Apr 08 2023 20:02:43 GMT+0800 (China Standard Time)

是否考虑换用python版的llama.cpp？
python输出或许可以解决cpp版的中文支持问题

Wu Xueyu · Answer 35 · Sun Apr 09 2023 12:01:51 GMT+0800 (China Standard Time)

@boholder 我目前正在针对指令模式把llama做成api服务, 这个方案可以配合应用落地, 并且能够使用中文

https://github.com/josStorer/selfhostedAI 现在已经可用, 但是我还没更新使用说明

这里是一个应用API调用的示例 $64J_YRL$9TRUDH0PQWG8{8$

我想请问一下可以支持llamacpp 结合的chinesellamaaplaca模型吗？

josc146 · Answer 36 · Sun Apr 09 2023 20:00:31 GMT+0800 (China Standard Time)

@wwwwwuxueyu 截图里用的就是这个仓库的中文模型效果, 简单问题体验还不错

Cathrine Veum · Answer 37 · Mon Apr 10 2023 08:21:26 GMT+0800 (China Standard Time)

最新的 llama.cpp 已经解决了这个问题。