ChatGLM2-6b模型用eval精度比eval_chat低，正常吗？

Question

ztxz16 opened this issue a year ago · comments

现在chatglm的测试代码里只有eval_chat模式，我试着用eval测了一下，精度会降低1%左右，这个正常吗？

Haonan Li · Answer 1 · Wed Aug 09 2023 15:38:39 GMT+0800 (China Standard Time)

这个是正常的。这确实是两种不同评估方式，但是结果相差不会很大。
具体地说：

现在没有一个公认的更好的方式。