一个简易的大模型互评框架,支持批量评测。A mini LLM evaluation framework that supports batch and mutual evaluation.
Geek Repo:Geek Repo
Github PK Tool:Github PK Tool