llm-as-judge

There are 0 repository under llm-as-judge topic.

minnesotanlp / cobbler
Code and data for ACL ARR 2024 paper "Benchmarking Cognitive Biases in Large Language Models as Evaluators"
bias evaluation llm nlp bias-detection llm-as-a-judge llm-as-evaluator llm-as-judge llm-evaluation llms llms-benchmarking
Language:Jupyter Notebook 13
mrseanryan / gpt-eval-translations
Evaluate translations by either a self-hosted Embedder or using Chat-GPT as LLM-as-judge.
evaluation translation-evaluation llm-as-judge
Language:Python

minnesotanlp / cobbler