CLUE benchmark

CLUE benchmark's repositories

CLUEDatasetSearch

搜索所有中文NLP数据集，附常用英文NLP数据集

Language:Python3925 61 12

CLUE

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Language:Python3854 89 99

SuperCLUE

SuperCLUE: 中文通用大模型综合性基准 | A Benchmark for Foundation Models in Chinese

2673 35 46

CLUENER2020

CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition

Language:Python1407 21 92

CLUECorpus2020

Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料

MIT888 21 12

FewCLUE

FewCLUE 小样本学习测评基准，中文版

Language:Python482 13 14

pCLUE

pCLUE: 1000000+多任务提示学习数据集

Language:Jupyter Notebook451 7 9

SimCLUE

3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型

Language:Python255 4 2

SuperCLUElyb

SuperCLUE琅琊榜：中文通用大模型匿名对战评价基准

137 5 7

PyCLUE

Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark

Language:PythonMIT128 9 5

SuperCLUE-Llama2-Chinese

Llama2开源模型中文版-全方位测评，基于SuperCLUE的OPEN基准 | Llama2 Chinese evaluation with SuperCLUE

125 2 2

SuperCLUE-Safety

SC-Safety: 中文大模型多轮对抗安全基准

80 3 9

SuperCLUE-Agent

SuperCLUE-Agent: 基于中文原生任务的Agent智能体核心能力测评基准

72 4 8

SuperCLUE-Open

中文通用大模型开放域多轮测评基准 | An Open Domain Benchmark for Foundation Models in Chinese

69 3 2

SuperCLUE-RAG

中文原生检索增强生成测评基准

64 30

MobileQA

离线端阅读理解应用 QA for mobile, Android & iPhone

Language:Python60 12 2

modelfun

一站式自动化开源标注平台

Language:JavaApache-2.056 3 3

SuperCLUE-Math6

SuperCLUE-Math6：新一代中文原生多轮多步数学推理数据集的探索之旅

Language:Python2800

SuperCLUE-Auto

汽车行业中文大模型测评基准，基于多轮开放式问题的细粒度评测

18 2 3

LGEB

LGEB: Benchmark of Language Generation Evaluation

Language:Python16 4 1

SuperCLUE-Llama3-Chinese

Llama3开源模型中文版-全方位测评，基于SuperCLUE基准 | Llama3 Chinese Evaluation with SuperCLUE

1600

SuperCLUE-Video

中文原生多层次文生视频测评基准

13 10

SuperCLUEgkzw

SuperCLUE高考作文机器自动阅卷系统

12 2 1

SuperCLUE-Role

SuperCLUE-Role中文原生角色扮演测评基准

10 3 2

SuperCLUE-Code3

中文原生等级化代码能力测试基准

900

SuperCLUE-Industry

中文原生工业测评基准

900

SuperCLUE-Fin

中文金融大模型测评基准，六大类二十五任务、等级化评价，国内模型获得A级

600

SuperCLUE-Image

中文原生文生图测评基准

600

SuperCLUE-Long

中文原生长文本测评基准

500

SuperCLUE-ICabin

汽车智能座舱大模型测评基准

400