CLUE benchmark's repositories
CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
CLUENER2020
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
CLUECorpus2020
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
SuperCLUElyb
SuperCLUE琅琊榜:中文通用大模型匿名对战评价基准
SuperCLUE-Llama2-Chinese
Llama2开源模型中文版-全方位测评,基于SuperCLUE的OPEN基准 | Llama2 Chinese evaluation with SuperCLUE
SuperCLUE-Safety
SC-Safety: 中文大模型多轮对抗安全基准
SuperCLUE-Agent
SuperCLUE-Agent: 基于中文原生任务的Agent智能体核心能力测评基准
SuperCLUE-Open
中文通用大模型开放域多轮测评基准 | An Open Domain Benchmark for Foundation Models in Chinese
SuperCLUE-RAG
中文原生检索增强生成测评基准
SuperCLUE-Math6
SuperCLUE-Math6:新一代中文原生多轮多步数学推理数据集的探索之旅
SuperCLUE-Auto
汽车行业中文大模型测评基准,基于多轮开放式问题的细粒度评测
SuperCLUE-Llama3-Chinese
Llama3开源模型中文版-全方位测评,基于SuperCLUE基准 | Llama3 Chinese Evaluation with SuperCLUE
SuperCLUE-Video
中文原生多层次文生视频测评基准
SuperCLUEgkzw
SuperCLUE高考作文机器自动阅卷系统
SuperCLUE-Role
SuperCLUE-Role中文原生角色扮演测评基准
SuperCLUE-Code3
中文原生等级化代码能力测试基准
SuperCLUE-Industry
中文原生工业测评基准
SuperCLUE-Fin
中文金融大模型测评基准,六大类二十五任务、等级化评价,国内模型获得A级
SuperCLUE-Image
中文原生文生图测评基准
SuperCLUE-Long
中文原生长文本测评基准
SuperCLUE-ICabin
汽车智能座舱大模型测评基准