baidu / DuReader

Baseline Systems of DuReader Dataset

Home Page:http://ai.baidu.com/broad/subordinate?dataset=dureader

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

是否考虑构建一个“检索+阅读”的中文openQA数据集?

BigHeartC opened this issue · comments

openQA会根据问题,从知识库(百万量级以上的文本)中检索相关的文本,然后进行“阅读”以抽取出问题的答案。目前openQA的数据集主要都是英文的,如:NaturalQuestions、WebQuestions。

dureader其实可以在现有的基础上,整理出一版针对openQA任务的数据集,构建一个中文 openQA的榜单,这将对中文openQA的发展很有帮助。想问下有这个计划吗?谢谢~