cjymz886 / text-cnn

嵌入Word2vec词向量的CNN中文文本分类

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

官网数据集数量与描述不对应

burette opened this issue · comments

你好,你在readme中说每个类别下面为6500条数据,而如今我在官网下载的数据集每个类别下面的数目比这个大很多,都是9w,5w,13w等数量级。我有个疑惑是因为数据集官网一致在增加还是你当时每个类别下边只选择了6500条数据进行实验?(比较小白)

官网下载的应该是全部的THUCNews数据集,可自行抽取部分出来训练