zgzjdx / Chinese_Event_Dataset

自己标注的2000条事件二分类(有事件/无事件)数据

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

中文事件二分类数据

自己标注的2000条事件二分类(有事件/无事件)数据;
微博文本数:1150,新闻文本数:850;
包含事件的文本数(1098,label:1)占比略大于不包含事件的文本数(902,label:0);
标注此数据的目的是为了舆情分析,因为我认为舆情往往是伴随事件一起出现的;
值得一提的是,“何为事件”并没有一个明确的定义,因此我在标注时对一些文本的标签也不确定,这类文本我均有做备注;
有问题和想法请提issue;

About

自己标注的2000条事件二分类(有事件/无事件)数据

License:MIT License