中文事件二分类数据 自己标注的2000条事件二分类(有事件/无事件)数据; 微博文本数:1150,新闻文本数:850; 包含事件的文本数(1098,label:1)占比略大于不包含事件的文本数(902,label:0); 标注此数据的目的是为了舆情分析,因为我认为舆情往往是伴随事件一起出现的; 值得一提的是,“何为事件”并没有一个明确的定义,因此我在标注时对一些文本的标签也不确定,这类文本我均有做备注; 有问题和想法请提issue;