cxy229 / BDCI2019-SENTIMENT-CLASSIFICATION

CCF BDCI 2019 互联网新闻情感分析 复赛top1解决方案

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

CCF BDCI 2019 互联网新闻情感分析 复赛top1解决方案

队名:我们都上哈工深

比赛官网:互联网新闻情感分析

复现

本项目下共有三个文件夹,分别为datamodelsource

  1. data文件夹下包含初赛和复赛的训练数据及复赛的测试数据(需官网下载)和数据处理代码。
  2. model文件夹下包含运行的各个模型保存及预测的结果。
  3. source文件夹下包含本次比赛的代码以及模型运行的jupyter notebook文件,共12个。
  4. 复赛融合文件夹下包含融合代码和融合结果。

复现详见"互联网新闻情感分析复现文档-我们都上哈工深.docx"

方案

image-20191224221646530

image-20191224221704779

image-20191224221718455

image-20191224221730191

image-20191224221756483

image-20191224221809071

句子对效果一般,最后没有采用。

image-20191224221836114

image-20191224221848348

image-20191224221900868

最后

代码修改自guoday的baseline ,预训练bert模型采用哈工大的RoBERTa-wwm-ext-largebrightmart的Roberta_zh,十分感谢。

About

CCF BDCI 2019 互联网新闻情感分析 复赛top1解决方案


Languages

Language:Jupyter Notebook 82.9%Language:Python 17.1%