BIT-NLP-Fundamentals of Natural Language Understanding

北京理工大学自然语言理解基础课程大作业

Homework 1: 分词与词性标注

在本项自由命题大作业中，我、魏慧聪、徐幸波同学共同完成了该部分的大作业。

我们提取了美团的评论，分析美团评论的细粒度情感。

参考一些外卖平台给出的评论选项和SemEval数据集，初步确定属性分为位置、服务、价格、环境、菜品、其他六大类，具体细分为20类

为了在算法中区分情感程度，每一个具体属性都有四种标签——{正向，中立，负向，未有提及}，而在最终输出阶段，只会显示提及到的属性，未提及的属性不会显示出来

情感倾向量化	1	0	-1	-2
情感含义	正面情感	中性情感	负面情感	情感倾向未提及

python == 3.6

bert4keras

Keras == 2.1.0

h5py == 2.10.0

sklearn

北京理工大学自然语言理解基础本科课程大作业

Language:Jupyter Notebook 88.1%Language:Python 11.1%Language:HTML 0.6%Language:CSS 0.1%