hchhtc123 / Emotion-analysis-system

PaddleHub实战:基于OCEMOTION的中文微情感分析系统,完整项目教程地址:https://aistudio.baidu.com/aistudio/projectdetail/2211726

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

中文微情感分析系统

PaddleHub实战:基于OCEMOTION的中文微情感分析系统

完整项目地址:https://aistudio.baidu.com/aistudio/projectdetail/2211726

全流程实战教程,带你玩转一个前沿完整文本分类项目开发!喜欢的希望能够fork、喜欢和关注三连!❤

一.项目简介:

本项目主要基于PaddleHub通过预训练模型Erine-tiny在中文7情感分类数据集OCEMOTION上进行微调从而完成7分类情感分析模型的搭建,并基于PyQt5完成了最终中文微情感分析系统的开发,支持单条和批量文本细粒度情感分类预测,具有前沿性和广泛的应用价值。同时全流程教程讲解将带你拿下一个完整文本分类项目的开发!

image

二.项目亮点:

a.不同于传统的情感2分类(正向和负向),本项目使用了7分类数据集OCEMOTION可以达到更细粒度的情感分析,从而可以更好分析用户评论中表达情感,具有前沿性和广泛的应用价值。

b.基于PaddleHub通过预训练模型Erine-tiny的微调完成情感分析模型的搭建。基于大规模未标注语料库的预训练模型(Pretrained Models, PTM) 能够习得通用的语言表示,将预训练模型Fine-tune到下游任务,能够获得比传统分类模型Lstm等更出色的表现,也成为了目前竞赛及项目的主流选择。另外,预训练模型能够避免从零开始训练模型。

c.面向小白的全流程实战教程,全流程细致讲解带你拿下一个完整的文本分类实战项目!项目可扩展性高,感兴趣的也可以在其基础上做出更多的优化或迁移到类似的文本分类项目中去哦!

三.情感分析研究意义:

在评论网站、论坛、博客和社交媒体中,可以获得大量表达意见的文本。而这些文本数据都是非结构化的,没有以预先定义的方式组织,数据量庞大通常难以分析、理解和分类,既费时又费钱。而在情感分析系统的帮助下,这种非结构化信息可以依靠自动化业务流程以有效且低成本的方式大规模转换为结构化数据,极大减少人工标注成本,提高效率。情感分析在舆情监控、话题监督、口碑分析等商业分析领域有着非常重要的应用价值。目前该技术也已有着较广泛的应用,例如新浪微博运用情感分析对全网数据进行挖掘构建舆情大数据平台。电商平台运用情感分析来进行商品评论挖掘,作为推荐系统的一部分提高营销效果。小度机器人通过识别用户在聊天中的情绪,帮助选择出更匹配用户情绪的文本进行回复。在不远的未来,情感分析也将成为现代公司不可或缺的工具。但目前情感分析仍然局限于有限的简单分类主要为2分类,而有限的情感分类并不能很好地挖掘文本中包含的微情感,不能很好地满足需求。故细粒度的情感分析研究具有前沿性和更广泛的应用价值。

四.项目运行说明:

AI Studio项目地址(附全流程教程和完整源码哦!):https://aistudio.baidu.com/aistudio/projectdetail/2211726

注意模型的训练需要到GPU环境,一键fork项目后在AI Studio上选择GPU环境即可运行!

可视化界面核心项目代码在work目录下"中文微情感分析系统"文件夹内。需要先将整个文件夹下载到本地后,根据文件夹内提供的‘环境配置指南及使用说明’进行操作即可,本地在CPU环境下也可以运行。

image

五.系统演示视频:

视频链接: https://www.bilibili.com/video/BV1944y1C7FQ/

单条文本情感分析页面:

image

批量文本情感分析页面:

image

About

PaddleHub实战:基于OCEMOTION的中文微情感分析系统,完整项目教程地址:https://aistudio.baidu.com/aistudio/projectdetail/2211726

License:MIT License


Languages

Language:Jupyter Notebook 100.0%