hchhtc123 / 2021SoftwareCup-NewsSortSystem

2021软件杯-新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于VUE+FastAPI完成该项目的web端部署。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

2021SoftwareCup-NewsSortSystem

一.项目简介:

2021软件杯——新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于Vue+FastAPI完成该项目的web端部署。

image

二.项目意义:

对新闻文本数据进行有效的筛选和分类,可以让用户更高效的获得有价值的新闻信息,节约用户信息获取的成本;另一方面互联网公司使用文本分类技术,可以对新闻文本进行类别的划分,把不同类别放在不同类别库,根据用户需要进行精确的自动化推荐,极大节省人力物力。

image

三.项目运行说明

根据“必读项目说明.txt”进行简单操作即可。

AI Studio项目教程地址:

https://aistudio.baidu.com/aistudio/projectdetail/1981601

https://aistudio.baidu.com/aistudio/projectdetail/2819739

四.项目演示:

4.1 基于PyQt5的GUI界面开发

演示视频:

https://www.bilibili.com/video/BV1x34y1D7U6/

单条新闻分类:

image

批量新闻分类:

image

4.2 基于VUE+FastAPI的web端开发

演示视频:

https://www.bilibili.com/video/BV1vF411h7QM/

web端新闻分类:

image

About

2021软件杯-新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于VUE+FastAPI完成该项目的web端部署。

License:MIT License


Languages

Language:Python 85.1%Language:Vue 12.0%Language:JavaScript 1.8%Language:HTML 1.1%