cuichenxu / TextCNN

Implement of TextCNN by PyTorch, and an implement of THUNews classification task.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

TextCNN

使用TextCNN完成中文新闻分类,数据集为THUCNews

数据集:使用别人已经处理好的THUCNews数据集,数据集源:数据集下载

本仓库代码实现:数据处理,构造模型,训练模型,保存模型后根据输入进行推理

代码下载到本地可直接使用,或按照自己数据集格式修改embedding, model_dim等参数。

使用

  1. 数据集下载下载数据集,放到data文件夹下
  2. 根据提示修改save_vocab.py, main.py, inference.py, train.py中的数据集/模型保存/模型加载 路径
  3. 训练:执行python train.py
  4. 推理:执行python inference.py

说明

数据处理

数据预处理:save_data.py: 读取数据,分词,保存数据

数据集:dataset.py: 继承自torch.utils.data.Dataset,用于加载数据集

模型

TextCNN:model.py:TextCNN模型

训练

训练:train.py:训练模型

推理

推理:inference.py:加载模型,并进行预测

About

Implement of TextCNN by PyTorch, and an implement of THUNews classification task.


Languages

Language:Python 100.0%