- 文件夹说明
data里为从网上爬取的原始数据,但是经过了分词处理
data1里为从data里随机抽取的20个样本
paint_data里为部分画图所用数据
src中为主要代码 - 运行环境说明
windows10专业版,python3.5,编辑器为pycharm - 依赖说明
在运行本项目中的代码之前,需要为python安装sklearn, scipy, numpy, matplotlib, jieba, urllib, bs4, pandas等依赖库 - 运行说明
本项目由pycharm创建,可使用pycharm直接打开
首先获取数据,运行get_data.py
其次运行 切词.py
至此数据处理完成