wangxinzhe95 / TextClassification

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

使用网络爬虫对搜狗新闻文本进行爬取。使用Python进行中文分词,计算特征权重TF*IDF,使用Bayes和SVM方法实现文本分类。

最终实现了一个20类分类器。

About


Languages

Language:Python 100.0%