ipsolar / ShortTextClassification

该项目是短文本分类,目前应用于新闻标签的分类

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ShortTextClassification

  • 数据语料:搜狗实验室提供的公开新闻数据语料
  • 技术:利用大语料无监督训练LDA模型,利用svm分类
  • 效果:在4分类上准确率可以达到95%,在7分类上准确率可以达到87%

About

该项目是短文本分类,目前应用于新闻标签的分类


Languages

Language:Python 100.0%