murray-z / text_clustering

文本聚类(Kmeans、DBSCAN、LDA、Single-pass)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

text_clustering

文本聚类

目录

  • data

    • 存放数据
  • Kmeans

    • 基于KMeans的无监督中文文本聚类
  • DBSCAN

    • 基于DBSCAN的无监督中文文本聚类
  • LatentDirichletAllocation

    • 基于LDA的无监督文本聚类
  • Single_Pass

    • 基于single pass 策略进行聚类,不需要事先设置类别数

About

文本聚类(Kmeans、DBSCAN、LDA、Single-pass)

License:Apache License 2.0


Languages

Language:Python 100.0%