FooQoo / pybtm

Implementation of Byterm Topic Model

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

pybtm

ツイートなど短文書に特化したトピックモデルの一種である Biterm topic model の実装です.
この実装では Stochastic Collapsed Variational Bayes Zero と呼ばれる推論アルゴリズムをミニバッチ学習に対応させており,従来の Gibbs sampling と比較して効率的にトピックを学習できます.

QuickStart

  • run pybtm
sh etc/run.sh

Requirement

  • numpy
  • scipy

Useful tool

  • pretweet.py
    • ツイートテキストに前処理を行うスクリプト

Reference

About

Implementation of Byterm Topic Model


Languages

Language:Python 95.0%Language:Shell 5.0%