ツイートなど短文書に特化したトピックモデルの一種である Biterm topic model の実装です.
この実装では Stochastic Collapsed Variational Bayes Zero と呼ばれる推論アルゴリズムをミニバッチ学習に対応させており,従来の Gibbs sampling と比較して効率的にトピックを学習できます.
- run pybtm
sh etc/run.sh
- numpy
- scipy
- pretweet.py
- ツイートテキストに前処理を行うスクリプト
- Stochastic collapsed variational bayesian inference for biterm topic model - IJCNN - Awaya et al.