事前に学習済み単語分散表現をダウンロードしhyperparams/hyperparams_japanese_ged.py
のword_embedding
に記載した箇所にに配置する。
1行に1単語とタブ区切りでラベルが書かれたデータ形式。sample.txt
を参考にして作成する。
hyperparams/hyperparams_japanese_ged.py
のtrain_file
, valid_file
, test_file
にそれぞれ適切なパスを記載する。
以下のコマンドを実行し前処理をする:
mkdir model_data
python prepro.py japanese_ged
学習のために以下のコマンドを実行する:
mkdir model
python train.py japanese_ged
学習されたのモデルを試す:
python predict.py '私へ元気です。' [word|char]
wordとcharによって予測単位を単語と文字で切り替える。
出力:出力文、ラベル、予測確率