日本語文法誤り検出器

事前に学習済み単語分散表現をダウンロードしhyperparams/hyperparams_japanese_ged.pyのword_embedding に記載した箇所にに配置する。

1行に1単語とタブ区切りでラベルが書かれたデータ形式。sample.txtを参考にして作成する。
hyperparams/hyperparams_japanese_ged.pyのtrain_file, valid_file, test_fileにそれぞれ適切なパスを記載する。
以下のコマンドを実行し前処理をする：

mkdir model_data
python prepro.py japanese_ged

学習のために以下のコマンドを実行する：

mkdir model
python train.py japanese_ged

学習されたのモデルを試す：

python predict.py '私へ元気です。' [word|char]

wordとcharによって予測単位を単語と文字で切り替える。
出力：出力文、ラベル、予測確率

kanekomasahiro / japanese_error_detection

日本語文法誤り検出器

About

Languages