tm4roon / survey

Survey on machine learning.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Controllable Data Synthesis Method for Grammatical Error Correction

tm4roon opened this issue · comments

Controllable Data Synthesis Method for Grammatical Error Correction

文法誤り訂正における擬似データ生成の研究。ここでは、ルールベースの擬似データ生成(ランダムに単語を置換, 挿入, 削除)と逆翻訳を利用した擬似データ生成の2つを用いて実験を行なっている。擬似データにおける誤り率や誤りタイプにフィルタリングをかけることにより、より効果的な擬似データ生成を試みている。結果として、誤り率40%程度で、既存のモデルの性能を最も改善できることを示した。

文献情報