Corpus parallel_corpus_dict: 平行语料相关字典 'simple_jp_zh_proper_noun.txt': 专有词表, 用于平行句判断。 'kanji_hanzi_list.txt': 中日汉字对照表 zh_dict: strokes.txt: (unihan对应的)笔画数, 只有按unicode顺序的笔画数 unihan_strokes.txt: unicode [space] stroke