lipiji / TtT

code for ACL2021 paper "Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese Grammatical Error Correction"

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

请问是否可以提供一个数据sample

YouranShan opened this issue · comments

请问是否可以提供一个数据sample

  1. DataLoader里面需要的数据是由\t分割的三段文本,但source和target只有两段,而第三段也没有在后续代码中出现,是不是应该把断言那里改成2
  2. tag_name_list在一开始出现就加了一个sep,而后面的条件判断中又为tag_name_list添加了sep,这应当是冗余了吧?
commented

+1 求问HybirdSet转换后的数据格式是什么样的

第二个问题,我也觉得是冗余了

见data文件夹