长度问题
clearloveclearlove opened this issue · comments
yibiao commented
请问一下关于处理输出长度可变的问题。
在训练过程中,您是将输入与输出处理到等长然后进行训练,这是只有当您知道目标标签才能进行的处理方式,那么用于测试时,假设不提供标签,如何处理输入呢?根据您的代码,您测试的时候也假设已知标签语句长度的情况下进行的
Piji Li commented
谢谢。在inference阶段,就是简单的在input后面补充mask,考虑到纠错问题变动不是太大,所以补充3-5个就好,补充太长效果会变的不可控。
AnticPan commented
对于变长文本纠错,我还有些疑问:
- 训练阶段需要在每句话后补充mask吗?
- 用添加了mask的样本训练,模型是否会学到输出长度要等于输入长度?
- 构造的TtTSet数据集的相关统计信息(平均输入长度、平均输出长度、词错误率WER)
希望您能解答,谢谢。