text2vec数据集构建

Question

sz2three opened this issue a year ago · comments

看huggingface的例子，例子， text2vec的原始数据看起来像QA问答的数据，请问您是怎么把问答数据构建成为文本embeddings训练的数据的呢，CoSENT的训练是不是需要（sentence1,sentenc2,sentenc3）三个样本呢？

zzy · Answer 1 · Mon Jul 10 2023 17:39:58 GMT+0800 (China Standard Time)

应该是in batch negative方式训的