crf的loss部分疑似进行了两次batch average

Question

crf的loss部分疑似进行了两次batch average

Fzz123 opened this issue 6 years ago · comments

您好，我在参看代码的时候发现，crf.py 中的 neg_log_likelihood_loss 函数里有：
if self.average_batch:
return (forward_score - gold_score) / batch_size
return forward_score - gold_score
而在调用它的 sequence_labeling_model.py 中的 loss 函数里也有：
if not self.use_crf:
batch_size, max_len = feats.size(0), feats.size(1)
lstm_feats = feats.view(batch_size * max_len, -1)
tags = tags.view(-1)
return self.loss_function(lstm_feats, tags)
else:
loss_value = self.loss_function(feats, mask, tags)
print ('loss_value:', loss_value)
if self.average_batch:
batch_size = feats.size(0)
loss_value /= float(batch_size)
return loss_value
这样是不是就多求了一次平均呢？

csy · Answer 1 · Mon Jun 03 2019 17:01:57 GMT+0800 (China Standard Time)

同问，我也发现了这里~

csy · Answer 2 · Mon Jun 03 2019 17:02:12 GMT+0800 (China Standard Time)

您好，我在参看代码的时候发现，crf.py 中的 neg_log_likelihood_loss 函数里有：
if self.average_batch:
return (forward_score - gold_score) / batch_size
return forward_score - gold_score
而在调用它的 sequence_labeling_model.py 中的 loss 函数里也有：
if not self.use_crf:
batch_size, max_len = feats.size(0), feats.size(1)
lstm_feats = feats.view(batch_size * max_len, -1)
tags = tags.view(-1)
return self.loss_function(lstm_feats, tags)
else:
loss_value = self.loss_function(feats, mask, tags)
print ('loss_value:', loss_value)
if self.average_batch:
batch_size = feats.size(0)
loss_value /= float(batch_size)
return loss_value
这样是不是就多求了一次平均呢？

我感觉也是哎