为什么num_examples默认是10？

Question

coderchem opened this issue 6 months ago · comments

coderchem · Answer 1 · Mon Nov 27 2023 14:11:32 GMT+0800 (China Standard Time)

我理解，数据应该是越多越好。为什么啥只是选择10呢？

Horseee · Answer 2 · Wed Nov 29 2023 16:04:45 GMT+0800 (China Standard Time)

calibration set的数量是越多越好。但是如果数据越多，计算梯度所需要的成本和时间开销就更大（比如如果算的是hessian，所需时间会显著变长）。同时再增加数量对效果的提升较为不明显，因此我们选择了10。你也可以选择一个更大的样本集合。