P104のGroupKFoldについて
upura opened this issue · comments
Shotaro Ishihara commented
#31 にお寄せいただいた質問を移行しました。
P104では、ドライバーの画像から運転態度を予測する問題が論じられ、データセット内にグループが存在する場合、同一のドライバーが分割されないよう気を付ける必要があると書かれていました。
しかし、もし同一のドライバーが分割されないようにGroupKFoldを行うと、同一のドライバーは必ずtrainかvalのどちらのみに存在し、学習すること自体ができなくなりませんか?
Shotaro Ishihara commented
@conan1024hao
「同一のドライバーは必ずtrainかvalのどちらのみに存在」という認識は正しいです。その上で、個々人のドライバーの癖に依存しない、汎用的な運転態度の傾向が学習されると期待されます。