AVA-6-seconds 所有的视频长度:6秒,前2秒和后2秒不做标注,中间2秒做标注。 中间3秒的视频,只对最中间的一帧进行检测(Bounding Box)与动作标注(action Label)。 然后将最中间的Bounding Box和action Label映射到前一秒和后一秒。