======================================
主办方:**计算机学会 & DataFountain & 阿里巴巴
已失效 因为我的失误 权重丢失 小伙伴们自己训一下吧 😩
官方提供了pts,intensity,category三类点云数据,我们这里参考了Complex-YOLO: Real-time 3D Object Detection on Point Clouds的思路将pts,intensity点云数据处理为最大反射强度,最大高度,归一化密度后再分别归一化到0~1的范围后重组为三通道图片数组,作为我们的训练图像。我们的图片和标签制作过程详见代码making_training_data/pointcloud2RGB.py
鸟瞰图像有一个很大的特点,就是多方向性。传统图像数据集里面,道路目标姿态往往都是类似的,同时也不会有较大的倾斜。鸟瞰图数据集的这个问题就严重,道路目标的朝向东南西北都有可能的,因此训练集里的朝向应当要丰富,避免学习到的模型不具有泛性。 针对这一问题我们采取了下面几种数据增强方法:随机30°倍数旋转,随机水平翻转,随机平移。(均为线上数据增强)
将得到的数据制分别制作成VOC和COCO格式,便于训练。
对多类目标检测算法进行尝试后,最后敲定使用Faster-RCNN作为目标检测算法,得到0.2以上的检测精度。(所需环境和使用方法均已经写在两个txt文件中)
主要对目标nms阈值和目标置信度进行了调整,我们的结果可视化代码要使用matlab,在result_check/下
1.我们本次比赛对数据的清洗和分析做的不够,实际上该数据集类间数量分布很不均匀,需要针对这个情况,对每个类别进行置信度调整,同时部分数据的标注也存在一定的问题,要进行部分数据的筛选。
2.验证集的分割没做好,理想应该挑选5%的数据作为验证集,我们的验证集太小,缺乏代表性
3.图像分割在这个赛题会比目标检测算法有着更好的精度,同时速度上也会有较大的优势。
4.若使用图像分割的话,推断时间减少,就可以尝试在inference阶段使用TTA的思路,减少假阳性。
我们正在联系第一名的团队争取把他们的方案的中文git版本做出来