forevaer / traffic

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

数据整理

标准命名,同时生成数据目录csv

数据转换

阶段操作

常用配置

入口

策略

由于训练过程中,发现样本存在相同图案,但是底色不同的情况,为了更好的抓住重点进行训练,采用如下两种方法进行调整。

  • 灰度图

直接采用灰度图像进行训练,摒弃颜色影响

  • 调权值

对于预测失败的样本,采用更高的权值,放大损失函数,以拟合预测失败的图片。
该方法默认样本收集无误,只是特征样本上存在一定偏差,如果样本存在一定数量的错误样本,该方法也会拟合错误样本,该场景下不推荐使用。
同样的,该方法容易过拟合,应在拟合程度较差的三色通道进行使用,以削减网络对于底色的依赖。

结果

本次实验中,训练集拟合结果(>90%)不错,但是在测试集上的表现不佳(0.6~0.8)。
分析原因在于下面几点

  • 样本各分类样本数量不足
  • 训练和测试样本存在偏差
  • 网络方面或存在一定改进

由于样本的问题,简单样本之间或具备了隔离性,但是相同类型之间,却不具备扩展性。
如果只是测试训练类型的样本,结果还行,但是对于单一类型的旋转、颜色、边框等变换检测,效果不尽人意。
应当收集更多类型样本,或者进行数据增广,在剪裁、底色、边框等方面进行变换,以提高特征变换的检测。
但是样本的局限,不宜过多进行数据增广, 主要根源还是在于单类样本类型的缺乏,模型学习了简单的分类特性,却不具备单一类型的扩展性,对于样本的变换缺乏一定泛化能力。
同样的,应当适当的进行裁剪,以更好的进行特征提取,数据缺乏的情况下,通过剪裁(关键点或者部分关键点),让网络对于关键部位以及非关键部位有一定的判断依据。
总而言之,训练数据在样本数量、样本类型(颜色、局部、边框)上缺乏更多可学习信息,缺乏本质上的包容性,单一方面的去拟合,并不足以提高泛化能力,只是丢掉精度的碰运气。

网络方面的话,前面使用连选3x3以提高感受野,局部采用maxpooling,对于高光或者黑暗的样本,容易抹杀局部的特征学习。
后续急于降低图片尺寸,采用了averagepooling避免信息缺失,但是同样混淆了信息。
对于本身尺寸就较小、加上样本特征更多在于棱角,连续的大感受野检测,容易混淆拐点等细微信息,也容易引入颜色等作为判断信息。
而且maxpooling,对于高光或黑暗场景下,关键信息可能就此被过滤,更主要后续的averagepooling,对关键信息也有一定的搅浑水的嫌疑。

总体来看,三角边框是否算作一种内聚的特征呢,类型34和35的区别在哪呢,褪色的广告牌无边框算啥分类呢? 分类是真的多,样本是真的少,底色、边框、角度、关键点等可提取的特征信息真的不多。
这种情况下,训练的结果必然天然耦合,泛化能力不强,因为训练的数据的局限,无法泛化。
无依据的泛化,就是瞎猜。

About


Languages

Language:Python 100.0%