环境要求:
pip/conda install tensorflow/tensroflow-gpu==1.10.0
pip/conda install keras
pip/conda install opencv-python
1、将所有的标签数据全部放在Annotations下,图片数据集放在JPEGImages下。
2、运行test.py脚本生成ImageSets文件下Main里面四个txt文件。
3、修改voc_annotation.py第7行里面内容为自己的类别标签同时在model_data里面修改voc_classes内容为自己类别标签, (该过程要保证两个标签的顺序和空格不然导致inference过程没法正常运行)运行voc_annotation.py生成2007_train.txt/2007_val.txt/2007_test.txt
4、运行kmeans脚本生成自己数据的预设anchor,根目标下生成自己数据的yolo_anchorers将该文件放到model_data目录下取代原有的。
5、运行train.py为迁移学习训练自己数据,运行train_my.py为初始化训练自己的数据。(如果迁移学习在train.py里面32行加载预训练权重这里我写好不要乱改)
6、cfg和train/train—my里面的修改: cfg里面修改内容 2/3行修改:含义为batch参数除以subdivisions等于train脚本里面batchsize(这是一个非常经典的训练测试) 类别classes:607/693/783/行为类别数目 filters = 3*(5+classses)
7、测试修改yolo.py的216/217行执行脚本。
8、相关参数解释:
模型结构图
其他相关教程