Jeon0866/3monkey_yolo

3monkey_yolo project : 고속도로 cctv📡 프로젝트

Project Description

고속도로 cctv 데이터를 활용하여 Gcp vertex ai로 yolo v8 모델로 학습한 프로젝트 입니다.

yolo는 아래와 같이 하나의 컨볼루션 네트워크(convolutional network)가 여러 bounding box와 그 bounding box의 클래스 확률을 동시에 계산해 줍니다. YOLO는 이미지 전체를 학습하여 곧바로 검출 성능(detection performance)을 최적화합니다. YOLO의 이런 통합된 모델은 기존의 객체 검출 모델에 비해 여러 가지 장점이 있습니다.(1)

또한 YOLO는 굉장히 빠릅니다. 왜냐하면 YOLO는 기존의 복잡한 객체 검출 프로세스를 하나의 회귀 문제로 바꾸었기 때문입니다.

이러한 여러가지 장점으로 인해서 이번 프로젝트의 알고리즘으로 yolo를 선정하게 되었습니다.

Preferences

GCP : Vertex AI 인스턴스 노트북 사양 :

환경 : pytorch:1.13
머신유형 : cpu 32개 메모리 120gb, gpu v100 4장
디스크 : data 200gb, boot 200gb

개발 환경 :

python =3.10
pandas
numpy
xmltodict (xml파일 dict형으로 변환)
ultralytics = 8.0.20 (최신버전은 에폭당 클래스 map 확인 불가. 버전 낮춤.)

데이터(2)

tarin 데이터 1~4 채널
validation 데이터 1~4 채널

Experiment

01_download_unzip.ipynb description

버킷에서 파일을 다운로드하기 위해서 gcp jupyterLab에서 명령어를 입력해 준다.

python
# 압축해제하는 함수 설정

import zipfile
import concurrent.futures
import os
from tqdm import tqdm

def unzip(zip_file, output_folder):
    with zipfile.ZipFile(zip_file, 'r') as zf:
        os.makedirs(output_folder, exist_ok=True)
        file_list = zf.namelist()
        with tqdm(total=len(file_list), desc=f'{zip_file} 압축 해제 중') as pbar:
            for file in file_list:
                zf.extract(file, output_folder)
                pbar.update(1)

# 데이터 다운 및 압축해제
!gsutil -m cp gs://sessac-project-05-bucket-01/Train라벨_1.수도권영동선.zip Train라벨_1.수도권영동선.zip

output_folder = '/home/jupyter/datasets/xml_train/'

zip_file_paths = ['Train라벨_1.수도권영동선.zip']


with concurrent.futures.ProcessPoolExecutor() as executor:
    executor.map(unzip, zip_file_paths, [output_folder] * len(zip_file_paths))

for zip_file in zip_file_paths:
    os.remove(zip_file)
.
.
.

xml_to_txt.ipynb description

coco 데이터셋 annotation 정보를 yolov8 annotation 정보로 바꿔준다.

def to_yolov8(y):
  """
  # change to yolo v8 format
  # [x_top_left, y_top_left, x_bottom_right, y_bottom_right] to
  # [x_center, y_center, width, height]
  """
  width = y[2] - y[0]
  height = y[3] - y[1]

  if width < 0 or height < 0:
      print("ERROR: negative width or height ", width, height, y)
      raise AssertionError("Negative width or height")
  return (y[0] + (width/2)), (y[1] + (height/2)), width, height

yolov8 annotaion 정보를 txt파일에 저장해준다.

def write_yolov8_txt(folder, annotation):
  #print(annotation[0][:-3])
  out_filename = os.path.join(folder,str(annotation[0][:-3]))
  out_filename = os.path.splitext(out_filename)[0]
  out_filename = out_filename+'.txt'

  f = open(out_filename,"w+")
  for box in annotation[3]:
    f.write("{} {} {} {} {}\n".format(box[0], box[1], box[2], box[3], box[4]))

08_yolov8.ipynb description

🚀yolo nano 모델을 활용하여서 24천 건의 3가지 라벨 데이터를 학습 시켰다. 하이퍼 파라미터는 아래와 같다.

ver.1

 !yolo task=detect mode=train model=yolov8n.pt data=ddd.yaml epochs=100 imgsz=640 batch=92 cache=True device=0,1,2,3

ver.2

!yolo task=detect mode=train model=yolov8n.pt data=ddd.yaml epochs=50 imgsz=640 batch=128 cache=True device=0,1,2,3

ver.3

!yolo task=detect mode=train model=yolov8n.pt data=ddd.yaml epochs=50 imgsz=640 batch=92 cache=True device=0,1,2,3

배치 크기와 모델 훈련 시간의 관계를 살펴보자.

100개의 훈련 데이터를 가지고 80에폭 동안 훈련시킨다고 가정해보자.

배치 크기=1이면, 모델은 1에폭 당 100번 훈련(가중치 업데이트), 총 8000번 훈련
배치 크기=10이면, 모델은 1에폭 당 10번 훈련, 총 800번 훈련
배치 크기=100이면, 모델은 1에폭 당 1번 훈련, 총 80번 훈련
즉, 배치 크기를 키우면 1에폭 당 훈련 수가 감소하고 이로 인해 전체 훈련 횟수가 감소하여 결과적으로 전체 훈련 시간이 감소하게 된다.(3)

아래 gif를 보면 패턴에 대해서 과하게 인식하여서 교차선 디자인까지 anotation되었다고 추론.
정성정 평가를 기준으로 해당 상황을 오버피팅이 상황이라고 간주하여 경량 학습을 진행 할 수 있도록 파라마터 조정을 시도하기 위해서 후속연구 진행하여 ver.3 결과를 얻었다.

다만, 데이터량을 고려하여 batch 사이즈 파라미터 조정에 어려움이 있어 val_cl_loss가 증폭된 것이 확인되었다. <result.png>

이유는,

뿐만 아니라, medium 모델을 통해서 성능 개선을 위한 후속 연구 진행 중

Results Analysis

ver.1 어노테이션 결과

교차선 라인을 자동차 패턴으로 인식하여 어노테이션하는 상황이 발생하였다. 파라미터를 조정하여 ver.2로 다시 학습하였다.

ver.2 어노테이션 결과

조정된 파라미터로 재학습된 결과 교차선을 차로 인식하여 anotation되는 문제를 개선시킬 수 있었다.

ver.3

과적합되었다는 것을 검증하기 위해서 ver1의 모델에서 batch수는 그대로 하고 epochs수를 줄인 모델로 다시 테스트를 진행하였다. 아래 mAP수치가 ver1 > ver3 > ver2 순이고 ver1에서 anotation한 가중치보다 적게 표시되지만 여전히 miss anotation이 되는 것을 확인 할 수 있다.

이 결과를 바탕으로 nano 모델의 첫 번째 학습은 과적합으로 간주하고, ver.2로 학습을 종결하고자 한다.

+실험

COCO에서 50.2의 mAP를 달성하였고 다양한 작업별 domain들에서 YOLOv8(4)은 YOLOv5보다 높은 성능을 보였던 YOLOv8m (medium)로 학습을 진행한 모델로 테스트를 해본 결과 특별한 파라미터 튜닝없이도 깔끔한 anotation이 되어있는걸을 확인할 수 있었다.

ver.1 result

epochs	recall	mAP50	mAP50-95
96	0.85379	0.89566	0.73628
97	0.85377	0.89568	0.7364
98	0.85408	0.89556	0.7365
99	0.85344	0.89539	0.73649
100	0.85461	0.89536	0.73629

ver.2 result

epochs	recall	mAP50	mAP50-95
46	0.83281	0.86212	0.71109
47	0.8393	0.86266	0.71187
48	0.83697	0.86305	0.71207
49	0.83767	0.86363	0.7121
50	0.83431	0.86254	0.7112

ver.3 result

epochs	recall	mAP50	mAP50-95
46	0.83129	0.88988	0.72409
47	0.8345	0.89061	0.72499
48	0.83976	0.89115	0.72532
49	0.84041	0.89097	0.72546
50	0.83566	0.88789	0.72336

+실험 result

epochs	recall	mAP50	mAP50-95
96	0.89248	0.93703	0.79761
97	0.89314	0.93646	0.79773
98	0.89276	0.93639	0.79785
99	0.89245	0.93674	0.79782
100	0.89197	0.93677	0.7979

Refrence

(1) : yolo v8
(2) : AI허브 cctv데이터 (3) : epochs,batch
(4) : yolo모델 비교

Jeon0866 / 3monkey_yolo

3monkey_yolo project : 고속도로 cctv📡 프로젝트

Project Description

Preferences

Experiment

01_download_unzip.ipynb description

xml_to_txt.ipynb description

08_yolov8.ipynb description

Results Analysis

ver.1 어노테이션 결과

ver.2 어노테이션 결과

ver.3

+실험

ver.1 result

ver.2 result

ver.3 result

+실험 result

Refrence

About

Languages