Bandi120424 / recycle_object_detection

AI_Tech level2_objectdetection-cv-04

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[level2-cv-04] Recycle Object Detection

✏️ Project Overview

trash_overview 분리수거는 자원의 순환을 촉진하는 방법입니다. 우리는 효율적으로 분리수거를 수행할 수 있도록 사진에서 쓰레기를 Detection 하는 모델을 만들어 이러한 문제점을 해결해보고자 합니다.🌎

  • Input : 쓰레기 객체가 담긴 이미지가 모델의 input으로 사용됩니다. 이미지의 각 쓰레기 객체에 대한 bbox annotation은 COCO format으로 제공됩니다.
  • Output : 모델은 bbox 좌표, 카테고리, score 값을 리턴합니다.
  • 평가지표: mAP50
  • 프로젝트 주제: 재활용 쓰레기 이미지를 10개 항목으로 분류 및 bbox 검출
    • 10 class : General trash, Paper, Paper pack, Metal, Glass, Plastic, Styrofoam, Plastic bag, Battery, Clothing
  • 프로젝트 구현 내용, 컨셉, 교육 내용과의 관련성
    • 10가지 범주를 기준으로 객체의 위치를 탐색 및 각 객체를 분류
  • 활용 장비 및 재료(개발 환경, 협업 tool 등)
    • 팀 구성: 5인 1팀
    • 컴퓨팅 환경: 인당 V100 GPU 서버를 VS code와 SSH로 연결하여 사용
    • 협업 툴: notion, git, slack, jira, live share, RabbitMQ
    • 실험관리: wandb

🙌 Members

강동화 박준서 서지희 장철호 한나영
@oktaylor @Pjunn @muyaaho @JCH1410 @Bandi120424

🌏 Contributions

팀원명 학습 모델 추가 작업
강동화 Cascade R-CNN, UniverseNet EDA, 모델 리서치, neck 및 backbone network 리서치
박준서 Cascade R-CNN EDA, mmdetection 실험 세팅, RabbitMQ 사용한 GPU scheduler 구현, Augmentation 리서치 및 실험, 모델 앙상블
서지희 DETR, FocalNet GitHub setting, RabbitMQ 사용한 GPU scheduler 구현
장철호 Cascade R-CNN 모델 리서치, Augmentation 리서치 및 실험
한나영 YOLOv5, v8 EDA, Jira, 실험관리 spread sheet, notion template 구축, ultralytics 실험 세팅, Error Analysis, 모델 앙상블

timeline

Dataset & EDA

  • 전체 이미지 개수 : 9754장 (학습 데이터: 4883장, 평가 데이터: 4871장)
  • 10 class : General trash, Paper, Paper pack, Metal, Glass, Plastic, Styrofoam, Plastic bag, Battery, Clothing
  • 이미지 크기 : (1024, 1024)
  • 주요 문제점
    • 클래스별 박스의 분포에 불균형이 있었습니다. general trash, paper, plastic, plastic bag을 제외하고는 6% 미만의 분포를 보였습니다.
    • 대부분 10개 미만의 object를 포함하고 있었으나, 20개 이상의 object를 포함하는 이미지도 있었습니다. 이 경우에는 물체가 뭉쳐져 있거나, 가려져있는 경우도 많았습니다.
    • 빨대가 있는 커피 take-out 잔을 플라스틱과 종이로 구분하는 등 하나의 물체를 세세히 구분하는 경향을 확인할 수 있었습니다.
    • 일반쓰레기의 구분이 다소 모호하다고 생각했습니다.
    • 흐릿한 이미지가 존재하였습니다.
    • 모델 선정 및 분석
      • Cascade R-CNN: 서로 다른 IOU threshold를 갖는 ROI head를 학습하여 COCO detection task에서 기존의 detector들 보다 좋은 성능을 보여주어 사용했습니다.

      • YOLO v5 & v8: 빠른 학습 속도 + 작은 사이즈의 객체 탐지

        YOLO는 single stage detector로 빠른 학습 속도가 장점입니다. 제한된 시간 내에 비교적 준수한 성능을 내고자 YOLO 모델을 선택하였습니다. 또한, 작은 사이즈 객체를 잘 탐지하는 것이 중요하다고 생각하여 YOLOv5YOLOv8으로 실험을 진행하였습니다.

      • UniverseNet: Coco benchmark 이외에 작은 bbox가 많은 benchmark를 생성하고, 이에 robust한 모델을 제작하였습니다. 실험에 사용한 모델은 UniverseNet50-20.08d 모델로, 여러 개의 서로 다른 조합으로 연결된 네트워크로 구성됩니다. 논문에서는 SyncBN을 사용했으나, 구현 상의 오류로 일반 BN을 사용했습니다.

      • ATSS FocalNet: Transformer를 CV에 적용한 DETR같은 모델이 있었지만 epoch을 100이상으로 해야 하는 등 성능이 별로 좋지 않았습니다. 이에 대해 Self Attention을 대체한 Focal Modulation Network를 사용한 FocalNet을 사용했습니다.

📜 프로젝트 수행 결과

Model Cascade-RCNN (swin-S) Cascade-RCNN (swin-B) ATSS (Focalnet) UniverseNet YOLOv5
mAP 50 0.607 0.5697 0.55 0.584 0.5463

models

About

AI_Tech level2_objectdetection-cv-04


Languages

Language:Python 100.0%Language:Shell 0.0%