Bandi120424 / bone_segmentation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[level2-cv-04] Semantic Segmentation

✏️ Project Overview

image

Bone Segmentation은 인공지능에서 중요한 응용 분야 중 하나로, 다양한 목적으로 도움을 줄 수 있습니다. 이렇게 만들어진 우수한 성능 모델은 질병 진단, 수술 계획, 의료 장비 제작, 의료 교육 등에 사용될 수 있을 것으로 기대됩니다.🌎

  • Input : hand bone x-ray 객체가 담긴 이미지가 모델의 input으로 사용됩니다. segmentation annotation은 json file로 제공됩니다.
  • Output : 모델은 각 픽셀 좌표에 따른 class를 출력하고 이를 rle로 변환하여 리턴합니다.
  • 평가지표: mean Dice
  • 프로젝트 주제: hand bone x-ray 이미지를 29개 항목으로 픽셀에 따른 class 검출
  • 프로젝트 구현 내용, 컨셉, 교육 내용과의 관련성
    • 29가지 범주를 기준으로 객체의 위치를 탐색 및 각 객체를 분류
  • 활용 장비 및 재료(개발 환경, 협업 tool 등)
    • 팀 구성: 4인 1팀
    • 컴퓨팅 환경: 인당 V100 GPU 서버를 VS code와 SSH로 연결하여 사용
    • 협업 툴: notion, git, slack, jira
    • 실험관리: wandb

🙌 Members

강동화 박준서 서지희 한나영
@oktaylor @Pjunn @muyaaho @Bandi120424

🌏 Contributions

팀원명 학습 모델 추가 작업
강동화 FCN, DeepLabV3, DeepLabV3+, UNet++ EDA, 모델 리서치, pytorch-lightning 실험 환경 세팅, Data Cleansing, Augmentation 실험 및 시각화 구현, RabbitMQ를 사용한 실험 자동화
박준서 FCN, DeepLabv3+, HRNet-OCR, UPerNet+ConvNeXt EDA, 모델 리서치, pytorch-lightning 실험 환경 세팅, mmsegmentation 실험 세팅, Augmentation 리서치 및 실험, 시각화 구현, 모델 앙상블
서지희 FCN, UNet, UNet++ EDA, 모델 리서치, pytorch-lightning 실험 환경 세팅, Augmentation 리서치 및 실험, 시각화 구현, 모델 앙상블 구현
한나영 UNet++, FCN EDA, Jira 세팅, 모델 리서치, mmsegmengtation, smp 및 pytorch-lightning 실험 환경 세팅, SWA ,모델 앙상블 구현

Dataset & EDA

  • 전체 이미지 개수 : 1100장 (학습 데이터: 800장, 평가 데이터: 300장

  • 29 class : finger-1, finger-2, finger-3, finger-4, finger-5, finger-6, finger-7, finger-8, finger-9, finger-10, finger-11, finger-12, finger-13, finger-14, finger-15, finger-16, finger-17, finger-18, finger-19, Trapezium, Trapezoid, Capitate, Hamate, Scaphoid, Lunate, Triquetrum, Pisiform, Radius, Ulna

  • 이미지 크기 : (2048, 2048)

  • 주요 문제점

    • Multi-label classification: 다수의 클래스로 분류해야하는 pixel 존재
    • 경계가 모호한 사진 존재
    • 장신구 착용
  • 모델 선정 및 분석

    • Architecture
      • UNet: Encoder-decoder 기반 모델로 저차원 특징과 고차원 특징 추출
      • UNet++: Re-designed skip pathway를 설계함으로써 encoder와 decoder 사이에 semantic gap을 줄여 더 쉽고 빠르게 학습
      • DeepLabV3: Atrous Spatial Pyramid Pooling(ASPP)을 통해 Multi-scale contextual feature를 학습
      • DeepLabV3+: Decoder에서 backbone의 low-level feature와 ASPP 모듈 출력을 모두 사용하여 단순한 Up-sampling 연산을 개선
      • FCN: semantic segmentation을 위해 고안된 CNN 기반 모델
      • OCRNet: 문맥 정보를 고려한 semantic segmentation 모델
      • UPerNet: 다양한 visual task 해결을 위해 고안된 FPN 기반 모델
    • HRNet Backbone: High Resolution과 병렬로 Low Resolution을 적용해 전체 stage에서 높은 해상도를 유지합니다.

📜 프로젝트 수행 결과

image

About


Languages

Language:Jupyter Notebook 99.6%Language:Python 0.4%Language:Shell 0.0%