cjf8899 / Celeb_FaceDB

:earth_americas:DB of famous tennis players and broadcasting station anchors

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Create Celeb FaceDB

Demo

Coming soon~

1. Images Crawling

  • 코드 및 Visual Studio Code, Python 다운로드
  • 현재 chrome 버전 정보를 확인, 버전에 맞는 chromedriver를 다운로드
    • 자신의 크롬 버전을 찾고 chromedriver 다운로드
    • 크롬버젼 확인 링크 : chrome://settings/help
    • chromedriver 다운로드 링크 : chromedriver

memoryblock

2. FaceDB Menual

  • 크롤링한 이미지를 front, side, back 폴더를 만든 후 사진을 구별하여 분류

memoryblock memoryblock


  • 분류 후 이름을 코드로 재설정(코드는 따로 공개 X)
  • 검색어 인물 이외의 다른 사람이 존재해도 무방
    • 다른 인물은 Etc 로 분류

memoryblock

2.1 Images Example

  • Front

memoryblock


  • Side

memoryblock


  • Back

memoryblock

3. Category Classification tool

  • category tool은 이미지를 front, side, back, delete로 쉽게 분류

memoryblock memoryblock


4. Data Labeling

  • 라벨은 PascalVOC 포멧에 따라 xml로 제작하였고, 필요에 따라 json파일로도 변환이 가능하다.

4.1 Pretreatment

  • 전처리 작업으로 RatinaFace를 이용하여 이미지에서 얼굴영역을 찾은 다음, xml에 위치정보를 저장한다.

4.2 Work

  • 전처리 과정으로 대부분의 얼굴영역은 잡혔지만, 잡히지 않은 영역은 tool을 이용하여 작업하였다.
  • 얼굴 영역을 드래그하여 선택하고 라벨을 입력한다. 라벨이 잘 못된 영역은 더블 클릭하여 수정한다.

memoryblock

4.3 Example

memoryblock memoryblock

5. Result

  • Class : 200
  • Total Images : 29,266
  • xml : 29,266
  • json : 29,266
Task number Task Count
Task1 Tennis 남자 1~25위 (25명) 5,183
Task2 Tennis 여자 1~25위 (25명) 8,284
Task3 Trump cabinet (25명) 5,174
Task4 Biden cabinet (26명) 4,000
Task5 News3lv anchor (31명) 373
Task6 FOX anchor (26명) 2,104
Task7 ABC anchor (21명) 2,514
Task8 CBS anchor (21명) 1,634

red bb : target
blue bb : etc

memoryblock memoryblock

About

:earth_americas:DB of famous tennis players and broadcasting station anchors