danbi5228 / Project_pregnant_seat_subway

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Project_pregnant_seat_subway

자유롭게 갖고 놀기 위한 가이드

0. 이 레포지토리를 fork 합니다.

1. 내 로컬 어딘가 적당히 clone을 합니다.

2. clone 된 폴더로 들어가 터미널을 열고 branch를 땁니다.

  • 브랜치 이름은 sdt-이름숫자로 만들어주시면 될 것 같습니다. 예를들어 이름이 bomin이라면 sdt-bomin1 브랜치를 생성하면 됩니다. 숫자는 한번 풀리퀘스트를 보내고 머지가 될 때 마다 올라갑니다. sdt는 small data test의 약자 입니다.

3. branch로 checkout 한 후 폴더에서 jupyter notebook을 실행시킵니다.

4. 자유롭게 파일을 만들어보거나 추가하거나 원래 있던 파일을 가지고 놀아보면 됩니다.

5. 스몰데이터 셋을 DATA 폴더에 업데이트 할 때는 파일 이름을 다운로드받은날짜-이름로 해주시면 될 것 같습니다.

  • 같은날 받은 csv가 data 셋에 중복되게 들어올 경우도 있을 것 같으니 0813-이름으로 하겠습니다.

0813-bomin.csv 전처리 과정

  • 드라이브에서 excel 파일로 다운로드를 받습니다,
  • 첫행을 delete합니다.(컬럼의 대분류는 사람이 보기 좋으라고 만든거니까 굳이 필요 없을거라고 생각했습니다.)
  • 오른쪽에 달아놓은 주석(연령, 붐빔정도 등등에 대한 설명)도 delete합니다.
  • pandas로 가공하기에 날짜는 엑셀에서 미리 날짜형식으로 바꾸는 것이 편해서 날짜 형식으로 바꾸었고, 시간은 그대로 string으로 두었습니다.
  • 저장형식을 csv 문서로 하고 파일 이름은 데이터를 다운받은 날짜로 바꿔줍니다.

csv를 다운받아서 excel에서 가공하는 것 부터 마음대로 한 번 해보시면 좋을 것 같습니다.

pullrequest는 아무때나 아무렇게나 날려주시면 확인하고 반영할게요!

About


Languages

Language:Jupyter Notebook 100.0%