https://www.notion.so/9dfd78b8a1cd4f8891a9799fb9e7c313
![image](https://user-images.githubusercontent.com/86671456/172179003-29299766-6706-4328-a3cf-4ee7684a9b82.png)
분석명 |
목적 |
물류 유통량 예측 경진대회 |
제주시 내 택배 운송 데이터를 이용하여 운송량 예측 AI개발 |
소스 데이터 |
데이터 입수 난이도 |
분석방법 |
정형데이터(csv) |
하 |
EDA, Visualization, Regression |
분석 적용 난이도 |
분석적용 난이도 사유 |
분석주기 |
분석결과 검증 Owner |
중 |
실제 데이터를 가지고 머신러닝을 활용 |
Daily |
실습코치님, 이재원강사님, 고려대학교 강필성 교수님의 대학원생분들 |
프로젝트 순서 |
Point |
세부 내용 |
문제 정의 |
해결할 점, 찾아내야할 점 |
|
데이터 수집 |
공개 데이터, 자체 수집, 제공된 데이터 |
|
데이터 전처리 |
문제에 따라서 처리해야할 방향 설정 |
|
Feature Engineering |
모델 선정 혹은 평가 지표에 큰 영향 |
|
연관 데이터 추가 |
추가 수집 |
훈련, test |
알고리즘 선택 |
기본적, 현대적 |
|
모델 학습 |
하이퍼파라미터,데이터 나누기 |
|
모델 평가 |
확률, |
|
모델 성능 향상 |
성능 지표, 하이퍼파라미터, 데이터 리터러시 재수정 |
|
공식기간: 2022.06.03 ~ 2022.06.14
- 인원:김호민, 이근희, 이기수, 안세호, 이세현
- 직책:
- 데이터:
- 주 역할:
- 보조 역할:
- 추가 역할:
- 협업장소: Github, GoogleMeet
- 소통: Slack, Notion,Git project, Google OS
- 저장소: Github, Google Drive
- 개발환경: Visual studio code, Juypter Notebook, colab
- 언어 :python 3.8.x
- 라이브러리:Numpy,Pandas, Scikit-learn 1.1.x
- 시각화 라이브러리: Seaborn, Matplotlib, Plot,Plotly
- 시각화 도구: Tableau, GA
- 웹 크롤링:
- feat: 기능 개발 관련
- fix: 오류 개선 혹은 버그 패치
- docs: 문서화 작업
- test: test 관련
- conf: 환경설정 관련
- build: 데이터 집산
- Definition: 프로젝트의 전반적인 문제 정의 및 내용 설정
- Data: 전처리 파일 및 모델링을 위한 파일
- models: 여러 모델들의 집합
- src :scripts