kihohan / dt_fnc

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

data_function

* 예측 프로젝트 함수

  1. train, test 셋을 합친다
  2. class 변환
  3. EDA
  4. 결측치 확인 및 삭제, 결측치 보간(평균,최빈값,평균값,선형보간)
  5. 시간데이터 변환
  6. cate -> 버켓팅, 원핫인코딩 / 타켓 인코딩, continous -> 이상치 제거, 버켓팅, 정규화, 스케일링
  7. 다시 EDA를 통한 data exploration ex) 상관성, class와 feature 상관성,,,
  8. 리샘플링 시도 (대체적으로 train에는 높은 스코어를 얻으나 현실에서는 실질적으로 좋은 결과를 얻기 어려운 경우가 많았음)
  9. 평가지표 선택 and 머신러닝 알고리즘 선택
  10. 기획 및 개발한 알고리즘 사용방안 제시

About


Languages

Language:Python 100.0%