データコンペ用のパイプライン
本パイプラインはtakapyさんのコードをクローンして作成いたしました 🙇
また、kaggleのHouse Prices: Advanced Regression Techniquesコンペを想定して作成してあります
$ python3 train_run.py
lightGBM
・XGBoost
・CatBoost
・Stackingモデル
・Neural Network
の推論が走る
$ python3 optuna_lbgm.py
optunaによるlightGBMのハイパーパラメータの探索を行う
基本的にnotebookで特徴量生成を実施する
# 特徴量作成
$ python3 run_fe.py
# 特徴量確認
$ python3 show_all_features.py
- kaggleで勝つデータ分析の技術(2019)
- 各モデルのドキュメントやnotebook記載のカーネル