TakeruEndo / kaggle_pipeline

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

データコンペ用のパイプライン

初めに

本パイプラインはtakapyさんのコードをクローンして作成いたしました 🙇
また、kaggleのHouse Prices: Advanced Regression Techniquesコンペを想定して作成してあります

推論

$ python3 train_run.py

lightGBMXGBoostCatBoostStackingモデルNeural Networkの推論が走る

ハイパ-パラメータサーチ(lgmb)

$ python3 optuna_lbgm.py

optunaによるlightGBMのハイパーパラメータの探索を行う

特徴量作成

基本的にnotebookで特徴量生成を実施する

# 特徴量作成
$ python3 run_fe.py

# 特徴量確認
$ python3 show_all_features.py

参考

pipeline

アンサンブル

catboost

optuna

その他

  • kaggleで勝つデータ分析の技術(2019)
  • 各モデルのドキュメントやnotebook記載のカーネル

About


Languages

Language:Jupyter Notebook 96.6%Language:Python 3.4%