thangldw / 100knock-ML

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

この度は、「Python実践機械学習システム100本ノック」を手にとっていただきありがとうございます。

ダウンロードファイルには、 本章とDockerファイルの二つが含まれています。

【本章】 本章には、章ごとにフォルダが準備されています。 それぞれのフォルダには、 ①ソースコードであるJupyter Notebookファイル(.ipynb)と ②サンプルデータファイル が含まれています。

①のJupyter Notebookファイルは、各章ごとに2種類存在し、 1つは問題であるノックのみのファイル、 もう1つはノックに加えて解答であるサンプルコードも記載されているファイルとなります。 *解答を含むファイルはファイル名に _answer が付いています。

②のサンプルデータは、1~4章まではそのまま利用できる形になっていますが、 5章以降は、使用データから適宜配置し利用してください。

【Google Colaboratoryの利用】 Google Colaboratoryを利用する場合は、 本章フォルダをGoogleDriveにアップロードして使用します。 その際に、マイドライブ直下に「MLSys_100Knocks」等の作業フォルダを作成することをお勧めします。 アップロードが完了したら、各章のJupyter Notebookファイルを右クリックし、 「アプリで開く」から「Google Colaboratory」を選択してください。 ファイルが開いたら、上部のコメントアウトされている部分を有効にし、実行してください。 なお、ライブラリのバージョンは、Google Colaboratoryに準拠する形を取っています。

※重要 Google Colaboratoryでの動作も確認はしていますが、 本書に掲載した結果等は、WindowsPCのJupyter Notebookで実行したものとなります。 他の動作環境(MacやGoogle Colaboratory)を用いると、結果が異なる可能性があるのでご留意ください。

現在では、6章のデータ読み込みの際に、 globでのファイル取得の順番が異なることから、 機械学習の結果が若干、本書と変わってくることが確認されています。 もし気になる方は、ノック51に「tbl_order_paths = sorted(tbl_order_paths)」を追加してください。

【Docker環境について】 Docker環境を利用する場合は、 お使いのパソコンに「Docker」と「Docker-Compose」が必要となります。

※重要 すでにDocker(及びDocker-Compose)を利用している方を対象としておりますので、 Dockerの環境構築についてのお問い合わせはご容赦願います。 (上記内容が不明な場合や、うまく構築出来ない場合は、 上記Jupyter NotebookかGoogle Colaboratoryをご利用下さい)

1.ダウンロードしたサンプルソースを任意のフォルダに展開して下さい。 2.Terminal / Windows Powershell等を起動し、カレントディレクトリを docker-compose.yamlがあるフォルダに変更して下さい。 3.「docker-compose build」を行い、ビルドを実行してください。 注意: 初回ビルドはある程度時間が掛かります。 エラーで失敗する可能性がありますが、--no-cache等を試して下さい。 4.ビルドが完了したら「docker-compose up -d」を行い、コンテナを起動してください。 注意: 他のプログラムやコンテナでポート3333を利用している場合は、 .envファイルの「JUPYTER_NB_PORT=3333」を任意のポート番号に変更して起動しなおして下さい。 5.「./jupyter_notebook/codes」フォルダの中に、【本章】のソース・データ一式をコピーして配置して下さい。 codes |- 1章 |- ・・・ |- 10章 6.ブラウザにて「localhost:3333」にアクセスして、Notebook画面が表示されれば準備は完了です。

本書のコードよりもエレガントなコードを常に模索していきましょう!

100本ノック、是非、楽しんでください!

About


Languages

Language:Jupyter Notebook 100.0%Language:Dockerfile 0.0%