説明
このRepositoryは下の書籍で使用する物です。
- 技術同人誌版「PythonとScrapyを使ったWebスクレイピング実践編~あのサイトをスクレイピングするまで!~」
- 商業誌版「PythonとScrapyを使ったWebスクレイピング」
技術同人誌版は第2章~第6章、商業誌版は第2章~第9章で使用します。
書籍リンク
技術同人誌版
- BOOTH https://bright-system.booth.pm/items/3056624
- 技術書典 https://techbookfest.org/product/6080956333031424?productVariantID=5063798069133312
商業誌版
- Amazon印刷版 https://www.amazon.co.jp/dp/484437981X/
- Amazon電子書籍版 https://www.amazon.co.jp/dp/B09GVNZX54/
- 楽天 https://books.rakuten.co.jp/rk/03dbcfb9748f350b8f7f9ed56ebeb739/
- 紀伊國屋書店 https://www.kinokuniya.co.jp/f/dsg-08-EK-1059652
- Google https://play.google.com/store/books/details/?id=DTBEEAAAQBAJ
- Reader Store https://ebookstore.sony.jp/item/LT000153910001339409/
- BOOK TECH https://book-tech.com/books/d018e9c0-c9b9-4106-bda0-12dfcfcd5265
ソースコードについて
本書に記載された内容は、情報の提供のみを目的としています。
したがって、Repositoryを用いた開発、製作、運用は、必ずご自身の責任と判断によって行ってください。
これらの情報による開発、製作、運用の結果について、著者はいかなる責任も負いません。
LicenceについてはLicenceファイルを確認してください。
各章のサンプルコードの取得
各章のサンプルコードはcheckoutすると取得できます。
第2章「最初のスクレイピング」
git checkout chapter1
第3章「POSTメソッドがあるサイトでスクレイピング」
git checkout chapter2
第4章「データベースを使用する」
git checkout chapter3
第5章「動的画面のスクレイピング」
git checkout chapter4
第6章「Lazy loading画面のスクレイピング」
git checkout chapter5
第7章「Dropboxと連携する」
git checkout chapter6
第8章「Cloudサービスを使ってスクレイピング」
git checkout chapter7
第9章「cloudサービスで定期的実行をする」
git checkout chapter8
手順
手順は各章のcheckout後にマニュアルを確認してください。
実行後の注意点
実行後に実行キャッシュディレクトリーが作成されるので、他のBrunchをcheckoutしても以前にcheckoutしたchapterのディレクトリーは消えません。
気になるようなら下のコマンドで削除してください。
rm -rf checkoutしたディレクトリー