yandod / jp-it-internship

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

jp-it-internship

日本のIT企業のサイトからインターンシップに関する記述があると思われるページを検索するプログラムです。

本モジュールはGoogle Custom Search APIを使っており、1000回のクエリ辺り$5の料金が発生します。一回の実行で3000回程度のクエリが実行されますのでご注意ください。

Python3のDocker公式イメージ上で動作します。

設定

docker-compose.yml内にAPIに利用するトークンとSearch Engine IDを設定します。 設定に必要なAPI KEYとIDはGCPのコンソールから作成してください。

    environment:
      - PYTHONIOENCODING=utf-8
      - LANG=C.UTF-8
      - PYTHONUSERBASE=/pip_modules
      - GOOGLE_API_KEY=<Custom Search APIが有効なAPI KEY>
      - GOOGLE_SEARCH_ENGINE=<Web全体が検索可能なCustom Search EngineのID>

usage

コンテナのセットアップとライブラリのインストール

make install

女性の活躍推進企業データベースからCSVデータをダウンロードし、jsonファイルを構築

make download

CSVから取得した企業名をCustom Search APIで検索し、1件目にヒットした結果をjsonファイルに格納

make url

CSVから取得した企業名と「インターンシップ」で検索した結果のうち上位3件をjsonファイルに格納

make internship

jsonファイルをCSVとして再度、保存

make convert

About


Languages

Language:Python 94.2%Language:Makefile 5.8%