tomoueh / collect_med_inst_cd_py

医療機関コードを各地域の厚生局よりWebスクレイピングして収集する

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

医療機関コード

About

医療機関コード(施設コード)は、各地域の厚生局で管理、公開されている一方、全体の一覧が公開されているところは見つからなかった。(有料で購入できるサービスはある)。各地方厚生局のWebサイトから対象の医療機関一覧ファイルをダウンロードして、CSVでoutputする処理を作成する。

下記の地方厚生局のWebサイトを解析しているため、そのWebページが変更された場合、動作しなくなる可能性があります。
最終確認日:2022-09-03

最終実行のcsvは output/ にあります。ダウンロード

地方厚生局(link)

地方厚生局 管轄地域
北海道 北海道
東北 青森県,岩手県,宮城県,秋田県,山形県,福島県
関東信越 茨城県,栃木県,群馬県,埼玉県,千葉県,東京都,神奈川県,新潟県,山梨県,長野県
東海北陸 富山県,石川県,岐阜県,静岡県,愛知県,三重県
近畿 福井県,滋賀県,京都府,大阪府,兵庫県,奈良県,和歌山県
** 鳥取県,島根県,岡山県,広島県,山口県
四国 香川県,徳島県,愛媛県,高知県
九州 福岡県,佐賀県,長崎県,熊本県,大分県,宮崎県,鹿児島県,沖縄県

コード体系

上記のサイトで公開されている医療機関コード(施設コード)は7桁コード

  • 9桁コード
    都道府県番号(2桁)+7桁コード
    DPCファイルのデータ提出に使われている

  • 10桁コード
    都道府県番号(2桁)+点数表コード(1桁;医科は1)+7桁コード

Output

{医療機関コード(9桁), 医療機関コード(7桁), 医療機関名称, 郵便番号, 住所} のCSVファイル

(eg)

医療機関コード(9) 医療機関コード(7) 医療機関名称 郵便番号 住所
010112489 0112489 医療法人 愛全病院 0050813 札幌市南区川沿13条2丁目1番38号
... ... ... ... ...

最終実行(2022-09-03)のcsvは ここから ダウンロードできます.

CHANGELOG

April 7, 2022

  • xlrdでxlsxが読めなくなったため、openpyxlを導入 xlrd 2.0.0 (11 December 2020): Remove support for anything other than .xls files.

About

医療機関コードを各地域の厚生局よりWebスクレイピングして収集する

License:MIT License


Languages

Language:Python 100.0%