ndl-lab's repositories
tensorflow-deeplab-v3-plus
図表自動抽出のプログラム(A program that automatically extracts diagrams)
hiragana_mojigazo
文字画像データセット(平仮名73文字版)
dataprocessingforpdf
PDFからテキストデータを抽出して機械学習等に適用するためのツール群
ndc_predictor
NDCPredictorの機械学習モデル(書誌情報から日本十進分類を推測するfastTextの学習済みモデル)
imageretrieval
画像検索インデックス作成プログラム(image search indexing program)
imagetagdataset
著作権保護期間満了資料から切り出した図版や挿絵にタグを付与したデータセット
kanji_mojigazo
文字画像データセット(漢字300文字版)
jps-search-api-sample
ジャパンサーチの検索 API を利用した検索画面のサンプルコード
ndldigicore-sample
国立国会図書館デジタルコレクションの書誌データを利用した形態素解析のサンプルコード
ndlsearch-oaipmh-sample
NDLサーチのOAI-PMHを利用したメタデータの全件取得とデータ可視化のサンプルコード
Language:Jupyter NotebookCC-BY-4.0000
tugidigi-txtdata
国立国会図書館デジタルコレクションからインターネット公開している著作権保護期間満了図書資料のうち、NDC6類(産業分野)に該当するテキストデータ
000