ndl-lab's repositories
ndlocr_cli
NDLOCRアプリケーションのリポジトリ(ソースコードを含む)
pdmocrdataset-part1
デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
ndlkotenocr_cli
NDL古典籍OCRのアプリケーション(ソースコードを含む)
layout-dataset
NDL-DocLデータセット(資料画像レイアウトデータセット)
huriganacorpus-ndlbib
全国書誌データから作成した振り仮名のデータセット
tugidigi-web
次世代デジタルライブラリーソースコード(Programs of the Next Digital Library.)
ndlngramdata
デジタル化資料から作成したOCRテキストデータのngram頻度統計情報のデータセット
huriganacorpus-aozora
青空文庫及びサピエの点字データから作成した振り仮名コーパスのデータセット
ndl-minhon-ocrdataset
NDL古典籍OCR学習用データセット(みんなで翻刻加工データ)
text_recognition
NDLOCR用テキスト認識モジュール
ocr-ndloneline
パブリックドメインなデジタル化資料から切り出して作成した、1行毎のOCR学習用データセット
pdmocrdataset-part2
OCR処理プログラム研究開発事業において作成されたOCR学習用データセット
deep-text-recognition-benchmark
NDLOCR用テキスト認識モジュールが利用するライブラリ
mmdetection
NDLOCR用レイアウト認識モジュールが利用するライブラリ
ndl_layout
NDLOCR用レイアウト認識モジュール
ndlngramviewer_v2
2023年1月にリニューアルしたNDL Ngram Viewerのソースコード等一式
crd-api-sample
Javaからレファレンス協同データベースのレファレンスAPIを呼び出すためのラッパーと、サンプルコード
jps-search-api-sample
ジャパンサーチの検索 API を利用した検索画面のサンプルコード
ndldigicore-sample
国立国会図書館デジタルコレクションの書誌データを利用した形態素解析のサンプルコード
NDLMobileReader
国立国会図書館デジタルコレクションのためのモバイルリーダー
separate_pages_ssd
NDLOCR用ページ分割モジュール
text_recognition_lightning
NDLOCR(version2)用テキスト認識モジュール
separate_pages_mmdet
NDLOCR(version2)用見開きノド元分割するモジュール
ndlngramviewer_v1
2022年5月から12月まで公開中のNDL Ngram Viewerのソースコード等一式
ndlsearch-oaipmh-sample
NDLサーチのOAI-PMHを利用したメタデータの全件取得とデータ可視化のサンプルコード
reading_order
NDLOCR(version2)用読み順推定モジュール
ruby_prediction
NDLOCR(version2)用漢字読み推定モジュール
tagestimatemodel
資料画像に付与するタグを推定する機械学習モデル