ndl-lab's repositories
ndlocr_cli
NDLOCRアプリケーションのリポジトリ(ソースコードを含む)
pdmocrdataset-part1
デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
ndlkotenocr_cli
NDL古典籍OCRのアプリケーション(ソースコードを含む)
layout-dataset
NDL-DocLデータセット(資料画像レイアウトデータセット)
huriganacorpus-ndlbib
全国書誌データから作成した振り仮名のデータセット
tugidigi-web
次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)
hurigana-speech-corpus-aozora
青空文庫振り仮名注釈付き音声コーパスのデータセット
ndlngramdata
デジタル化資料から作成したOCRテキストデータのngram頻度統計情報のデータセット
huriganacorpus-aozora
青空文庫及びサピエの点字データから作成した振り仮名コーパスのデータセット
ndl-minhon-ocrdataset
NDL古典籍OCR学習用データセット(みんなで翻刻加工データ)
text_recognition
NDLOCR用テキスト認識モジュール
pdmocrdataset-part2
OCR処理プログラム研究開発事業において作成されたOCR学習用データセット
ocr-ndloneline
パブリックドメインなデジタル化資料から切り出して作成した、1行毎のOCR学習用データセット
deep-text-recognition-benchmark
NDLOCR用テキスト認識モジュールが利用するライブラリ
mmdetection
NDLOCR用レイアウト認識モジュールが利用するライブラリ
ndl_layout
NDLOCR用レイアウト認識モジュール
ndlngramviewer_v2
2023年1月にリニューアルしたNDL Ngram Viewerのソースコード等一式
crd-api-sample
Javaからレファレンス協同データベースのレファレンスAPIを呼び出すためのラッパーと、サンプルコード
NDLMobileReader
国立国会図書館デジタルコレクションのためのモバイルリーダー
ruby_prediction
NDLOCR(version2)用漢字読み推定モジュール
separate_pages_ssd
NDLOCR用ページ分割モジュール
text_recognition_lightning
NDLOCR(version2)用テキスト認識モジュール
separate_pages_mmdet
NDLOCR(version2)用見開きノド元分割するモジュール
ndlngramviewer_v1
2022年5月から12月まで公開中のNDL Ngram Viewerのソースコード等一式
ndltableset
NDLTableNetデータセットの公開リポジトリ
reading_order
NDLOCR(version2)用読み順推定モジュール
tagestimatemodel
資料画像に付与するタグを推定する機械学習モデル