kurgm / gwtegaki

Hand-writing search for GlyphWiki

Home Page:https://kurgm.github.io/gwtegaki/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

グリフウィキ手書き検索

グリフウィキに登録された数十万のグリフを手書きで検索することができます。

検索画面:https://kurgm.github.io/gwtegaki/

gwtegaki

何のため?

(ここでは「字形」は筆画で構成される図形を指し,「グリフ」は 1 字形とその字形にグリフウィキ上で付けられた一意な名前(英数字列)の対を指します。つまり,「…の字形を持つグリフを見つける」とは,グリフの名前(英数字列)を見つけることを意味します。)

グリフウィキには大量のグリフが登録されており,この中からグリフを検索する手段がいくつか用意されています。しかしある特定の字形を持つグリフを探し出したいとき,探している字形によっては見つけ出すことが困難なことがしばしばあります。(詳しくはグリフウィキ部品検索#何のため?を参照してください。)

とくに,部分字形が一般的でない字形や,それ以上分解できないような字形を持つグリフを探したい場合は部品検索が役に立たないことがあります。

この「グリフウィキ手書き検索」は,字形からグリフを検索する一つの手段を提供し,他の検索方法では見つけられない・見つけにくいグリフを探すためのいわば補完的な役割を担います。

技術的な検討

「グリフウィキ手書き検索」を,手書きの字形を入力とし,それに対応するグリフ名を出力するというタスクとみなすことができる。

一般的な「文字認識」や「手書き入力」のタスクと大きく異なる性質がある:

一般的な文字認識 グリフウィキ手書き検索
出力 ある決まった文字集合(例えば JIS 漢字)に属する文字 内容が随時追加・更新されるグリフ集合に属するグリフの名前
字形の包摂 似た字形は同じ文字に包摂されている
= 出力で区別される文字は入力字形が(ある程度)異なっている
よく似た字形に異なるグリフ名が対応しうる(地域コードの有無など)
= 出力で区別されるグリフ名がよく似た入力字形を持ちうる
訓練データ 1 つの文字に対して多数の手書きデータが準備される 1 つのグリフ名に対して 1 つの字形しか準備されない

ライセンス

MIT License (See LICENSE)

About

Hand-writing search for GlyphWiki

https://kurgm.github.io/gwtegaki/

License:MIT License


Languages

Language:Rust 35.3%Language:JavaScript 33.1%Language:TypeScript 19.4%Language:Astro 8.6%Language:CSS 1.3%Language:Makefile 1.3%Language:Dockerfile 1.1%