遊びで作っちゃった Web アプリ。
Twitter とかで変わった形の文字を使っている人を見て、形の似た文字を自動的に調べてくれるアプリがあったらおもしろいかと思い、作ってしまった。
変わった形の文字を使っている人の例(私ではない)
https://niterumoji-searcher.herokuapp.com で公開中
- ツールを用いて文字を白黒画像化
- 画像をオートエンコーダに突っ込んで次元削減
- 得られたベクトルを用いて,コサイン類似度で比較
- 単純に全データでやると時間がかかりすぎるので,事前に kmeans を使ってクラスタリングし,同クラスターのみを検索対象とするように工夫