koron / gomigemo

Go/Migemo implementation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

連文節の検索は可能か?

kai2nenobu opened this issue · comments

cmigemoには大文字で分節を区切ることで、文節ごとに正規表現を生成することができたと思います。
gomigemo(gmigemoコマンド)にはこの機能がなさそうなのですが、連文節での検索は可能ですか?

> cmigemo -d "<dict_path>"
QUERY: renbunsetuNoKensaku
PATTERN: (レンブンセツ|レンブンセツ|連文節|れんぶんせつ|renbunsetu|renbunsetu)([ノ修惟允亘攵順信後罵吭咽喉麕咒燧烽詛呪鈍鑿蚤々宣曰湾覘臨希稀望覗殘遺残鋸芒禾騰幟登上檐簷軒逸遁暢孔伯就朔雅悳弼昇展法教糊典規矩
則憲範宜紀徳哲惱王瑙衲曩碯獰皇腦悩嚢膿脳能納農除逃延熨廼退埜野飲載乘迯飮之乃伸嚥述乗呑-濃陳の¬~≠ノ]|帳面|敦子|誠也|悦旦|仰け反|長閑|盧泰愚|狼[烟煙]|惚気|逆上|暖[簾気]|祝[女詞]|礼江|記代|功晶|海苔|祈子|倫[宗
明子]|訓子|賀子|式部省|敬之|賭弓|直[方衣]|凌霄花|窒素酸化物|節点|夜想曲|ヌ(メア|ガー|アクショット|ー(ン|ドル|メア|ボー|ヴ(ォー|ェル)|ベル))|not or|諾威|正常|番号|N[oO]|ナ(ウ|ッシング|ン(センス|バー))|No)(ケンサク
|ケンサク|研削|建策|羂索|献策|検索|憲[冊作]|けんさく|Kensaku|Kensaku)

> gmigemo
QUERY: renbunsetuNoKensaku
PATTERN: (?:renbunsetuNoKensaku|れんぶんせつNおKえんさく|レンブンセツNオKエンサク|レンブンセツNオKエンサク)

#13 にて実験中。

Pattern() はできているが Match() はできていない。
というよりも Match() については全く目途が立っていない。