NLPchina / ansj_seg

ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

新词发现可以标注非词嘛

wufan1993 opened this issue · comments

新发现的词标注为非词字典库,这样下次训练的时候可以不用出现这些词

commented

不好意思额,不可以标注。没有这个功能。也不知道该怎么做

谢谢哈,我也不太懂算法这一块,只会用,目前暂时只是自己弄了一个标记的池子,然后对训练出来的词做过滤来使用了,没有让他参与二次训练,只是感觉非词标注好后可能可以进一步提升训练效果