NLPchina / ansj_seg

ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

示例代码输出的结果不一致

nickeyfff opened this issue · comments

commented

相同的一句话,用示例代码输出与预期不一致. 看 “尽我所能” 这几个字.

预期
欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽我所能/l,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更快/d,,,更/d,准/a,,,更/d,自由/a,!

结果
欢迎/v,使用/v,ansj/en,_,seg/en,,,(,ansj/en,中文/nz,分词/n,),在/p,这里/r,如果/c,你/r,遇到/v,什么/r,问题/n,都/d,可以/v,联系/v,我/r,./m,我/r,一定/d,尽/v,我/r,所/u,能/v,./m,帮助/v,大家/r,./m,ansj/en,_,seg/en,更/d,快/a,,,更/d,准/a,,,更/d,自由/a,!

commented

字典里标注词性:
明光市 ns 3

例:安徽省明光市桥头镇宝龙村
预期:
安徽省/ns 明光市/ns 桥头镇/ns 宝龙/nr 村/n
结果:
安徽省/ns 明光市/nr 桥头镇/ns 宝龙/nr 村/n

词性不正确