为什么这个自定义词识别不出来?
yaoliweb opened this issue · comments
DicLibrary.insert(DicLibrary.DEFAULT, "南通市崇川区南川园路");
Result result = ToAnalysis.parse("南通市崇川区南川园路南川园新村xx幢yy单元mm室");
List<Term> terms = result.getTerms();
for (Term term : terms) {
System.out.print(term.getName() + "\t");
}
结果显示为:南通市 崇 川 区 南川 园 路南 川 园 新村 xx 幢 yy 单元 mm 室
而如果设置为
DicLibrary.insert(DicLibrary.DEFAULT, "南通市崇川区南川园");
Result result = ToAnalysis.parse("南通市崇川区南川园路南川园新村xx幢yy单元mm室");
List terms = result.getTerms();
for (Term term : terms) {
System.out.print(term.getName() + "\t");
}
结果显示:南通市崇川区南川园 路南 川 园 新村 xx 幢 yy 单元 mm 室
少了一个“路”字就能识别出来,否则识别不出来,请问是哪里没有设置对么?或者是Bug?
试试dicanalysis
在2019年12月01日 12:25,yaoliweb 写道:
DicLibrary.insert(DicLibrary.DEFAULT, "南通市崇川区南川园路");
Result result = ToAnalysis.parse("南通市崇川区南川园路南川园新村xx幢yy单元mm室");
List<Term> terms = result.getTerms();
for (Term term : terms) {
System.out.print(term.getName() + "\t");
}
结果显示为:南通市 崇 川 区 南川 园 路南 川 园 新村 xx 幢 yy 单元 mm 室
而如果设置为
DicLibrary.insert(DicLibrary.DEFAULT, "南通市崇川区南川园");
Result result = ToAnalysis.parse("南通市崇川区南川园路南川园新村xx幢yy单元mm室");
List terms = result.getTerms();
for (Term term : terms) {
System.out.print(term.getName() + "\t");
}
结果显示:南通市崇川区南川园 路南 川 园 新村 xx 幢 yy 单元 mm 室
少了一个“路”字就能识别出来,否则识别不出来,请问是哪里没有设置对么?或者是Bug?
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub, or unsubscribe.