重复分词

Question

重复分词

frlzk opened this issue 2 years ago · comments

ts5432 commented 2 years ago

"健康生活，陪伴有我" 分词成了 "'健康':2 '健康生活':1 '有':5 '生活':3 '陪伴':4"
其中 "'健康" 被重复分词，造成使用ts_headline时文本重复 "健康生活健康生活，陪伴有我"

糖粉椰蓉糯米糍 · Answer 1 · Fri Nov 25 2022 15:18:59 GMT+0800 (China Standard Time)

"健康生活，陪伴有我"分词了 "'健康':2 '健康生活':1 '有':5 '生活':3 '陪伴':4" 其中 "'健康" 被重新分词，构建使用ts_headline时代文本复现“健康生活健康生活，陪伴有我”

我也遇到类似的问题但是找不到什么解决的办法请问您有什么方案或者想法么

Jov · Answer 2 · Fri Nov 25 2022 15:42:57 GMT+0800 (China Standard Time)

http://www.xunsearch.com/scws/demo/v48.php 打开了最短词？

糖粉椰蓉糯米糍 · Answer 3 · Fri Nov 25 2022 15:48:00 GMT+0800 (China Standard Time)

http://www.xunsearch.com/scws/demo/v48.php 打开了最短词？
是的例如 "宣传手册" 如果我不开最短词我搜索宣传或者手册是搜索不到的只能打开最短词但是这样造成的问题就是如果我搜索 ”宣传手册“ ts_headline的标记结果为 宣传手册 宣传手册很苦恼我应该怎么取解决这个问题

zhangLianZhuang · Answer 4 · Sat Jun 10 2023 14:44:03 GMT+0800 (China Standard Time)

zhparser 底层调用的scws库，通过对scws库的调查，目前没有什么好方法。