yaoguangluo / Deta_Parser

快速中文分词分析word segmentation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

在病句上进行绕口令错句子分析, 反复优化.

yaoguangluo opened this issue · comments

20190403 0:10 纯中文分词速度每秒1550万字. 自己世界记录又刷新了.

作者注释 :最近在互联网上找各种挑战病句分词的句子例子, 发现很多有极强攻击性和恶意性的动机意思 .可是 作为病句分词本身没有错, 写这些例子的人也不能轻易定义为负面. 以后作为教材版本要选择性的删除这类负面不雅的例子.