cabins / DictTool

词库处理工具

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DictTool 词库处理工具

本项目使用GPLv3开源协议

作者对版权的额外强调

您可以免费并且在不通知作者的情况下,使用和修改本项目,但是要遵守如下规则:
1 您不能在您的软件为闭源软件时包含此项目的任何内容。
2 您不能在收费软件中包含此项目的任何内容。
3 您使用修改后的本项目代码,但必须明确标记原作者及项目的版权信息。
4 您可以免费使用此项目,但您不能删除项目中包含的任何作者或版本信息。

工具使用说明

本工具各个模块均使用打散格式,而本工具也支持QQ格式和多多格式,请先使用本工具转换模块把QQ格式或多多格式转换成打散格式再使用其它模块的功能。

功能模块

注:本工具使用打散格式作为本工具通用格式,除格式转换模块,其它模块的输入词库格式都是打散格式
格式参考
f 地
f 土
fbgf 地球
g 一
g 王
ytyt 谢谢
……

注:打散格式里,候选内容无法使用空格,空格需要用$20代替

格式转换

QQ格式→打散格式(本工具格式)

说明略

QQ格式参考
f 地 土
fbgf 地球
g 一 王
ytyt 谢谢
……

注:QQ格式里,候选内容无法使用空格,空格需要用$20代替

多多格式→打散格式(本工具格式)

说明略

多多格式参考
地<tab>f
土<tab>f
地球<tab>fbgf
一<tab>g
王<tab>g
谢谢<tab>ytyt
……

注:多多格式里,候选内容无法使用Tab,Tab需要用\t代替,而\也需要用\\代替,在多多格式里,工具暂时不支持其它包含\的转义字符

打散格式(本工具格式)→QQ格式

说明略

打散格式(本工具格式)→多多格式

说明略

查询检测工具

字符编码检测

检测输入字符的Unicode和UTF-8编码

按键编码检测

检测按键编码

重码情况检测

对词库进行重码统计

全码的空简码检测

对编码简码为空码的情况进行检测

词库简单处理

排序词条

对词库根据编码进行排序

反转词条顺序

把词库顺序进行反转,比如原来是从a到z,就变成从z到a
a 工
b 了
c 以
--↓--
c 以
b 了
a 工

交换编码与候选

交换编码与候选的位置
a 工
b 了
c 以
--↓--
工 a
了 b
以 c

去重合并词库

将第一个词库合并到第二个词库中,并去除重复词条(第二个词库初始可以留空)
a 工
a 工
b 了
--↓--
a 工
b 了

提取字词或排除字词

根据参考词库做交集或并集

去除候选唯一

为唯一候选增加空候选,来去除指定码长的候选唯一(用于不能取消四码唯一自动上屏的五笔输入法等)

词库高级处理

制作出简不出全词库

a 工
aa 工
aaaa 工
b 了
c 以
--↓--
a 工
b 了
c 以

提取指定长度的词条

根据参数提取符合条件的词条

生成词条编码

根据用户给定的规则生成字/词的编码

编辑词条编码

根据用户给定的规则修改字/词的编码

制作百度手机输入法自定义方案

制作百度手机输入法的def格式导入文件

制作微软五笔词库文件

制作win10微软五笔系统词库及自定义短语词库文件

制作QQ五笔导入文件

根据用户的词库,分离词库成为系统词库txt和自定义短语txt(防止系统词库不能导入非普通中文的候选内容)

About

词库处理工具

License:GNU General Public License v3.0


Languages

Language:JavaScript 52.1%Language:HTML 47.7%Language:CSS 0.2%