Furinai/ik-analyzer

IK Analyzer

IK 分词工具库，基于 medcl/elasticsearch-analysis-ik 修改，移除 Elasticsearch 依赖，配置文件和词库文件改为从 resources 目录读取，方便普通 Java 程序调用。

适配 Hutool 封装的 API（TokenizerUtil ）。

<dependency>
  <groupId>io.github.linter-cn</groupId>
    <artifactId>ik-analyzer</artifactId>
  <version>1.0</version>
</dependency>

常见问题

1.如何配置扩展词库？

resources 目录下创建名为 IKAnalyzer.cfg.xml 的配置文件

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 扩展配置</comment>
    <!--用户可以在这里配置自己的扩展字典 -->
    <entry key="ext_dict">/data/ext_dic.txt</entry>
    <!--用户可以在这里配置自己的扩展停止词字典-->
    <entry key="ext_stop_words">/data/ext_stop_words.txt</entry>
    <!--可以配置多个路径，使用英文分号分隔，路径可以是文本文件或文件夹-->
</properties>

配置的扩展词库文件需要放在 resources 目录下

2.扩展词库为什么没有生效？

请确保你的扩展词典的文本格式为 UTF8 编码

About

IK 分词工具库，基于 medcl/elasticsearch-analysis-ik 项目修改，方便普通 Java 程序调用。

Apache License 2.0

Languages

Language:Java 100.0%