sunxuening / mynlp

面向Project的中文NLP工具包

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

MYNLP 中文NLP工具包

License Maven Central Latest release

mynlp包含:中文分词、词性标注、文本分类(情感分析)、拼音转换、简繁体转换、文本摘要等常见NLP功能。 依托灵活的架构设计、柔性API、高效数据结构,mynlp能在复杂环境中,满足业务需求。算法研究者也可以在mynlp基础上快速开发各种新分算法。

环境需求:

  • JRE 1.8+
  • Gradle or Maven

项目中引入mynlp

Mynlp的Maven gourp ID是 com.mayabot.mynlp ,不同的功能被分拆在各个artifact里面。

  • mynlp-segment 分词
  • mynlp-classification 文本分类
  • mynlp-pinyin 拼音转换
  • mynlp-summary 文本摘要
  • mynlp-transform 繁简体转换
  • mynlp-core 基本数据结构(被其他模块依赖)

(Fasttext的Java版本实现迁移到独立的项目 fastText4j

如需要分词功能就在Mavne中增加如下配置:

<dependency>
  <groupId>com.mayabot.mynlp</groupId>
  <artifactId>mynlp-segment</artifactId>
  <version>2.0.0-BETA10</version>
</dependency>

Gradle:

dependencies {
  compile 'com.mayabot.mynlp:mynlp-segment:2.0.0-BETA10'
}

文档目录

如果你对mynlp有任何疑问或建议请加入微信群一起来进行讨论,以帮助Mynlp改进。

声明和致谢

mynlp开发之初是对Hanlp和ansj的重构整理,通过多次迭代和项目需求驱动实践,逐渐发展为目前的架构体系。 向HanLP和ansj在中文NLP开源中做出的贡献致敬!

mynlp项目引用或参考了以下项目代码和资源:

About

面向Project的中文NLP工具包

License:Apache License 2.0


Languages

Language:Java 86.2%Language:Kotlin 13.8%