hjpwhu / nlp4han

中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

nlp4han

中文自然语言处理工具集。更多信息参见Wiki

功能特性

  • 断句
    • 基于规则的中文断句器
  • 分词
    • 基于字的最大熵中文分词器
    • 组合中文分词和词性标注器
  • 词性标注
    • 基准中文词性标注器
    • 单步基于词的最大熵中文词性标注器
    • 单步基于字的最大熵中文词性标注器
    • 组合中文分词和词性标注器
    • 基于HMM的中文词性标注器
  • N元语言模型
  • HMM模型
  • 命名实体识别
    • 基于字的命名实体识别
    • 基于分词的命名实体识别
    • 基于分词和词性标注的命名实体识别
  • 组块/浅层句法分析
    • 基于词的最大熵中文基本组块标注
    • 基于词和词性的最大熵中文基本组块标注
    • 组合中文词性标注和基本组块标注
    • 基于SVM的中文组块标注
  • 依存句法分析
    • 基于最大生成树MST和最大熵的依存句法分析
    • 基于转换的依存句法分析
  • 短语结构(成分)句法分析
    • 基于最大熵的短语结构(成分)句法分析
    • 基于CKY的PCFG短语结构(成分)句法分析
    • 中心词驱动的短语结构句法分析
    • 基于隐藏标记的非词汇化短语结构句法分析
  • 语义角色标注
    • 基于最大熵的语义角色标注
  • 指代消解
    • 基于Hobbs算法的指代消解
  • 情感分析
    • 基于朴素贝叶斯的文档情感分析
    • 基于规则和短语结构树的句子情感分析
  • GUI工具
    • 基于nlp4han功能实现的短语结构树编辑工具

更新日志

  • 2018.12.16, 基于Hobbs算法的指代消解
  • 2018.12, 基于隐藏标记的非词汇化短语结构句法分析
  • 2018.11, 集成短语结构树编辑工具到nlp4han-tools,并使用nlp4han的中文分词、词性标注和句法分析功能。
  • 2018.10, 基于SVM的中文组块标注
  • 2018.9, 中心词驱动的短语结构句法分析
  • 2018.7, 基于CKY的PCFG短语结构(成分)句法分析
  • 2018.6, 基于转换的依存句法分析
  • 2018.5, 基于朴素贝叶斯的文档情感分析, 基于规则和短语结构树的句子情感分析
  • 2018.3, 基于最大熵的语义角色标注
  • 2018.2, 基于最大熵的短语结构(成分)句法分析, HMM模型
  • 2018.1, 基于最大生成树MST和最大熵的依存句法分析
  • 2017.12, 组合中文词性标注和基本组块标注, N元语言模型
  • 2017.11, 基于词和词性的最大熵中文基本组块标注, 基于词的最大熵中文基本组块标注
  • 2017.10, 基于分词和词性标注的命名实体识别
  • 2017.9, 基于分词的命名实体识别, 基于字的命名实体识别
  • 2017.8, 基于HMM的中文词性标注器
  • 2017.7, 组合中文分词和词性标注器
  • 2017.6, 单步基于字的最大熵中文词性标注器
  • 2017.5, 单步基于词的最大熵中文词性标注器
  • 2017.4, 基准中文词性标注器
  • 2017.3, 组合中文分词和词性标注器
  • 2017.2, 基于字的最大熵中文分词器
  • 2016.12, 基于规则的中文断句器

About

中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】


Languages

Language:Java 98.3%Language:M4 1.7%