keefecn / chinese_processing

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

目录结构

chinese_processing, 中文处理模块,包括以下组成:

  • pinyin~ 中文转拼音,包括全拼和首拼。
  • scws~ Simple Chinese Words Segmentation 的缩写(简易中文分词系统),开源的中文切词,基于词频词典的机械中文分词引擎。
  • ictclas~ 中科院开源的中文切词,基于隐马可夫模型。

About


Languages

Language:C++ 64.9%Language:C 34.2%Language:CMake 0.7%Language:Shell 0.1%Language:Makefile 0.1%