目录结构 chinese_processing, 中文处理模块,包括以下组成: pinyin~ 中文转拼音,包括全拼和首拼。 scws~ Simple Chinese Words Segmentation 的缩写(简易中文分词系统),开源的中文切词,基于词频词典的机械中文分词引擎。 ictclas~ 中科院开源的中文切词,基于隐马可夫模型。