johnsonzhu / gojieba

"结巴"中文分词的Golang版本

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

GoJieba English

Build Status Author Performance License GoDoc Coverage Status

GoJieba是"结巴"中文分词的Golang语言版本。

简介

  • 支持多种分词方式,包括最大概率模式,HMM新词发现模式,搜索引擎模式,全模式等。
  • 核心算法底层由C++实现,性能高效。

用法

go get github.com/yanyiwu/gojieba

示例代码请见 example/demo.go

cd example
go run demo.go

之所以需要先 cd 到 example 目录下,是因为 demo.go 里面有写死的字典相对路径。

输出结果:

DemoJieba
全模式: 我/来到/北京/清华/清华大学/华大/大学
精确模式: 我/来到/北京/清华大学
新词识别: 他/来到/了/网易/杭研/大厦
搜索引擎模式: 小明/硕士/毕业/于/**/**科学院/科学/科学院/学院/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造
DemoExtract
我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上CEO,走上人生巅峰。
关键词抽取: CEO/升职/加薪/手扶拖拉机/巅峰

性能测试

Jieba中文分词系列性能评测

客服

  • Email: i@yanyiwu.com
  • QQ: 64162451
  • WeChat: image

About

"结巴"中文分词的Golang版本


Languages

Language:Go 61.6%Language:C++ 26.1%Language:C 12.3%