jdb110 / HMM

隐马尔科夫模型进行中文分词 python

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

#隐马尔科夫模型进行中文分词 author : darrenan created at : 2014-03-17

#模型训练 python HMM_train.py RenMinData.txt_utf8

  • RenMinData.RenMinData_utf8 为人民日报已经人工分词的预料。

生成三个文件

  • prob_start.py 为模型的初始概率
  • prob_trans.py 为模型状态转移概率
  • prob_emit.py 为发射概率

#测试模型效果 python HMM.py

#reference

About

隐马尔科夫模型进行中文分词 python


Languages

Language:Python 100.0%