pyltp是语言技术平台(Language Technology Platform, LTP)的Python封装。 关于LTP更多的信息,欢迎访问LTP项目主页。
- 刘一佳 << yjliu@ir.hit.edu.cn >> 2014-06-12 重组项目
- HuangFJ << biohfj@gmail.com >> 本项目最初作者
pyltp是语言技术平台(Language Technology Platform, LTP)接口的一个Python封装。 本项目旨在使Python用户可以本地调用LTP。 该项目还处于测试状态,欢迎反馈bug。
在使用pyltp之前,您需要简要了解
- 什么是语言技术平台,它能否帮助您解决问题
- 如何安装语言技术平台
- 语言技术平台提供哪些编程接口
如果您对这些问题不了解,请首先阅读我们提供的有关语言技术平台的文档。 在本文档的后续中,我们假定您已经阅读并成功编译并使用语言技术平台。
pyltp依赖于CMake,请首先安装CMake。不同平台的安装方法请参考安装CMake
在unix环境下编译时,请确保对应的python是dev版。您可以使用
- Ubuntu/Debian
$ [sudo] apt-get install python-dev
- Fedora
$ [sudo] yum install python-devel
安装dev版的python。
在编译pyltp之前,请首先编译LTP。具体编译方法请参考如何安装ltp。
如果您使用github的开发版的pyltp,您可可以采用
$ git submodule init
$ git submodule update
$ cd ltp
$ ./configure
$ make
$ cd ..
编译LTP。
编译LTP以后,请使用如下命令编译pyltp
$ cmake -DLTP_HOME=/path/to/your/ltp/project .
$ make
其中,请将/path/to/your/ltp/project
替换为您的LTP项目地址。
如果您是使用开发版的pyltp,可以将/path/to/your/ltp/project
替换为 `pwd`/ltp
。
pyltp主要采用python2.7开发。但经测试,其python3下也可以使用。
需要注意一点,请保证python-config
与python
命令指向相同的版本。
具体的检查方法可以用python-config --includes
和python --version
命令。
- python2.7环境下
$ python --version
Python 2.7.5+
$ python-config --includes
-I/usr/include/python2.7 ..
- python3环境下
$ python --version
Python 3.3.2+
$ python-config --includes
-I/usr/include/python3.3m ..
请确保编译环境与运行环境使用相同python版本。
尚处于测试阶段
# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor()
segmentor.load("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print "|".join(words)
待完善