jellchou / pyltp

pyltp: the python extension for LTP

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

pyltpbeta: the python extension for LTP

Build Status

pyltp是语言技术平台(Language Technology Platform, LTP)的Python封装。 关于LTP更多的信息,欢迎访问LTP项目主页。

作者

简介与背景知识

pyltp是语言技术平台(Language Technology Platform, LTP)接口的一个Python封装。 本项目旨在使Python用户可以本地调用LTP。 该项目还处于测试状态,欢迎反馈bug。

在使用pyltp之前,您需要简要了解

如果您对这些问题不了解,请首先阅读我们提供的有关语言技术平台的文档。 在本文档的后续中,我们假定您已经阅读并成功编译并使用语言技术平台。

安装

安装CMake

pyltp依赖于CMake,请首先安装CMake。不同平台的安装方法请参考安装CMake

Unix编译

Python开发版

在unix环境下编译时,请确保对应的python是dev版。您可以使用

  • Ubuntu/Debian
$ [sudo] apt-get install python-dev
  • Fedora
$ [sudo] yum install python-devel

安装dev版的python。

安装LTP

在编译pyltp之前,请首先编译LTP。具体编译方法请参考如何安装ltp

如果您使用github的开发版的pyltp,您可可以采用

$ git submodule init
$ git submodule update
$ cd ltp
$ ./configure
$ make
$ cd ..

编译LTP。

编译pyltp

编译LTP以后,请使用如下命令编译pyltp

$ cmake -DLTP_HOME=/path/to/your/ltp/project .
$ make

其中,请将/path/to/your/ltp/project替换为您的LTP项目地址。 如果您是使用开发版的pyltp,可以将/path/to/your/ltp/project替换为 `pwd`/ltp

Python3

pyltp主要采用python2.7开发。但经测试,其python3下也可以使用。 需要注意一点,请保证python-configpython命令指向相同的版本。

具体的检查方法可以用python-config --includespython --version命令。

  • python2.7环境下
$ python --version
Python 2.7.5+
$ python-config --includes
-I/usr/include/python2.7 ..
  • python3环境下
$ python --version
Python 3.3.2+
$ python-config --includes
-I/usr/include/python3.3m ..

请确保编译环境与运行环境使用相同python版本。

MSVC编译

尚处于测试阶段

例子

# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor()
segmentor.load("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print "|".join(words)

文档

待完善

About

pyltp: the python extension for LTP