Open Chinese Convert 開放中文轉換
Introduction 介紹
Open Chinese Convert (OpenCC, 開放中文轉換) is an opensource project for conversion between Traditional Chinese and Simplified Chinese, supporting character-level conversion, phrase-level conversion, variant conversion and regional idioms among Mainland China, Taiwan and Hong kong.
中文簡繁轉換開源項目,支持詞彙級別的轉換、異體字轉換和地區習慣用詞轉換(中國大陸、臺灣、香港)。
Features 特點
- 嚴格區分「一簡對多繁」和「一簡對多異」。
- 完全兼容異體字,可以實現動態替換。
- 嚴格審校一簡對多繁詞條,原則爲「能分則不合」。
- 支持中國大陸、臺灣、香港異體字和地區習慣用詞轉換,如「裏」「裡」、「鼠標」「滑鼠」。
- 詞庫和函數庫完全分離,可以自由修改、導入、擴展。
- 支持C、C++、Python、PHP、Java、Ruby、Node.js。
- 兼容Windows、Linux、Mac平臺。
Links 相關鏈接
- Introduction 詳細介紹 https://github.com/BYVoid/OpenCC/wiki/%E7%B7%A3%E7%94%B1
- OpenCC Online (在線轉換) http://opencc.byvoid.com/
- 現代漢語常用簡繁一對多字義辨析表 http://ytenx.org/byohlyuk/KienxPyan
Installation 安裝
Download 下載
https://bintray.com/byvoid/opencc/OpenCC
Usage 使用
Command Line 命令行
opencc --help
Configurations 配置文件
預設配置文件
s2t.json
Simplified Chinese to Traditional Chinese 簡體到繁體t2s.json
Traditional Chinese to Simplified Chinese 繁體到簡體s2tw.json
Simplified Chinese to Traditional Chinese (Taiwan Standard) 簡體到臺灣正體tw2s.json
Traditional Chinese (Taiwan Standard) to Simplified Chinese 臺灣正體到簡體s2hk.json
Simplified Chinese to Traditional Chinese (Hong Kong Standard) 簡體到香港繁體(香港小學學習字詞表標準)hk2s.json
Traditional Chinese (Hong Kong Standard) to Simplified Chinese 香港繁體(香港小學學習字詞表標準)到簡體s2twp.json
Simplified Chinese to Traditional Chinese (Taiwan Standard) with Taiwanese idiom 簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json
Traditional Chinese (Taiwan Standard) to Simplified Chinese with Mainland Chinese idiom 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙
Development Documentation 開發文檔
Build 編譯
Build with CMake
Linux/OSX (gcc 4.6 or clang 3.2 is required):
make
sudo make install
Windows MSYS:
cmake .. -G "MSYS Makefiles" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make
Windows Visual Studio (2013 or higher required):
cmake .. -G "Visual Studio 12" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make
Java Wrapper (實驗階段)
Java API 現在處於實驗階段,穩定性和速度均有待測試。使用前請三思。 Java API 使用JNA,利用opencc的c api來進行包裝。
####編譯及安裝 (需要sbt 0.13.+ and JRE 7+)
cd ./java
sbt package
在maven項目使用,請輸入
sbt publishM2
在sbt項目中使用,則輸入
sbt publishLocal
####項目文件配置
sbt 項目
在你的build.sbt中加入
libraryDependencies ++= "opencc-java" % "opencc-java" % "0.0.1"
#####maven項目 在你的POMS裡加入
<dependency>
<groupId>opencc-java</groupId>
<artifactId>opencc-java</artifactId>
<version>0.0.1</version>
</dependency>
####不使用任何Build System
將編譯好旳jar及jna-4.1.0加入到你的ClassPath即可,編譯好的jar在./java/out內。
####使用簡例 使用前請先確定已經安裝好opencc的庫文件。
#####Scala
import opencc.OpenCCConverter
object Main {
def main(args: Array[String]) {
val converter = new OpenCCConverter("s2t.json")
val out = converter.convert("正簡轉換在scala。")
println(out)
}
}
####Java
import opencc.OpenCCConverter
public class OpenCCTester {
public static void main(String[] args) {
OpenCCConverter c = new OpenCCConverter("s2t.json");
System.out.println(c.convert("正簡轉換在Java。"));
c.close();
}
}
Projects using Opencc 使用OpenCC的項目
License 許可協議
Apache License 2.0
Third Party Library 第三方庫
- darts-clone BSD License
- tclap MIT License
- rapidjson MIT License
- jna LGPL License
All these libraries except jna are statically linked.