huanlin / Chinese-Converter

中文簡繁轉換的命令列工具

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Chinese Converter

此工具是用來轉換繁體中文與簡體中文檔案。基本上,由繁入簡或由簡至繁應該都可以,但目前只測試過繁至簡的轉換。

由於此工具使用了 MS Word 來進行簡繁轉換,故你的 Windows 作業環境必須有安裝 MS Word。 我只在 Word 2013 上測試過。若您發現任何問題,歡迎回報 bugs。

註:此文件的簡體中文版 README.chs.md 就是利用此工具產生的。

使用方法

tscc <InputFile> <OutputFile> <ConversionDirection> [Dictionary File(s)]

參數:

  • InputFile: 輸入檔名。目前僅支援 UTF-8 編碼。
  • OutputFile: 輸出檔名。目前僅支援 UTF-8 編碼。若檔案已存在,將會被覆蓋。
  • ConversionDirection: "t2s" 或 "s2t",分別表示「繁->簡」或「簡->繁」。
  • Dictionary File(s): 字典檔。支援多個字典檔,檔案名稱以空白分隔。註:字典檔係用於前置轉換作業,亦即輸入檔案會先經過此字典檔的轉換,然後才餵給 MS Word 進行簡繁/繁簡轉換。

範例:

tscc README.md README.chs.md t2s cht2chs.dict art_cht2chs.dict

原始碼

完整原始碼:https://github.com/huanlin/Chinese-Converter

其中的 Dictionary 資料夾是用來存放自定義的簡繁術語字典。我打算在這裡維護一份自己使用的字典,每次碰到缺的詞彙就加進去。 如果您也有用這個工具,歡迎協助添加字典檔。關於字典檔的詳細說明,請參考下一節。

字典檔案

字典檔是個純文字檔案,用來定義存放自定義的簡繁轉換詞彙。請注意,字典檔案只是用來補足 MS Word 未提供的術語,而不是完整的術語對照表。

字典檔案是純文字檔案,每一列代表一個詞彙的對應,規則如下:

  • 來源詞彙與目標詞彙之間是以等號('=')分隔。
  • 目標詞彙之後可以用分號或等號再銜接原文詞彙。
  • 若一列文字是以分號(';')開頭,會被視為註解。

參考以下範例:

;這是註解,不會被處理。
相依性注入=依賴注入;dependency injection
物件=對象=object

注意:添加詞彙至字典檔時,如果其他字典檔已經存在該詞彙,則程式在執行轉換時,只會取「第一個」詞彙對照,而忽略其餘重複定義的詞彙。

About

中文簡繁轉換的命令列工具

License:MIT License


Languages

Language:C# 96.7%Language:Batchfile 3.3%