Unification of Japanses terminology
nzw0301 opened this issue · comments
I want to unify terminology for more useful docs.
I found some different written forms
- Numpy Array -> Numpy配列
- . -> .
- , -> ,
- : -> :
- ; -> ;
- ( ) -> ()
- str -> 文字列
- boolean -> 真理値
- int -> 整数
- float -> 浮動小数点数
- optimizer -> 最適化(アルゴリズム)
- Arguments -> 引数
- input shape -> 入力のshape
- output shape -> 出力のshape
- Return -> 戻り値
- Sequential Model -> Sequentialモデル
- Functional API -> Functional API
- Recurrent -> Recurrent
- metrics -> 評価値
- EOS -> です/ます
- See something -> ~~を参照
- whether insert space or not before/after syntax highlight in sentence -> No
- Data augmentation -> データ拡張
- objective -> 目的関数
- loss function -> 損失関数
- training -> 学習
- testing -> テスト
- validation -> 検証
- index -> インデックス
- target -> ターゲット
- layer -> レイヤー
- shape -> shape
- numbers (1 or 一) -> 1
- regularizer -> 正則化
- nD tensor -> n階テンソル
- Fuzz factor -> 微小量
For example, shape
is translated to "形状", "形" and "型" for now.
I think that translation to follow Japanses Python docs is easy for built-in.
thanks.
- It's better to use '.' and ',' , instead of '。' and '、'.
(note that those are double-byte character) - Return is "戻り値"
- Arguments is "引数"
I think.
Indeed. This is the consequence of many people working on the translation at once. Unification of terminology would be great to have!
I think
- "(", ")", ";" and ":" are ascii strings (not double-byte character)
- insert one space after ")", ";" and ":".
- insert one space before "(".
- insert one space before/after syntax highlight in a sentence
How do we decide unification of terminology?
"(", ")", ";" and ":" are ascii strings (not double-byte character)
since we use basically double-byte character, it's better to use ",", "." as double-byte character.
insert one space after ")", ";" and ":".
insert one space before "(".
Addtionaly, if "(" and ")" are double-byte character, we can ignore these.
Addtionaly, if "(" and ")" are double-byte character, we can ignore these.
I'm concerned about being mixed "(", ")" in Python syntax with "(", ")",
but I think that it is easy to use double-byte character for translation.
Sounds good!
You have a point.
It's bother to confirm which to use double-byte characters or not.
Go ahead 👍
I think that we should discuss in Japanese when discussing about Japanese translation.
Allow me following in Japanese.
現在nzw0301さんのところでKeras2についての翻訳がだいぶ進んでいますが,未だに翻訳のガイドラインが定まっていないのは問題だと考えています.
このようなものは統一されていることが重要だと思うのでまずはガイドラインを作りましょう.
下記の内容でいかがでしょうか?
よろしければ「Guidlines.md」と「TranslationTable.md」でPRします.
他に追加すべき項目や修正・削除すべき箇所があればご指摘下さい.
- Guidlines.md
ガイドライン
- 翻訳対象は本文とコード中のコメントとする.
- 本文は敬体(です・ます調)とする.
- 句読点は「,.」を用いる.
- '',""は基本的にそのままとする.強調の意味で使用されている場合のみ「」に変換する.(bckend.md3行目)
- 記号「,.()?!:;」は全角とする.
- 文中のシンタックスハイライト(syntax highlight)の前後に空白は入れない.
- 用語の訳は対訳表に従う.
- Kerasの頭文字は大文字とする.
※ 翻訳は英語から日本語へのただの変換作業ではなく,英文の意味を読み取り,日本語として表現する創作作業です.
英語の言い回しに引きずられることなく自然な日本語を目指しましょう.
- TranslationTable.md
原則
- 構文キーワードなどはそのまま英語表記とする.
対訳表
English | 日本語 |
---|---|
Arguments | 引数 |
Data augumentation | データ拡張 |
layer | レイヤー |
loss function | 損失関数 |
Return | 戻り値 |
Recurrent | 再帰 |
shape | 形状 |
target | ターゲット |
testing | 検証 |
training | 学習 |
※ 見つけやすいようにアルファベット順で列挙しています.
必要に応じて追記してください.
Thank you for your comment.
I don't have enough time now, sorry for not discussion.
I think that README.md
contains this guildline for easier access to it.
I guess that it is unnecessary to translate some technical terms and python/numpy/keras unique terms into ja for searchability.
e.g. Recurrent
and shape
.
And 検証 means validation, not testing.
コメントありがとうございます.
ここしばらく時間がないので,すぐに議論ができないことお許し下さい.
これらのガイドラインを含めるとしたらアクセス性のためにREADME.md
に追記すべきだと思っています.
検索性のためにpython/numpy/keras特有の単語は翻訳する必要は無いと考えています.
例えば,Recurrent
やshape
です.
検証はvalidationの訳であり,testingとは別だと思いました.
アクセス性のためにREADME.mdに追記すべき
それではREADME.md
に追記する形にしましょう.
検索性のためにpython/numpy/keras特有の単語は翻訳する必要は無いと考えています.
これは良い考えだと思うので対訳表の前に明記します.
また,線引を明確にするため原語表記のものについても対訳表に追記します.
対訳表の変更分は下記のとおり.
English | 日本語 |
---|---|
recurrent | recurrent |
shape | shape |
testing | テスト |
問題があれば後で改めれば良いと思うので,ここまでの内容でkeras-2の方にPR上げておきます.