biopolyhedron / middle-chinese-text-label

古代文本的中古漢語拼音(切韻音系)標註

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

请问多音字是怎么处理的?

laubonghaudoi opened this issue · comments

在标注唐诗三百首的时候,不可避免会遇到多音字,这时候是通过格律来去掉不符合韵律的字吗?如果遇到一些多音字,即使根据格律去除不合平仄的音后还是存在多个发音,则怎么处理?例如《终南山》的首联:

太乙近天都 連山接海隅

可以看到文件中被标注为:

Thad qit gionx Then-to, lien sren tauh haix ngyo.

其中的“近”字是多音字,既可以是上声也可以是去声,这时是靠什么确定标为上声的呢?

另外,大写字母和横杠又有什么意义呢?例如上句中的Thad 和Then-to。

感谢解答,也就是说三百首诗的标音全都是手工标注并查阅古籍验证,没有用到程序自动标音的吗?

明白了,感谢作者的辛勤付出