Yuliang-Liu / Monkey

【CVPR 2024 Highlight】Monkey (LMM): Image Resolution and Text Label Are Important Things for Large Multi-modal Models

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

对中文的支持程度

xyfZzz opened this issue · comments

你好,我看到你们的训练数据好像都是英文的,模型对中文的支持能力是不是不太好?

是的,现在数据都是英文数据,因此在中文能力上受限。但是在我们的测试中,发现模型还是能读出图片中的中文内容,具有一定的跨语言的能力。

您好 请问这种情况怎么解决呢 想让模型回答是中文的

您好,目前我们的训练数据都是英文的。对中文描述的支持是通过翻译的api实现的。后续我们会加入中文数据进行优化。