CVI-SZU/Linly Issues
问下大佬们有没有训练3B的打算?场景需要时延不能太高
Updated 1请问有没有性别年龄检测模型?
Updatedpretrain.py的示例似乎有点错误
Updated请问,deepspeed 微调时,CPU的内存需要多大?
Updated 1在线地址无法使用
Updated服务器最低配置要求是什么?
Updated有人有pile的数据集吗?22个来源,825G的那个版本
Updatedreadme上的加群二维码过期了
Updated关于平行语料的预处理
Updated 3关于Chinese-LLaMA-2-13B (hf格式)
Updated微信满员了,请重新上传新的微信图片 我可以免费做管理员
Closed 3多轮对话问问题之后直接报错
Updatedpython3 llama_server.py结果乱码
UpdatedChatFlow-13B.bin只有136字节
Updated 1关于33B模型预训练语料长度
Updated 2请问在指令微调时损失函数与预训练有什么区别吗
Updatedopen-llama13B做推理时,结果是英文
Updated关于openllama的两个相关问题
Updated 1falcon的使用中文预料进行增量训练
Updated 2readme上的加群二维码过期了
Updated 4额,是我用错了吗?简单推理都不行吗
Updated 1Multi machine pre-training hung
Updated 1请问有中文falcon的下载地址嘛
Updated 2Wrong argments
Updated请问是否有增量预训练的基础模型13B的评测结果?
Updated如何cite?
Updated 1HF在线崩溃了
Updated 17b模型性能和billa对比
Updated请问大佬65B的模型何时能够放出
Updated请问openllama 13b怎么转成HF格式
Updated博主群二维码过期了,可以更新一个新的二维码吗
Closed 1Is it possible to support OPT models
Updated 1openllama性能评估
Updated