关于多batch加速
middleknight opened this issue · comments
请问离线模型部署支持多batch加速么?
您好,目前版本并不支持batch推理,非常欢迎自行实现并提交您的PR~
MiniCPM-Llama3-V 2.5: A GPT-4V Level Multimodal LLM on Your Phone
middleknight opened this issue · comments
请问离线模型部署支持多batch加速么?
您好,目前版本并不支持batch推理,非常欢迎自行实现并提交您的PR~