请问mnn-llm现在是否支持opencl后端？能否调用GPU？如果希望利用安卓设备的GPU进行推理需要做哪些更改？

Question

qtyandhasee opened this issue 7 months ago · comments

编译MNN主库时开启OpenCL（MNN_OPENCL=ON），但是测试时GPU并没有被调用（GPU利用率为0%）
在linux平台使用NDK编译，部署在安卓上

Nikhil Gupta · Answer 1 · Mon Mar 18 2024 22:52:04 GMT+0800 (China Standard Time)

Link libllm.so against libMNN_OpenCL.so and pass Opencl as backend config in llm.cpp

qtyandhasee · Answer 2 · Tue Mar 19 2024 09:51:23 GMT+0800 (China Standard Time)

Link libllm.so against libMNN_OpenCL.so and pass Opencl as backend config in llm.cpp

Thank you! This works for me

zhangtian · Answer 3 · Fri Mar 22 2024 16:07:16 GMT+0800 (China Standard Time)

@qtyandhasee 请问你跑的是多大规模的模型，我用opencl跑Qwen1.8b，报输入大小参数有问题，

qtyandhasee · Answer 4 · Fri Mar 22 2024 19:13:45 GMT+0800 (China Standard Time)

@qtyandhasee 请问你跑的是多大规模的模型，我用opencl跑Qwen1.8b，报输入大小参数有问题，

@tzhang2014 我跑qwen-1.8b模型基本可以正常运行，提问三四次后会出现CL报错，建议使用MNN最新的版本（2.8.3），qwen1.5-0.5b也可以运行，也会出现”慢慢的“报错，并且使用GPU的推理速度比使用CPU的慢多了，，，

yws · Answer 5 · Wed May 01 2024 08:55:41 GMT+0800 (China Standard Time)

现在gpu效果怎么样啊？可以跑了吗