JL-er / rwkv_cuda

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

rwkv_cuda

rwkv并行推理,c++实现cuda算子。(初学)

终端输入下列代码,预编译cuda算子。预编译的cuda算子可向下兼容,直接打包可在不同机器上运行。(12.1 可兼容 11.8)特别注意cuda与torch版本需要一致

pip install ./cuda

编译成功 image 编译失败遇到下列错误,将setup.py 中的CppExtension 替换成CUDAExtension即可 image

直接使用test.py 进行测试 generate 可以直接实例测试,需要修改你的model路径

About


Languages

Language:Python 89.0%Language:Cuda 7.7%Language:C++ 3.3%