WapaMario63 / GPTQ-for-LLaMa-ROCm

4 bits quantization of LLaMA using GPTQ, ported to HIP for use in AMD GPUs.

WapaMario63/GPTQ-for-LLaMa-ROCm Issues

Wheels for PyTorch 1.13.1 + ROCm 5.2 are available now
Updated a year ago
Add Support for OpenCL
Updated a year ago
Support for splitting over VRAM and CPU RAM
Closed a year ago2
LLMA models talking gibberish
Closed a year ago8