YuchuanTian / DiJiang

[ICML'24 Oral] The official code of "DiJiang: Efficient Large Language Models through Compact Kernelization", a novel DCT-based linear attention mechanism.

https://arxiv.org/abs/2403.19928

YuchuanTian/DiJiang Issues

Provided code seems to have O(n x n x d) computational complexty. Why?
Updated 6 days ago6
一些问题
Updated 3 months ago3
Llama 7B?
Updated 4 months ago2
Long inputs cause overflow / underflow
Updated 4 months ago2
Wrong Configuration settings in python-2.8/1B
Closed 4 months ago1
Merge to huggingface/transformers
Updated 4 months ago