inference-speed

There are 0 repository under inference-speed topic.

fastT5
Ki6an / fastT5
⚡ boost inference speed of T5 models by 5x & reduce the model size by 3x.
python t5 onnx onnxruntime quantization fastt5 nlp fast quantized-onnx-models translation question-answering inference-speed pytorch inference deep-learning transformer
Language:Python 554
renebidart / text-classification-benchmark
Inference speed / accuracy tradeoff on text classification with transformer models such as BERT, RoBERTa, DeBERTa, SqueezeBERT, MobileBERT, Funnel Transformer, etc.
bert efficient-inference efficient-transfo fast-text-classification inference-speed text-classification transformer
Language:Jupyter Notebook 4
1023280072 / test_cpu_inference_speed
用于测试mmdetection模型的CPU推理速度
cpu inference-speed mmdetection
Language:Python 0

Ki6an / fastT5