quantization-aware-training

There are 5 repositories under quantization-aware-training topic.

666DZY666 / micronet
micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape
quantization pruning dorefa twn bnn xnor-net pytorch model-compression group-convolution network-slimming neuromorphic-computing convolutional-networks network-in-network integer-arithmetic-only quantization-aware-training post-training-quantization tensorrt onnx tensorrt-int8-python batch-normalization-fuse
Language:Python 2212
intel / neural-compressor
SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime
auto-tuning awq fp4 gptq int4 int8 knowledge-distillation large-language-models low-precision mxformat post-training-quantization pruning quantization quantization-aware-training smoothquant sparsegpt sparsity
Language:Python 2179
openvinotoolkit / nncf
Neural Network Compression Framework for enhanced OpenVINO™ inference
quantization pruning sparsity quantization-aware-training mixed-precision-training compression semantic-segmentation object-detection classification nlp bert mmdetection transformers hawq pytorch tensorflow onnx openvino deep-learning
Language:Python 921
alibaba / TinyNeuralNetwork
TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.
deep-learning deep-neural-networks model-compression model-converter post-training-quantization pruning pytorch quantization-aware-training
Language:Python 738
SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone
YOLO ModelCompression MultidatasetTraining
mobilenetv3 modelcompression multidataset object-detection pruning quantization-aware-training yolo
Language:Python 444
megvii-research / Sparsebit
A model compression and acceleration toolbox based on pytorch.
deep-learning post-training-quantization pruning quantization quantization-aware-training sparse tensorrt
Language:Python 325
hls4ml-tutorial
fastmachinelearning / hls4ml-tutorial
Tutorial notebooks for hls4ml
fpga hls4ml machine-learning pruning quantization-aware-training tutorial
Language:Jupyter Notebook 292
Beomi / BitNet-Transformers
0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture
llm quantization quantization-aware-training transformers
Language:Python 264
THU-MIG / torch-model-compression
针对pytorch模型的自动化模型结构分析和修改工具集，包含自动分析模型结构的模型压缩算法库
pruning quantization-aware-training tensorrt-conversion tensorrt model-compression acnet reparameterization pytorch onnx quantization qat
Language:Python 236
sayakpaul / Adventures-in-TensorFlow-Lite
This repository contains notebooks that show the usage of TensorFlow Lite for quantizing deep neural networks.
inference model-optimization model-quantization on-device-ml post-training-quantization pruning quantization-aware-training tensorflow-2 tensorflow-lite tf-hub tf-lite-model
Language:Jupyter Notebook 170
clovaai / frostnet
FrostNet: Towards Quantization-Aware Network Architecture Search
classification computer-vision deep-learning int8-quantization network-architecture object-detection optimizers post-quantization pytorch quantization quantization-aware-training quantization-efficient-network semantic-segmentation style-transfer
Language:Python 106
openvinotoolkit / mmdetection
OpenVINO Training Extensions Object Detection
pytorch openvino onnx onnxruntime computer-vision deep-learning object-detection instance-segmentation ssd fcos atss retinanet faster-rcnn mask-rcnn cascade-rcnn nncf compression quantization-aware-training sparsity
Language:Python 93
hkproj / quantization-notes
Notes on quantization in neural networks
deep-learning neural-networks post-training-quantization pytorch quantization quantization-aware-training
Language:Jupyter Notebook 54
jahongir7174 / YOLOv8-qat
Quantization Aware Training
int8-inference int8-quantization object-detection python pytorch quantization-aware-training yolov8
Language:Python 54
mlzxy / qsparse
Train neural networks with joint quantization and pruning on both weights and activations using any pytorch modules
model-compression neural-network pruning pytorch quantization-aware-training
Language:Python 40
jeshraghian / QSNNs
Quantization-aware training with spiking neural networks
spiking neural networks snn backpropagation quantization quantization-aware-training deep-learning spiking-neural-networks neuroscience
Language:Python 35
yashbhalgat / QualcommAI-MicroNet-submission-MixNet
3rd place solution for NeurIPS 2019 MicroNet challenge
competition micronet-challenge mixnet model-compression model-pruning neurips-2019 quantization quantization-aware-training unstructured-pruning
Language:Python 35
DeadAt0m / LSQFakeQuantize-PyTorch
FakeQuantize with Learned Step Size(LSQ+) as Observer in PyTorch
fakequantize learned-step-size lsq pytorch qat quantization quantization-aware-training torchlsq
Language:C++ 32
bharathsudharsan / CNN_on_MCU
Code for paper 'Multi-Component Optimization and Efficient Deployment of Neural-Networks on Resource-Constrained IoT Hardware'
optimization quantization-aware-training quantization graph-optimization tflite tflite-conversion tinyml cmsis-nn efficient-inference edge-computing neuralnetworks c-code-generator
Language:Jupyter Notebook 24
HaoranREN / TensorFlow_Model_Quantization
A tutorial of model quantization using TensorFlow
model-quantization tensorflow tensorflow-lite inference-efficiency tflite machine-learning quantization-aware-training
Language:Python 12
Intelligent-Microsystems-Lab / SNNQuantPrune
Code for the ISCAS23 paper "The Hardware Impact of Quantization and Pruning for Weights in Spiking Neural Networks"
deep-learning machine-learning quantization quantization-aware-training snn sparsity spiking-neural-networks
Language:Python 10
rishivar / Resnet-18
Image classification done with Mindspore technology
mindspore cifar-10 resnet18 quantization-aware-training
Language:Python 9
HanByulKim / BASQ
BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks, ECCV 2022
eccv2022 neural-architecture-search pytorch quantization quantization-aware-training
Language:Python 7
LorenzoValente3 / Autoencoder-for-FPGA
Autoencoder model for FPGA implementation using hls4ml. Repository for Applied Electronics Project.
fpga deep-learning hls4ml autoencoder-classification autoencoder-mnist compression quantization-aware-training
Language:Jupyter Notebook 6
motokimura / pytorch_quantization_fx
An example to quantize MobileNetV2 trained on CIFAR-10 dataset with PyTorch FX graph mode quantization
cifar10 mobilenetv2 post-training-quantization pytorch pytorch-fx-graph-mode-quantization quantization quantization-aware-training
Language:Python 6
gulabpatel / Knowledge_Distillation
keras-neural-networks teacher-student-learning tf-quantization quantization quantization-aware-training tflite
Language:Jupyter Notebook 5
SangbumChoi / PyTorch_Quantization
all methods of pytorch quantization based on resnet50
pytorch-lightning quantization-aware-training pytorch-implementation cifar-10 resnet-50
Language:Python 4
satya15july / quantization
Model Quantization with Pytorch, Tensorflow & Larq
quantization binarization quantization-aware-training binarymodel-with-larq post-training-quantization
Language:C++ 4
yashbhalgat / QualcommAI-MicroNet-submission-EfficientNet
Submission name: QualcommAI-EfficientNet. MicroNet Challenge (NeurIPS 2019) submission - Qualcomm AI Research
competition efficientnet micronet-challenge mixnet model-compression model-pruning neurips-2019 pytorch quantization quantization-aware-training unstructured-pruning
Language:Python 4
yester31 / Quantization_EX
quantization example for pqt & qat
qat quantization-aware-training quantization tensorrt post-training-quantization ptq int8 model-optimization pytorch-quantization
Language:Python 4
etetteh / OoD_Gen-Chest_Xray
Multi-Domain Balanced Sampling Improves Out-of-Distribution Generalization of Chest X-ray Pathology Prediction Models
chest-xray-images chestx-ray8 medical-image-analysis medical-imaging mimic-cxr neurips-2021 nih-chest-x-ray padchest-dataset pathological-images quantization-aware-training torchxrayvision balanced-sampling computer-vision multilabel-classification out-of-distribution-generalization
Language:Python 3
LorenzoValente3 / JointVAE4AD
Disentangle joint continous and discrete representations for Anomaly Detection in High Energy Physics.
anomaly-detection joint-vae quantization-aware-training vae
Language:Jupyter Notebook 3
marekninja / master-thesis
One Bit at a Time: Impact of Quantisation on Neural Machine Translation
encoder-decoder nmt pytorch quantization quantization-aware-training seq2seq transformers transformer fully-quantized-transformer
Language:Jupyter Notebook 3
sefaburakokcu / finn-quantized-classification
Low-Precision Neural Networks for Classification on PYNQ with FINN
brevitas classification deep-learning finn neural-network pytorch quantization quantization-aware-training xilinx-zynq
Language:Python 2
yashmaniya0 / Quantization-of-Image-Classification-Models
Comprehensive study on the quantization of various CNN models, employing techniques such as Post-Training Quantization and Quantization Aware Training (QAT).
post-training-quantization quantization-aware-training
Language:Jupyter Notebook 2
yihong1120 / YOLOv8-qat
Quantization Aware Training
cnn pytorch quantization-aware-training yolov8 benchmarking coco-dataset computer-vision dataset-preparation deep-learning gpu-acceleration image-processing model-comparison model-evaluation model-weights object-detection performance-metrics training-and-testing pytorch-ecosystem transfer-learning deep-learning-frameworks
Language:Python 2

quantization-aware-training

666DZY666 / micronet

intel / neural-compressor

openvinotoolkit / nncf

alibaba / TinyNeuralNetwork

SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

megvii-research / Sparsebit

fastmachinelearning / hls4ml-tutorial

Beomi / BitNet-Transformers

THU-MIG / torch-model-compression

sayakpaul / Adventures-in-TensorFlow-Lite

clovaai / frostnet

openvinotoolkit / mmdetection

hkproj / quantization-notes

jahongir7174 / YOLOv8-qat

mlzxy / qsparse

jeshraghian / QSNNs

yashbhalgat / QualcommAI-MicroNet-submission-MixNet

DeadAt0m / LSQFakeQuantize-PyTorch

bharathsudharsan / CNN_on_MCU

HaoranREN / TensorFlow_Model_Quantization

Intelligent-Microsystems-Lab / SNNQuantPrune

rishivar / Resnet-18

HanByulKim / BASQ

LorenzoValente3 / Autoencoder-for-FPGA

motokimura / pytorch_quantization_fx

gulabpatel / Knowledge_Distillation

SangbumChoi / PyTorch_Quantization

satya15july / quantization

yashbhalgat / QualcommAI-MicroNet-submission-EfficientNet

yester31 / Quantization_EX

etetteh / OoD_Gen-Chest_Xray

LorenzoValente3 / JointVAE4AD

marekninja / master-thesis

sefaburakokcu / finn-quantized-classification

yashmaniya0 / Quantization-of-Image-Classification-Models

yihong1120 / YOLOv8-qat