Improving Neural Network Efficiency via Post-training Quantization with Adaptive Floating-Point-Reference-Cited by-同舟云学术

Improving Neural Network Efficiency via Post-training Quantization with Adaptive Floating-Point

Published:2021-10 Issue: Volume: Page:
ISSN:
Container-title:2021 IEEE/CVF International Conference on Computer Vision (ICCV)
language:
Short-container-title:

Author:

Liu Fangxin¹,Zhao Wenbo¹,He Zhezhi¹,Wang Yanzhi²,Wang Zongwu¹,Dai Changzhi³,Liang Xiaoyao¹,Jiang Li¹

Affiliation:

1. Shanghai Jiao Tong University

2. Northeastern University

3. DeepBlue Technology (Shanghai) Co., Ltd.

Funder

National Natural Science Foundation of China

Publisher

IEEE

Link

http://xplorestaging.ieee.org/ielx7/9709627/9709628/09710763.pdf?arnumber=9710763

Reference35 articles.

1. Lq-nets: Learned quantization for highly accurate and compact deep neural networks;zhang;Proceedings of the European Conference on Computer Vision (ECCV),2018

2. A unified framework of dnn weight pruning and weight clustering/quantization using admm;ye,2018

3. Progressive dnn compression: A key to achieve ultra-high weight pruning and quantization rates using admm;ye,2019

4. Mixed precision quantization of convnets via differentiable neural architecture search;wu,2018

5. Incremental network quantization: Towards lossless cnns with low-precision weights;zhou;5th International Conference on Learning Representations (ICLR),2017

Cited by 32 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Characterizing Deep Learning Model Compression with Post-Training Quantization on Accelerated Edge Devices;2024 IEEE International Conference on Edge Computing and Communications (EDGE);2024-07-07

2. Efficient Approximate Floating-Point Multiplier With Runtime Reconfigurable Frequency and Precision;IEEE Transactions on Circuits and Systems II: Express Briefs;2024-07

3. SPARK: Scalable and Precision-Aware Acceleration of Neural Networks via Efficient Encoding;2024 IEEE International Symposium on High-Performance Computer Architecture (HPCA);2024-03-02

4. Resource constrained neural network training;Scientific Reports;2024-01-29

5. TSTC: Enabling Efficient Training via Structured Sparse Tensor Compilation;2024 29th Asia and South Pacific Design Automation Conference (ASP-DAC);2024-01-22