DOSA: Differentiable Model-Based One-Loop Search for DNN Accelerators-Reference-Cited by-同舟云学术

DOSA: Differentiable Model-Based One-Loop Search for DNN Accelerators

Published:2023-10-28 Issue: Volume: Page:
ISSN:
Container-title:56th Annual IEEE/ACM International Symposium on Microarchitecture
language:
Short-container-title:

Author:

Hong Charles¹^ORCID,Huang Qijing²^ORCID,Dinh Grace¹^ORCID,Subedar Mahesh³^ORCID,Shao Yakun Sophia¹^ORCID

Affiliation:

1. UC Berkeley, United States of America

2. NVIDIA, United States of America

3. Intel Corporation, United States of America

Funder

NSF (National Science Foundation)

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3613424.3623797

Reference54 articles.

1. Martín Abadi , Paul Barham , Jianmin Chen , Z. Chen , Andy Davis , Jeffrey Dean , Matthieu Devin , Sanjay Ghemawat , Geoffrey Irving , Michael Isard , Manjunath Kudlur , Josh Levenberg , Rajat Monga , Sherry Moore , Derek Gordon Murray , Benoit Steiner , Paul A. Tucker , Vijay Vasudevan , Pete Warden , Martin Wicke , Yuan Yu , and Xiaoqiang Zhang . 2016 . TensorFlow: a system for Large-Scale machine learning . In USENIX Symposium on Operating Systems Design and Implementation (OSDI). Martín Abadi, Paul Barham, Jianmin Chen, Z. Chen, Andy Davis, Jeffrey Dean, Matthieu Devin, Sanjay Ghemawat, Geoffrey Irving, Michael Isard, Manjunath Kudlur, Josh Levenberg, Rajat Monga, Sherry Moore, Derek Gordon Murray, Benoit Steiner, Paul A. Tucker, Vijay Vasudevan, Pete Warden, Martin Wicke, Yuan Yu, and Xiaoqiang Zhang. 2016. TensorFlow: a system for Large-Scale machine learning. In USENIX Symposium on Operating Systems Design and Implementation (OSDI).

2. Amazon. 2018. AWS Inferentia: High Performance Machine Learning Inference Chip. https://aws.amazon.com/machine-learning/inferentia/. Amazon. 2018. AWS Inferentia: High Performance Machine Learning Inference Chip. https://aws.amazon.com/machine-learning/inferentia/.

3. Tianqi Chen , Mu Li , Yutian Li , Min Lin , Naiyan Wang , Minjie Wang , Tianjun Xiao , Bing Xu , Chiyuan Zhang , and Zheng Zhang . 2015 . Mxnet: A flexible and efficient machine learning library for heterogeneous distributed systems. arXiv preprint arXiv:1512.01274 (2015). Tianqi Chen, Mu Li, Yutian Li, Min Lin, Naiyan Wang, Minjie Wang, Tianjun Xiao, Bing Xu, Chiyuan Zhang, and Zheng Zhang. 2015. Mxnet: A flexible and efficient machine learning library for heterogeneous distributed systems. arXiv preprint arXiv:1512.01274 (2015).

4. Tianqi Chen , Thierry Moreau , Ziheng Jiang , Lianmin Zheng , Eddie Q. Yan , Haichen Shen , Meghan Cowan , Leyuan Wang , Yuwei Hu , Luis Ceze , Carlos Guestrin , and Arvind Krishnamurthy . 2018 . TVM: An automated end-to-end optimizing compiler for deep learning. In 13th USENIXSymposium on Operating Systems Design and Implementation ({ OSDI} 18). 578–594. Tianqi Chen, Thierry Moreau, Ziheng Jiang, Lianmin Zheng, Eddie Q. Yan, Haichen Shen, Meghan Cowan, Leyuan Wang, Yuwei Hu, Luis Ceze, Carlos Guestrin, and Arvind Krishnamurthy. 2018. TVM: An automated end-to-end optimizing compiler for deep learning. In 13th USENIXSymposium on Operating Systems Design and Implementation ({ OSDI} 18). 578–594.

5. Jacob Devlin , Ming-Wei Chang , Kenton Lee , and Kristina Toutanova . 2018 . BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv preprint arXiv:1810.04805 (2018). Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2018. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv preprint arXiv:1810.04805 (2018).

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Mind the Gap: Attainable Data Movement and Operational Intensity Bounds for Tensor Algorithms;2024 ACM/IEEE 51st Annual International Symposium on Computer Architecture (ISCA);2024-06-29