Titan-Reference-Cited by-同舟云学术

Titan

Published:2022-11-07 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 13th Symposium on Cloud Computing
language:
Short-container-title:

Author:

Gao Wei¹,Sun Peng²,Wen Yonggang¹,Zhang Tianwei¹

Affiliation:

1. Nanyang Technological University

2. SenseTime

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3542929.3563460

Reference44 articles.

1. wav2vec 2.0: A framework for self-supervised learning of speech representations;Baevski Alexei;Advances in Neural Information Processing Systems,2020

2. Zhihao Bai , Zhen Zhang , Yibo Zhu , and Xin Jin . 2020 . PipeSwitch: Fast Pipelined Context Switching for Deep Learning Applications. In 14th USENIX Symposium on Operating Systems Design and Implementation (OSDI '20) . Zhihao Bai, Zhen Zhang, Yibo Zhu, and Xin Jin. 2020. PipeSwitch: Fast Pipelined Context Switching for Deep Learning Applications. In 14th USENIX Symposium on Operating Systems Design and Implementation (OSDI '20).

3. Mandeep Baines Shruti Bhosale Vittorio Caggiano Naman Goyal Siddharth Goyal Myle Ott Benjamin Lefaudeux Vitaliy Liptchinsky Mike Rabbat Sam Sheiffer Anjali Sridhar and Min Xu. 2021. FairScale: A general purpose modular PyTorch library for high performance and large scale training. https://github.com/facebookresearch/fairscale. Mandeep Baines Shruti Bhosale Vittorio Caggiano Naman Goyal Siddharth Goyal Myle Ott Benjamin Lefaudeux Vitaliy Liptchinsky Mike Rabbat Sam Sheiffer Anjali Sridhar and Min Xu. 2021. FairScale: A general purpose modular PyTorch library for high performance and large scale training. https://github.com/facebookresearch/fairscale.

4. Edmon Begoli , Seung-Hwan Lim , and Sudarshan Srinivasan . 2021 . Performance Profile of Transformer Fine-Tuning in Multi-GPU Cloud Environments. In 2021 IEEE International Conference on Big Data (Big Data). IEEE, 3095--3100 . Edmon Begoli, Seung-Hwan Lim, and Sudarshan Srinivasan. 2021. Performance Profile of Transformer Fine-Tuning in Multi-GPU Cloud Environments. In 2021 IEEE International Conference on Big Data (Big Data). IEEE, 3095--3100.

5. Tom Brown , Benjamin Mann , Nick Ryder , Melanie Subbiah , Jared D Kaplan , Prafulla Dhariwal , Arvind Neelakantan , Pranav Shyam , Girish Sastry , Amanda Askell , Sandhini Agarwal , Ariel Herbert-Voss , Gretchen Krueger , Tom Henighan , Rewon Child , Aditya Ramesh , Daniel Ziegler , Jeffrey Wu , Clemens Winter , Chris Hesse , Mark Chen , Eric Sigler , Mateusz Litwin , Scott Gray , Benjamin Chess , Jack Clark , Christopher Berner , Sam McCandlish , Alec Radford , Ilya Sutskever , and Dario Amodei . 2020 . Language Models are Few-Shot Learners . In Advances in Neural Information Processing Systems (NeurIPS '20) . Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared D Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh, Daniel Ziegler, Jeffrey Wu, Clemens Winter, Chris Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, and Dario Amodei. 2020. Language Models are Few-Shot Learners. In Advances in Neural Information Processing Systems (NeurIPS '20).

Cited by 3 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Latency-Guaranteed Co-Location of Inference and Training for Reducing Data Center Expenses;2024 IEEE 44th International Conference on Distributed Computing Systems (ICDCS);2024-07-23

2. Ymir: A Scheduler for Foundation Model Fine-tuning Workloads in Datacenters;Proceedings of the 38th ACM International Conference on Supercomputing;2024-05-30

3. Deep Learning Workload Scheduling in GPU Datacenters: A Survey;ACM Computing Surveys;2024-01-22