Self-Improving Teacher Cultivates Better Student: Distillation Calibration for Multimodal Large Language Models-Reference-Cited by-同舟云学术

Self-Improving Teacher Cultivates Better Student: Distillation Calibration for Multimodal Large Language Models

Published:2024-07-10 Issue: Volume:35 Page:882-892
ISSN:
Container-title:Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval
language:
Short-container-title:

Author:

Li Xinwei¹^ORCID,Lin Li¹^ORCID,Wang Shuai¹^ORCID,Qian Chen²^ORCID

Affiliation:

1. Southeast University, Nanjing, China

2. Tsinghua University, Beijing, China

Funder

Science and Technology In- novation 2030-Major Project

Natural Science Foundation of Jiangsu Province

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3626772.3657692

Reference52 articles.

1. Anas Awadalla Irena Gao Josh Gardner Jack Hessel Yusuf Hanafy Wanrong Zhu Kalyani Marathe Yonatan Bitton Samir Gadre Shiori Sagawa Jenia Jitsev Simon Kornblith PangWei Koh Gabriel Ilharco MitchellWortsman and Ludwig Schmidt. 2023. OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models. arXiv:2308.01390 [cs.CV]

2. Large Language Models for Recommendation: Progresses and Future Directions

3. Tim Brooks, Aleksander Holynski, and Alexei A. Efros. 2023. InstructPix2Pix: Learning To Follow Image Editing Instructions. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 18392--18402.

4. Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts

5. Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang, Joseph E. Gonzalez, Ion Stoica, and Eric P. Xing. 2023. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality. https://lmsys.org/blog/2023-03--30-vicuna/