Multi-task prompt tuning with soft context sharing for vision–language models-Reference-Cited by-同舟云学术

Multi-task prompt tuning with soft context sharing for vision–language models

Published:2024-10 Issue: Volume:603 Page:128290
ISSN:0925-2312
Container-title:Neurocomputing
language:en
Short-container-title:Neurocomputing

Author:

Ding Kun,Wang Ying,Liu Pengzhang,Yu Qiang,Zhang Haojian^ORCID,Xiang Shiming,Pan Chunhong

Funder

National Aerospace Science Foundation of China

Key Research and Development Program of Zhejiang Province

Chinese Academy of Sciences

National Natural Science Foundation of China

Publisher

Elsevier BV

Reference78 articles.

1. Chao Jia, Yinfei Yang, Ye Xia, Yi-Ting Chen, Zarana Parekh, Hieu Pham, Quoc V. Le, Yun-Hsuan Sung, Zhen Li, Tom Duerig, Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision, in: ICML, 2021, pp. 4904–4916.

2. Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, Gretchen Krueger, Ilya Sutskever, Learning Transferable Visual Models From Natural Language Supervision, in: ICML, 2021, pp. 8748–8763.

3. SLIP: self-supervision meets language-image pre-training, CoRR abs/2112.12750;Mu,2021

4. RS-CLIP: Zero shot remote sensing scene classification via contrastive vision-language supervision;Li;Int. J. Appl. Earth Obs. Geoinf.,2023

5. Learning to prompt for vision-language models;Zhou;IJCV,2022

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Compositional Kronecker Context Optimization for vision–language models;Neurocomputing;2024-12