Trust Your Partner’s Friends: Hierarchical Cross-Modal Contrastive Pre-Training for Video-Text Retrieval-Reference-Cited by-同舟云学术

Trust Your Partner’s Friends: Hierarchical Cross-Modal Contrastive Pre-Training for Video-Text Retrieval

Published:2023-06-04 Issue: Volume: Page:
ISSN:
Container-title:ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
language:
Short-container-title:

Author:

Xiang Yuhan¹,Liu Kaijian²,Tang Shixiang³,Bai Lei³,Zhu Feng²,Zhao Rui²,Lin Xianming¹

Affiliation:

1. School of Infomatics, Xiamen University,Media Analytics and Computing Lab,Department of Artificial Intelligence,P.R. China,361005

2. SenseTime Group Limited

3. The University of Sydney

Funder

National Science Fund for Distinguished Young Scholars

National Natural Science Foundation of China

Publisher

IEEE

Link

Reference19 articles.

2. Support-set bottlenecks for video-text representation learning;patrick,2020

3. Imagenet: A large-scale hierarchical image database;deng;2009 IEEE Conference on Computer Vision and Pattern Recognition,2009

4. Deep residual learning for image recognition;he;Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016

Cited by 2 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Long Term Memory-Enhanced Via Causal Reasoning for Text-To-Video Retrieval;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

2. Cliprerank: An Extremely Simple Method For Improving Ad-Hoc Video Search;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14