RetrievalMMT: Retrieval-Constrained Multi-Modal Prompt Learning for Multi-Modal Machine Translation-Reference-Cited by-同舟云学术

RetrievalMMT: Retrieval-Constrained Multi-Modal Prompt Learning for Multi-Modal Machine Translation

Published:2024-05-30 Issue: Volume: Page:860-868
ISSN:
Container-title:Proceedings of the 2024 International Conference on Multimedia Retrieval
language:
Short-container-title:

Author:

Wang Yan¹^ORCID,Zeng Yawen²^ORCID,Liang Junjie¹^ORCID,Xing Xiaofen¹^ORCID,Xu Jin³^ORCID,Xu Xiangmin¹^ORCID

Affiliation:

1. South China University of Technology, Guangzhou, China

2. ByteDance AI Lab, Beijing, China

3. South China University of Technology & Pazhou Lab, Guangzhou, China

Funder

National Natural Science Foundation of China

Guangdong Provincial Key Laboratory of Human Digital Twin

National Key Research and Development Program of China

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3652583.3658018

Reference42 articles.

1. Jinze Bai Shuai Bai Shusheng Yang Shijie Wang Sinan Tan Peng Wang Junyang Lin Chang Zhou and Jingren Zhou. 2023 b. Qwen-VL: A Versatile Vision-Language Model for Understanding Localization Text Reading and Beyond. arxiv: 2308.12966 [cs.CV]

2. Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared D Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh, Daniel Ziegler, Jeffrey Wu, Clemens Winter, Chris Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, and Dario Amodei. 2020. Language Models are Few-Shot Learners. In NeurIPS. Curran Associates, Inc., 1877--1901.

3. Ozan Caglayan. 2019. Multimodal machine translation. Ph. D. Dissertation. Université du Maine.

4. Ozan Caglayan, Walid Aransa, Adrien Bardet, Mercedes Garc'ia-Mart'inez, Fethi Bougares, Lo"ic Barrault, Marc Masana, Luis Herranz, and Joost van de Weijer. 2017. LIUM-CVC Submissions for WMT17 Multimodal Translation Task. In Proceedings of the Second Conference on Machine Translation.

5. Iacer Calixto and Qun Liu. 2017. Incorporating Global Visual Features into Attention-based Neural Machine Translation.. In EMNLP. 992--1003.