Multimedia Cognition and Evaluation in Open Environments-Reference-Cited by-同舟云学术

Multimedia Cognition and Evaluation in Open Environments

Published:2023-10-29 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 1st International Workshop on Multimedia Content Generation and Evaluation: New Methods and Practice
language:
Short-container-title:

Author:

Feng Wei¹^ORCID,Li Haoyang¹^ORCID,Wang Xin²^ORCID,Duan Xuguang¹^ORCID,Qian Zi¹^ORCID,Liu Wu³^ORCID,Zhu Wenwu¹^ORCID

Affiliation:

1. Tsinghua University, Beijing, China

2. Tsinghua University, Beijng, China

3. JD Explore Academy, Beijing, China

Funder

Beijing Key Lab of Networked Multimedia

National Key Research and Development Program of China

National Natural Science Foundation of China

Beijing National Research Center For Information Science And Technology

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3607541.3616823

Reference60 articles.

1. Triantafyllos Afouras , Joon Son Chung , Andrew Senior, Oriol Vinyals, and Andrew Zisserman. 2018 . Deep audio-visual speech recognition. IEEE transactions on pattern analysis and machine intelligence, Vol. 44 , 12 (2018), 8717--8727. Triantafyllos Afouras, Joon Son Chung, Andrew Senior, Oriol Vinyals, and Andrew Zisserman. 2018. Deep audio-visual speech recognition. IEEE transactions on pattern analysis and machine intelligence, Vol. 44, 12 (2018), 8717--8727.

2. Invariance principle meets information bottleneck for out-of-distribution generalization;Ahuja Kartik;Advances in Neural Information Processing Systems,2021

3. Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

4. VQA: Visual Question Answering

5. Martin Arjovsky , Léon Bottou , Ishaan Gulrajani , and David Lopez-Paz . 2019. Invariant risk minimization. arXiv preprint arXiv:1907.02893 ( 2019 ). Martin Arjovsky, Léon Bottou, Ishaan Gulrajani, and David Lopez-Paz. 2019. Invariant risk minimization. arXiv preprint arXiv:1907.02893 (2019).