A multimodal fusion approach for image captioning-Reference-Cited by-同舟云学术

A multimodal fusion approach for image captioning

Published:2019-02 Issue: Volume:329 Page:476-485
ISSN:0925-2312
Container-title:Neurocomputing
language:en
Short-container-title:Neurocomputing

Author:

Zhao Dexin,Chang Zhi^ORCID,Guo Shutao^ORCID

Publisher

Elsevier BV

Subject

Artificial Intelligence,Cognitive Neuroscience,Computer Science Applications

Reference46 articles.

1. On the difficulty of training recurrent neural networks;Pascanu,2013

2. Automatic generation of natural language descriptions for images;Patrick;Coupling Approaches, Coupling Media and Coupling Languages for Information Retrieval,2004

3. Baby talk: understanding and generating simple image descriptions;Kulkarni,2011

4. Midge: generating image descriptions from computer vision detections;Mitchell,2012

5. Image description using visual dependency representations;Elliott,2013

Cited by 41 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Attribute-Driven Filtering: A new attributes predicting approach for fine-grained image captioning;Engineering Applications of Artificial Intelligence;2024-11

2. ICEAP: An advanced fine-grained image captioning network with enhanced attribute predictor;Displays;2024-09

3. Multimodal Guidance Network for Missing- Modality Inference in Content Moderation;2024 IEEE International Conference on Multimedia and Expo Workshops (ICMEW);2024-07-15

4. Deep Multimodal Data Fusion;ACM Computing Surveys;2024-04-24

5. Multilevel-based algorithm for hyperspectral image interpretation;Computers and Electrical Engineering;2024-01