VD-SAN: Visual-Densely Semantic Attention Network for Image Caption Generation-Reference-Cited by-同舟云学术

VD-SAN: Visual-Densely Semantic Attention Network for Image Caption Generation

Author:

He Xinwei,Yang Yang,Shi Baoguang,Bai Xiang^ORCID

Funder

National Natural Science Foundation of China

Publisher

Elsevier BV

Subject

Artificial Intelligence,Cognitive Neuroscience,Computer Science Applications

Reference26 articles.

1. Deep speech 2: End-to-end speech recognition in english and mandarin;Amodei,2016

3. Show, attend and tell: Neural image caption generation with visual attention.;Xu,2015

4. Deep captioning with multimodal recurrent neural networks (M-RNN);Mao,2015

5. Guiding the long-short term memory model for image caption generation;Jia,2015

Cited by 40 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. A Multi-Modal Feature Fusion-Based Approach for Chest X-Ray Report Generation;2024 11th International Conference on Wireless Networks and Mobile Communications (WINCOM);2024-07-23

2. Advancements in Computer Vision: A Comprehensive Review;2024 International Conference on Innovations and Challenges in Emerging Technologies (ICICET);2024-06-07

3. Visual Insight: Deep Multilayer Fusion with Inception-Based LSTM for Descriptive Image Captioning;2024 4th International Conference on Computer Communication and Artificial Intelligence (CCAI);2024-05-24