Position-aware image captioning with spatial relation-Reference-Cited by-同舟云学术

Position-aware image captioning with spatial relation

Published:2022-08 Issue: Volume:497 Page:28-38
ISSN:0925-2312
Container-title:Neurocomputing
language:en
Short-container-title:Neurocomputing

Author:

Duan Yiqun,Wang Zhen,Wang Jingya,Wang Yu-Kai,Lin Chin-Teng

Publisher

Elsevier BV

Subject

Artificial Intelligence,Cognitive Neuroscience,Computer Science Applications

Reference50 articles.

1. Anderson, P., Fernando, B., Johnson, M., Gould, S., 2016. SPICE: semantic propositional image caption evaluation, in: ECCV, pp. 382–398.

2. Anderson, P., He, X., Buehler, C., Teney, D., Johnson, M., Gould, S., Zhang, L., 2018. Bottom-up and top-down attention for image captioning and visual question answering, in: CVPR, pp. 6077–6086.

3. Chen, C., Mu, S., Xiao, W., Ye, Z., Wu, L., Ju, Q., 2019. Improving image captioning with conditional generative adversarial nets, in: AAAI, pp. 8142–8150.

4. Chung, J., Cho, K., Bengio, Y., 2014. Empirical evaluation of gated recurrent neural networks on sequence modeling. CoRR abs/1412.3555.

5. Devlin, J., Chang, M., Lee, K., Toutanova, K., 2019. BERT: pre-training of deep bidirectional transformers for language understanding, in: NAACL-HLT, pp. 4171–4186.

Cited by 8 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Cross-region feature fusion with geometrical relationship for OCR-based image captioning;Neurocomputing;2024-10

2. Self-supervised modal optimization transformer for image captioning;Neural Computing and Applications;2024-08-09

3. Show, tell and rectify: Boost image caption generation via an output rectifier;Neurocomputing;2024-06

4. Mask-guided network for image captioning;Pattern Recognition Letters;2023-09

5. Cross-domain multi-style merge for image captioning;Computer Vision and Image Understanding;2023-02