Evaluation of a Visual Question Answering Architecture for Pedestrian Attribute Recognition-Reference-Cited by-同舟云学术

Evaluation of a Visual Question Answering Architecture for Pedestrian Attribute Recognition

Published:2023 Issue: Volume: Page:13-22
ISSN:0302-9743
Container-title:Computer Analysis of Images and Patterns
language:
Short-container-title:

Author:

Castrillón-Santana Modesto^ORCID,Sánchez-Nielsen Elena^ORCID,Freire-Obregón David^ORCID,Santana Oliverio J.^ORCID,Hernández-Sosa Daniel^ORCID,Lorenzo-Navarro Javier^ORCID

Publisher

Springer Nature Switzerland

Link

https://link.springer.com/content/pdf/10.1007/978-3-031-44237-7_2

Reference15 articles.

1. Agrawal, A., et al.: VQA: visual question answering. Int. J. Comput. Vision 123, 4–31 (2015)

2. Barra, S., Bisogni, C., De Marsico, M., Ricciardi, S.: Visual question answering: which investigated applications? Pattern Recognit. Lett. 151, 325–331 (2021)

3. Brown, T.B., et al.: Language models are few-shot learners. Adv. Neural. Inf. Process. Syst. 33, 1877–1901 (2020)

4. Dosovitskiy, A., et al.: An image is worth 16x16 words: transformers for image recognition at scale. In: 9th International Conference on Learning Representations, ICLR 2021, Virtual Event, Austria, 3–7 May 2021. OpenReview.net (2021). https://openreview.net/forum?id=YicbFdNTTy

5. Freire-Obregón, D., De Marsico, M., Barra, P., Lorenzo-Navarro, J., Castrillón-Santana, M.: Zero-shot ear cross-dataset transfer for person recognition on mobile devices. Pattern Recogn. Lett. 166, 143–150 (2023)

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Visual Question Answering Models for Zero-Shot Pedestrian Attribute Recognition: A Comparative Study;SN Computer Science;2024-06-28