DaViT: Dual Attention Vision Transformers-Reference-Cited by-同舟云学术

DaViT: Dual Attention Vision Transformers

Published:2022 Issue: Volume: Page:74-92
ISSN:0302-9743
Container-title:Lecture Notes in Computer Science
language:
Short-container-title:

Author:

Ding Mingyu,Xiao Bin,Codella Noel,Luo Ping,Wang Jingdong,Yuan Lu

Publisher

Springer Nature Switzerland

Link

https://link.springer.com/content/pdf/10.1007/978-3-031-20053-3_5

Reference78 articles.

1. Ali, A., et al.: XCiT: cross-covariance image transformers. In: NeurIPS, vol. 34 (2021)

2. Bello, I.: Lambdanetworks: modeling long-range interactions without attention. arXiv preprint arXiv:2102.08602 (2021)

3. Berman, M., Jégou, H., Vedaldi, A., Kokkinos, I., Douze, M.: Multigrain: a unified image embedding for classes and instances. arXiv preprint arXiv:1902.05509 (2019)

4. Brock, A., De, S., Smith, S.L., Simonyan, K.: High-performance large-scale image recognition without normalization. arXiv Computer Vision and Pattern Recognition (2021)

5. Chen, C.F., Fan, Q., Panda, R.: CrossViT: cross-attention multi-scale vision transformer for image classification. In: ICCV (2021)

Cited by 126 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. DMANet: Dual-modality alignment network for visible–infrared person re-identification;Pattern Recognition;2025-01

2. ScopeViT: Scale-Aware Vision Transformer;Pattern Recognition;2024-09

3. DDPM-SegFormer: Highly refined feature land use and land cover segmentation with a fused denoising diffusion probabilistic model and transformer;International Journal of Applied Earth Observation and Geoinformation;2024-09

4. HIRI-ViT: Scaling Vision Transformer With High Resolution Inputs;IEEE Transactions on Pattern Analysis and Machine Intelligence;2024-09

5. Feature fusion Vision Transformers using MLP-Mixer for enhanced deepfake detection;Neurocomputing;2024-09