OmniVec: Learning robust representations with cross modal sharing-Reference-Cited by-同舟云学术

OmniVec: Learning robust representations with cross modal sharing

Published:2024-01-03 Issue: Volume: Page:
ISSN:
Container-title:2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)
language:
Short-container-title:

Author:

Srivastava Siddharth¹,Sharma Gaurav¹

Affiliation:

1. TensorTour Inc.

Publisher

IEEE

Link

http://xplorestaging.ieee.org/ielx7/10483279/10483282/10483855.pdf?arnumber=10483855

Reference105 articles.

1. Vatt: Transformers for multimodal self-supervised learning from raw video, audio and text;Akbari;Advances in Neural Information Processing Systems,2021

2. Objects that Sound

3. 3D Semantic Parsing of Large-Scale Indoor Spaces

4. ViViT: A Video Vision Transformer

5. Layer normalization;Ba,2016

Cited by 10 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. StochCA: A novel approach for exploiting pretrained models with cross-attention;Neural Networks;2024-12

2. Self-Supervised Learning and Binarization-based Image Retrieval Technology for Effective Forensic Footprint Analysis;The Journal of Korean Institute of Information Technology;2024-07-31

3. MMIS: Multimodal Dataset for Interior Scene Visual Generation and Recognition;2024 Intelligent Methods, Systems, and Applications (IMSA);2024-07-13

4. Deep Learning Innovations in Video Classification: A Survey on Techniques and Dataset Evaluations;Electronics;2024-07-11

5. The Effectiveness of Semi-Supervised Learning Techniques in Identifying Calcifications in X-ray Mammography and the Impact of Different Classification Probabilities;Applied Sciences;2024-07-09