OWL (Observe, Watch, Listen): Audiovisual Temporal Context for Localizing Actions in Egocentric Videos-Reference-Cited by-同舟云学术

OWL (Observe, Watch, Listen): Audiovisual Temporal Context for Localizing Actions in Egocentric Videos

Published:2023-06 Issue: Volume: Page:
ISSN:
Container-title:2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW)
language:
Short-container-title:

Author:

Ramazanova Merey¹,Escorcia Victor²,Heilbron Fabian Caba³,Zhao Chen¹,Ghanem Bernard¹

Affiliation:

1. King Abdullah University of Science and Technology

2. Samsung AI Centre Cambridge

3. Adobe Research

Funder

King Abdullah University of Science and Technology

Publisher

IEEE

Link

Reference53 articles.

3. Rescaling egocentric vision: Collection, pipeline and challenges for epic-kitchens-100;damen;International Journal of Computer Vision,2021

4. Scaling egocentric vision: The epic-kitchens dataset;damen;Proceedings of the European Conference on Computer Vision (ECCV),2018

Cited by 5 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

2. Audiovisual Masked Autoencoders;2023 IEEE/CVF International Conference on Computer Vision (ICCV);2023-10-01

3. Localizing Moments in Long Video Via Multimodal Guidance;2023 IEEE/CVF International Conference on Computer Vision (ICCV);2023-10-01

4. Learning to Identify Critical States for Reinforcement Learning from Videos;2023 IEEE/CVF International Conference on Computer Vision (ICCV);2023-10-01