Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis-Reference-Cited by-同舟云学术

Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis

Published:2022-06 Issue: Volume: Page:
ISSN:
Container-title:2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
language:
Short-container-title:

Author:

Yang Karren¹,Markovic Dejan²,Krenn Steven²,Agrawal Vasu²,Richard Alexander²

Affiliation:

1. MIT

2. Meta Reality Labs Research

Publisher

IEEE

Link

Reference70 articles.

1. The sound of pixels;zhao;Proceedings of the European Conference on Computer Vision (ECCV),0

2. Audio-visual scene analysis with self-supervised multisensory features;owens;Proceedings of the European Conference on Computer Vision (ECCV),0

3. Neural discrete representation learning;van den oord;ArXiv Preprint,2017

Cited by 17 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

3. Seeing Through The Conversation: Audio-Visual Speech Separation Based on Diffusion Model;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

4. AV2WAV: Diffusion-Based Re-Synthesis from Continuous Self-Supervised Features for Audio-Visual Speech Enhancement;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14