Towards Realistic Visual Dubbing with Heterogeneous Sources-Reference-Cited by-同舟云学术

Towards Realistic Visual Dubbing with Heterogeneous Sources

Published:2021-10-17 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 29th ACM International Conference on Multimedia
language:
Short-container-title:

Author:

Xie Tianyi¹,Liao Liucheng²,Bi Cheng³,Tang Benlai³,Yin Xiang³,Yang Jianfei⁴,Wang Mingjie⁵,Yao Jiali³,Zhang Yang⁶,Ma Zejun⁶

Affiliation:

1. Shanghai Jiao Tong University, Shanghai, China

2. University of Electronic Science and Technology of China, Chengdu, China

3. ByteDance AI Lab, Shanghai, China

4. Nanyang Technological University, Singapore, Singapore

5. University of Guelph & Memorial University of Newfoundland, Guelph, ON, Canada

6. ByteDance AI Lab, Beijing, China

Publisher

ACM

Link

Reference34 articles.

Cited by 18 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

2. Lip-synchronized Talking Face Generation with Enhanced Mouth Movement;2024 5th International Conference on Computer Vision, Image and Deep Learning (CVIDL);2024-04-19

3. Text-Driven Talking Face Synthesis by Reprogramming Audio-Driven Models;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

4. DiffDub: Person-Generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-Encoder;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

5. Diff2Lip: Audio Conditioned Diffusion Models for Lip-Synchronization;2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV);2024-01-03