VideoReTalking: Audio-based Lip Synchronization for Talking Head Video Editing In the Wild-Reference-Cited by-同舟云学术

VideoReTalking: Audio-based Lip Synchronization for Talking Head Video Editing In the Wild

Published:2022-11-29 Issue: Volume: Page:
ISSN:
Container-title:SIGGRAPH Asia 2022 Conference Papers
language:
Short-container-title:

Author:

Cheng Kun¹,Cun Xiaodong²,Zhang Yong²,Xia Menghan²,Yin Fei³,Zhu Mingrui⁴,Wang Xuan²,Wang Jue²,Wang Nannan⁴

Affiliation:

1. Xidian University, China and Tencent AI Lab, China

2. Tencent AI Lab, China

3. Tsinghua University, China and Tencent AI Lab, China

4. Xidian University, China

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3550469.3555399

Reference59 articles.

1. Triantafyllos Afouras , Joon Son Chung , Andrew Senior , Oriol Vinyals , and Andrew Zisserman . 2018. Deep audio-visual speech recognition . IEEE transactions on pattern analysis and machine intelligence ( 2018 ). Triantafyllos Afouras, Joon Son Chung, Andrew Senior, Oriol Vinyals, and Andrew Zisserman. 2018. Deep audio-visual speech recognition. IEEE transactions on pattern analysis and machine intelligence (2018).

2. How Far are We from Solving the 2D & 3D Face Alignment Problem? (and a Dataset of 230,000 3D Facial Landmarks)

3. A multiresolution spline with application to image mosaics

4. Eric R. Chan Connor Z. Lin Matthew A. Chan Koki Nagano Boxiao Pan Shalini De Mello Orazio Gallo Leonidas Guibas Jonathan Tremblay Sameh Khamis Tero Karras and Gordon Wetzstein. 2021. Efficient Geometry-aware 3D Generative Adversarial Networks. In arXiv. Eric R. Chan Connor Z. Lin Matthew A. Chan Koki Nagano Boxiao Pan Shalini De Mello Orazio Gallo Leonidas Guibas Jonathan Tremblay Sameh Khamis Tero Karras and Gordon Wetzstein. 2021. Efficient Geometry-aware 3D Generative Adversarial Networks. In arXiv.

5. Hierarchical Cross-Modal Talking Face Generation With Dynamic Pixel-Wise Loss

Cited by 27 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. 3D facial modeling, animation, and rendering for digital humans: A survey;Neurocomputing;2024-09

2. Generating dynamic lip-syncing using target audio in a multimedia environment;Natural Language Processing Journal;2024-09

3. MILG: Realistic lip-sync video generation with audio-modulated image inpainting;Visual Informatics;2024-09

4. Video and Audio Deepfake Datasets and Open Issues in Deepfake Technology: Being Ahead of the Curve;Forensic Sciences;2024-07-13

5. Emotional Talking Face Generation with a Single Image;2024 21st International Conference on Ubiquitous Robots (UR);2024-06-24