Av-Sepformer: Cross-Attention Sepformer for Audio-Visual Target Speaker Extraction-Reference-Cited by-同舟云学术

Av-Sepformer: Cross-Attention Sepformer for Audio-Visual Target Speaker Extraction

Published:2023-06-04 Issue: Volume: Page:
ISSN:
Container-title:ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
language:
Short-container-title:

Author:

Lin Jiuxin¹,Cai Xinyu¹,Dinkel Heinrich²,Chen Jun¹,Yan Zhiyong²,Wang Yongqing²,Zhang Junbo²,Wu Zhiyong¹,Wang Yujun²,Meng Helen¹

Affiliation:

1. Tsinghua University,Shenzhen International Graduate School,Shenzhen,China

2. Xiaomi Inc,Beijing,China

Funder

National Natural Science Foundation of China

Publisher

IEEE

Link

Reference27 articles.

Cited by 7 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Audio-Visual Active Speaker Extraction for Sparsely Overlapped Multi-Talker Speech;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

2. SMMA-Net: An Audio Clue-Based Target Speaker Extraction Network with Spectrogram Matching and Mutual Attention;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

3. Voxblink: A Large Scale Speaker Verification Dataset on Camera;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14