Wav2Seq: Pre-Training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages-Reference-Cited by-同舟云学术

Wav2Seq: Pre-Training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages

Published:2023-06-04 Issue: Volume: Page:
ISSN:
Container-title:ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
language:
Short-container-title:

Author:

Wu Felix¹,Kim Kwangyoun¹,Watanabe Shinji²,Han Kyu J.¹,McDonald Ryan¹,Weinberger Kilian Q.¹,Artzi Yoav¹

Affiliation:

1. ASAPP Inc.

2. Carnegie Mellon University

Publisher

IEEE

Link

Reference44 articles.

4. Scikit-learn: Machine learning in Python;pedregosa;JMLR,2011

5. Sequence transduction with recurrent neural networks;graves;ICML,2012

Cited by 11 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Deep learning for code generation: a survey;Science China Information Sciences;2024-08-20

2. Retrieval Augmented End-to-End Spoken Dialog Models;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14

3. Text-to-Speech and Speech-to-Text Models: A Systematic Examination of Diverse Approaches;2024 IEEE 9th International Conference for Convergence in Technology (I2CT);2024-04-05

4. Sequential2.0: Self-supervised Speech Translation Based on FAT Model and Replaced Token Detection;2024 4th International Conference on Neural Networks, Information and Communication (NNICE);2024-01-19