Multi-Stage Audio-Visual Fusion for Dysarthric Speech Recognition With Pre-Trained Models-Reference-Cited by-同舟云学术

Multi-Stage Audio-Visual Fusion for Dysarthric Speech Recognition With Pre-Trained Models

Published:2023 Issue: Volume:31 Page:1912-1921
ISSN:1534-4320
Container-title:IEEE Transactions on Neural Systems and Rehabilitation Engineering
language:
Short-container-title:IEEE Trans. Neural Syst. Rehabil. Eng.

Author:

Yu Chongchong¹^ORCID,Su Xiaosu¹^ORCID,Qian Zhaopeng¹^ORCID

Affiliation:

1. School of Artificial Intelligence, Beijing Technology and Business University, Beijing, China

Funder

Humanity and Social Science Youth Foundation of Ministry of Education of China

Humanities and Social Sciences Research Planning Fund of the Ministry of Education of China

Publisher

Institute of Electrical and Electronics Engineers (IEEE)

Subject

Biomedical Engineering,General Neuroscience,Internal Medicine,Rehabilitation

Link

Reference43 articles.

2. Unsupervised learning of visual features by contrasting cluster assignments;caron;Proc Adv Neural Inf Process Syst,2020

4. Learning representations by maximizing mutual information across views;bachman;Proc Adv Neural Inf Process Syst,2019

Cited by 9 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Enhancing Pre-Trained ASR System Fine-Tuning for Dysarthric Speech Recognition Using Adversarial Data Augmentation;ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);2024-04-14