Enhancing Resilience to Missing Data in Audio-Text Emotion Recognition with Multi-Scale Chunk Regularization-Reference-Cited by-同舟云学术

Enhancing Resilience to Missing Data in Audio-Text Emotion Recognition with Multi-Scale Chunk Regularization

Published:2023-10-09 Issue: Volume: Page:
ISSN:
Container-title:INTERNATIONAL CONFERENCE ON MULTIMODAL INTERACTION
language:
Short-container-title:

Author:

Lin Wei-Cheng¹^ORCID,Goncalves Lucas¹^ORCID,Busso Carlos¹^ORCID

Affiliation:

1. Electrical and Computer Engineering, The University of Texas at Dallas, United States

Funder

National Science Foundation

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3577190.3614110

Reference68 articles.

1. A. Baevski Y. Zhou A. Mohamed and M. Auli. 2020. wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations. In Advances in Neural Information Processing Systems (NeurIPS 2020) Vol. 33. Virtual 12449–12460. A. Baevski Y. Zhou A. Mohamed and M. Auli. 2020. wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations. In Advances in Neural Information Processing Systems (NeurIPS 2020) Vol. 33. Virtual 12449–12460.

2. Multimodal Machine Learning: A Survey and Taxonomy

3. Increasing the Reliability of Crowdsourcing Evaluations Using Online Quality Assessment

4. C. Busso , Z. Deng , S. Yildirim , M. Bulut , C.M. Lee , A. Kazemzadeh , S. Lee , U. Neumann , and S. Narayanan . 2004. Analysis of Emotion Recognition using Facial Expressions , Speech and Multimodal Information. In Sixth International Conference on Multimodal Interfaces ICMI 2004 . ACM Press, State College, PA, 205–211. https://doi.org/10.1145/1027933.1027968 10.1145/1027933.1027968 C. Busso, Z. Deng, S. Yildirim, M. Bulut, C.M. Lee, A. Kazemzadeh, S. Lee, U. Neumann, and S. Narayanan. 2004. Analysis of Emotion Recognition using Facial Expressions, Speech and Multimodal Information. In Sixth International Conference on Multimodal Interfaces ICMI 2004. ACM Press, State College, PA, 205–211. https://doi.org/10.1145/1027933.1027968

5. C. Busso and S.S. Narayanan . 2006. Interplay between linguistic and affective goals in facial expression during emotional utterances. In 7th International Seminar on Speech Production (ISSP 2006 ). Ubatuba-SP, Brazil, 549–556. C. Busso and S.S. Narayanan. 2006. Interplay between linguistic and affective goals in facial expression during emotional utterances. In 7th International Seminar on Speech Production (ISSP 2006). Ubatuba-SP, Brazil, 549–556.